Большинство ИИ-моделей не выдерживает долгосрочной работы с кодом

Нейросети еще не в состоянии заменить живых айтишников: таков вывод исследования, проведенного Alibaba Group и университетом Сунь Ятсена в Гуанчжоу.
Они тестировали агентов ИИ на 100 реальных кодовых базах, которые поддерживались на протяжении 233 дней.
Нейросетям нужно было не просто выполнить одноразовое задание, как это обычно проверяется, а обеспечивать долгосрочную эволюцию кодовой базы, добавляя новые функции без нарушения работы старых.
И с этой задачей 75% нейросетей не справились. Как оказалось, модели накапливают технические проблемы, пишут «хрупкий» код и жертвуют его качеством ради быстрых результатов.
Страница для печати
