Alibaba протестировала ИИ-агентов для программирования на 100 реальных кодовых базах, каждая из которых охватывала 233 дня разработки. Результат - полный провал ИИ в программировании.
Выяснилось, что один раз сгенерировать код и пройти тесты — не так уж сложно. А вот поддерживать код в течение 8 месяцев и при этом не ломать всё подряд — именно здесь ИИ с огромным треском проваливает задачу хуже джуна.
SWE-CI — это первый бенчмарк, который измеряет долгосрочную поддержку кода, а не разовые исправления багов. В каждой задаче рассматривается 71 последовательный коммит, то есть реальная эволюция проекта во времени.
Для всех ИИ-сектантов, распространяющих крики «ИИ скоро заменит программистов», это очень плохой знак. Так что для всех, кто уже хоронил профессию программиста и рассказывал про «осталось пару лет», новости так себе. Похоже, между «умеет написать еле работающий прототип» и «умеет быть нормальным инженером и поддерживать кодовую базу проекта» по-прежнему огромная пропасть.
https://x.com/alex_prompter/status/2030331477918126286
Ты в каждом треде будешь срать этой хуйней, шиз? Кричи еще громче, о том как анальники тольковыиграле.
Терпи, ии говно соевое
ты идёшь на хуй по причине конченный доолбоеб.
ваши стетейки в анус себе запихните и идите бляди решать свои алгоримы. не лезьте в четверную промышленную революцию своими костлявыми пальцами.
только кончь последняя будет отрицать, что ИИ работает.
для этого достаточно оплатить 20 баксов и подключить проксю или впн и лично убедиться.
но у вас тупоголовых блядей и это не получается, ещё айтишниками зовётесь.
>именно здесь ИИ с огромным треском проваливает задачу хуже джуна
это просто ебаный пиздежь. почему у меня ИИ пишет хороший код, а в ублюдских статеечка х - нет?
>А вот поддерживать код в течение 8 месяцев
ты код среднестатистического кожаного мешка не сможешь поддерживать и через месяц, не говоря уже про 8 месяцев или несколько лет. промышленный код, написанный людьми априори дармовый. исключения - всякие библиотеки, где код вылило сообщество. в типовых проектах код ВЕЗДЕ одинаково дерьмовый.
>скоро
Хуя какой мощный подрыв ии-сектанта кек. Видимо за живое задело :)
Иди знакомься с научными исследованиями https://arxiv.org/abs/2603.03823
Где ты, а где ученые?
>ты код среднестатистического кожаного мешка не сможешь поддерживать и через месяц
Вот это самопроекции неосилятора. Сколько лично ТЫ написал проектов, поддерживаемых более нескольких месяцев с помощью ИИ?
>это просто ебаный пиздежь. почему у меня ИИ пишет хороший код, а в ублюдских статеечка х - нет?
Потому что ты не пробовал поддерживать его на протяжении несколькиз месяцев или даже года. Это минимальное требование любого продакш-реди кода даже в нищей ИТ-галере под Самарой. Но выходит что даже уровень нищей самарской ИТ-галеры - недосягаемых для 100% нейронок мира кек.
LLM-агент порвался, давайте новый.
>Сколько лично ТЫ написал проектов, поддерживаемых более нескольких месяцев с помощью ИИ?
Два проекта успешно сопровождаются с помощью Claude Code
>Иди знакомься с научными исследованиями
Зачем мне с ними знакомиться? Что бы что? Что бы потом писать на борде для дитишек визги про ИИ? Где ты, чмо ебучее, и где корпорации, которые нанимают лучших ученых и инженеров для работы в этой сфере?
>Зачем мне с ними знакомиться? Что бы что?
Чтобы не быть ИИ-промыткой, коей ты сейчас и являешься
>Два проекта успешно сопровождаются с помощью Claude Code
Сопровождаются, а не написаны с нуля ИИ как было написано в ОП-посте.
Расскажи подробнее про свои сопровождаемые проекты. Кодовая база? Количество программистов в команде?
>Чтобы не быть ИИ-промыткой, коей ты сейчас и являешься
я ещё раз вопрос задам: где ты, пидоран, и где люди, которые работают в ТОП корпорациях, которые пилят сейчас всю ИИ-движуху?
Ты пидоран мне какие-то статеечки кидаешь, хотя вангую, работаешь на каком-нибудь всратом проекте макакой на впопулярном попсовом стеке для обезьян и что-то тут пытаешься мне обосновывать статеечками, в которых сам нихуя не понимаешь.
>>661244
>Сопровождаются, а не написаны с нуля ИИ как было написано в ОП-посте
Там ничего не написано про "с нуля". Там автор написал только то, что хочет видеть.
> Результат - полный провал ИИ в программировании
О каком провале вы пидоры тут вещаете, если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу?
>которые работают в ТОП корпорациях
Что-то уровня эпохи доткомов кек. В итоге 90% этих манякорпораций успешно пукнули хрюкнули
>О каком провале вы пидоры тут вещаете, если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу?
Верю! Верю, как же тут рандомнмоу пидоранчику с дипломом мухгу из под засратова не поверить!
>если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу
В то что твоя ИИ-слоп машина успешно пишет тонны говнослопа я как раз верю и верю что пишет она его успешно. Но вот в дальнейшнюю maintability сего поделия черег годик-полтора конечно поверить весьма проблематично. Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
>если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу
В то что твоя ИИ-слоп машина успешно пишет тонны говнослопа я как раз верю и верю что пишет она его успешно. Но вот в дальнейшнюю maintability сего поделия черег годик-полтора конечно поверить весьма проблематично. Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
>Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
Я пишу код 15 лет. Ты правда думаешь что я не способен оценить качество ИИ генерации, насколько этот код плох?
>>661270
>Верю! Верю, как же тут рандомнмоу пидоранчику с дипломом мухгу из под засратова не поверить!
Ну как я и говорил - ты даже не пробовал ИИ, а усираешься тут, клоун ты ебаный, долбоеб потешный.
У тебя случайно не пхп проект?
страшн за такое говнобудущее
> Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
Не дадут им разбирать. На раззявленный по результатам роток CEO менеджерье поменьше будет брать проектных петушков "чиста маленькую праблему паправить и все, тут уже норм праграмист написал прадукт". Слоп же не отличить визуально с первого взгляда, без достаточно трудоемкого разбора.
Это по тем проблемам, которые вообще найдут. 95% слопа уйдет естественно в корзину вместе с ИИ-ферст организациями, но на их место встанут новые. Деньги кабанью халявные дадут на это - государства, спонсороинвесторы, копрономика на это два столетия точилась.
Это то о чем умные люди говорили с момента появления агентов. Программирование не сводится к набиванию тысяч строк кода, программисты как были нужны так и останутся.
ИИ прекрасно работает же, как замена IDE. Только не заменяет человека который этим рулит и решает что надо сделать.
Платить за это будешь ты
Вобще сученые в говне моченые, они (многие) в проганье особо и не могут. Пишут индусскую лапше хуйню в основном. Задрочили олимпиадные задачки и учат этому мимокроков. Чувак сам придумал тесты, сам прогнал бесплатного агента который у него запустился на плате что была под рукой. Своял статью и все.
Ну и отлично, теперь у Anthropic и OpenAI появилась новая метрика качества, которую будут использовать для обучения следующих моделей.
Вот увидишь, через полгода они прекрасно и такие задачи будут решать. В 2023-ем тоже многие ржали и говорили, что нейронка ничего не умеет. А в итоге нейронки сэволюционировали и теперь ржут нал нами. Каждый раз, когда ты указываешь на проблемы нейронок, ты буквально вбрасываешь в медиапространство готовые инструкции по их улучшению.
в статье рассматриваются нейронки двухлетней давности, причем далеко не топовые. всякие квены, дипсики и прочий китайский хлам. среди топов клод и он нормальные результаты показал. и это, повторю, на данных двухлетеней давности. (стстья вышла в марте. там наблюдение 220 + 70 дней + обработка, плюс написание статьи, плюс апрув - это еще минимум полгода)
>Вобще сученые в говне моченые, они (многие) в проганье особо и не могут. Пишут индусскую лапше хуйню в основном.
в общем да, 99,99% статей в рубрике ML - это литералли британские ученые в китайской обертке. генерируют слоп чтобы KPI в алибабе выгрести и премию получить.