Подписаться
Опубликовано

AI и скорость разработки кода: разбор исследования

Автор
  • Имя
    Коля Якубовский. Испания, Хихон
    Telegram
Разрабы, которые кодят с AI, кодят медленнее на 20%, а думают что на 20% быстрее

Недавно мой пузырь облетело исследование, которые процитировали уважение мною спикеры (кирилик, Самат) с выводами из заголовка. Ещё друзья в личку закинули, и в чатике вастрика. Многие цитировавшие сильно опытнее меня в разработке, но прочитав исследования у меня появилось много вопросов к его применимости.

Спойлер

Для меня несколько странно как все быстро в него поверили. Поэтому считаю важным разобрать.

Чтож, какие у нас есть факты: 1️⃣ 16 разработчиков, 246 реальных задач (≈ 15 задач на человека) — средняя длительность 2ч. Пару аномальных участника сместят результат, да и в целом мало, хотя такое может быть стат. значимо

2️⃣ Работали над специфичными репозиториями. Средний опыт с репозиторием 5 лет, ≈ 1 500 коммитов. Такой "Опыт" повышает скорость "ручной" работы.

3️⃣ Модели: Cursor Pro + Claude 3.5/3.7 Sonnet, февраль–июнь 2025. Это слабые, старые модели, Claude 4 уже на порядок мощнее и точнее. Старый Cursor так же плох по многим причинам.

4️⃣ 93 % ранее пользовались LLM, но только 44 % — Cursor. Вот это очень плохо. Утверждаю как активный юзер. Много специфики работы: промтирование, контекст, "навесы", особенности моделей в разные периоды, разные модели под разные задачи итд.

5️⃣ 44 % AI-генераций приняты. Вопрос "почему?", помимо причин выше, допускаю что "опытные разрабы" чаще хотят писать код как они привыкли, а не как хочет LLM, пусть даже он был бы корректным. Ну и просто, 3.5-3.7 слабы, тем более на больших контекстах.

Больше всего понравились выводы авторов
Результаты не означают, что AI бесполезен повсюду; на зелёных проектах, в незнакомом коде или с более свежими моделями быстрый выигрыш вполне возможен
Другими словами, из исследования нет вывода из заголовка что все зарепостили.

Статье пол года, а оно уже на помойке истории как устаревшее. В этом году модели для кодинга каждые 3 месяца совершают ощутимый прорыв. Поэтому не очень понимаю нафига вообще это исследование и почему все его постят, обсуждают.

Корректен и применим только вывод об искажениях людей. Понимаю что и у меня их достаточно, и спасибо когда замечаете это. Если у вас есть какие иные данные, мысли, выводы - пишите, может я что не так понял.

Коля Якубовский. Испания, Хихон
431 подписчик
406 постов

Закрепленные

Из подборки #исследования

Опубликовано

Почему тени притягиваются рядом?

Почему тени притягиваются рядом? Объяснение в геометрической оптике
Опубликовано

Общение с чатиками и нейросетями: забавные кейсы

Сравнение общения с нейросетями и людьми, различия в адаптации и стиле коммуникации
Опубликовано

Съездил в гости к любимым Юле и Сереже в...

Бильбао vs Хихон: цены, язык, серфинг и путешествия
Опубликовано

Городок в Испании, похожий на Англию

Городок в Испании, похожий на Англию с насыщенной зеленью
Опубликовано

Как найти прекрасное вокруг? Философское размышление

Как найти прекрасное в окружающем мире? Размышления о красоте и смысле жизни

Свежие посты

Опубликовано

Armenian (system of a down)

Концерт Armenian (System of a Down) в Хихоне: слэм, мощный вокал, Саша Веселов и Серёжа Пешков