Anthropic: ИИ создающий ИИ может выйти из-под контроля человека

Anthropic: ИИ создающий ИИ может выйти из-под контроля человека

Создатель Claude уже начал предупреждать о рисках.
Фото аватара
Редакция The GEEK сегодня в 18:40
Anthropic: ИИ создающий ИИ может выйти из-под контроля человека

Компания Anthropic, создатель ИИ-ассистента Claude, опубликовала материал «Когда ИИ строит сам себя» (When AI builds itself). Главный тезис прямой: ИИ уже ускоряет разработку самого ИИ. Это возможный путь к рекурсивному самоулучшению, когда система автономно проектирует и обучает более способного преемника.

До этой точки пока далеко, и неизбежной её в компании не называют. Но предупреждают, что случиться это может раньше, чем к нему готовы большинство институтов.

anthropic-thegeek

В публикации говорится, что в мае 2026 года больше 80% кода в кодовой базе Anthropic пишет Claude. До запуска Claude Code в феврале 2025-го показатель измерялся единицами процентов. Отсюда и продуктивность: во втором квартале 2026 года средний инженер вливает в продакшен в восемь раз больше кода в день, чем в 2024-м. Человек теперь направляет и проверяет, а не печатает. Проще говоря, человек начинает выступать оператором данных.

Ускоряется и сам ИИ. По данным METR, длина задач, которые модели надёжно тянут сами, удваивается примерно раз в четыре месяца. В марте 2024-го Claude справлялся с задачами на четыре минуты человеческой работы, через год на полтора часа, ещё через год на двенадцать.

anthropic--thegeek

В тесте на оптимизацию обучающего кода Claude за год прошёл путь от трёхкратного ускорения до 52-кратного. А в апреле 2026-го ИИ-агенты Anthropic впервые провели открытое исследование от начала до конца: за 800 часов работы они отыграли 97% разрыва там, где двое людей за неделю осилили около 23%.

Где человек пока незаменим, так это во «вкусе» и суждении: выбор задач, оценка результатов, понимание, когда подход зашёл в тупик. Именно этот разрыв отделяет нынешний ИИ от системы, способной спроектировать собственного преемника.

Риски Anthropic никак не прячет. Полное рекурсивное самоулучшение сулит огромную пользу науке и медицине, но повышает и опасность потери контроля над ИИ. В компании заявляют, что считали бы благом саму возможность замедлить или приостановить гонку, но только при проверяемой координации ведущих лабораторий из разных стран. В ближайшие месяцы Anthropic обещает собрать на эту тему дискуссии с регуляторами, исследователями и другими ИИ-компаниями.

Ранее стало известно, как мужчина поверил в отношения с нейросетью и потерял связь с реальностью.