Anthropic выпустила новую модель Claude Opus 4.7, однако релиз столкнулся с массовым недовольством пользователей: модель критикуют за ошибки, «агрессивное» поведение и резкий рост потребления токенов.
Главным нововведением стала функция adaptive reasoning — механизм, позволяющий модели самостоятельно выбирать, когда тратить больше времени на «размышление». Однако именно это, по мнению части пользователей, привело к нестабильной работе.
После запуска в соцсетях начали появляться жалобы на снижение качества. Среди примеров — неверный ответ о количестве букв «p» в слове strawberry, признание моделью «лени» при проверке данных и искажение пользовательских резюме с добавлением несуществующих деталей.
Критика быстро набрала популярность: один пост на Reddit с утверждением о «регрессе, а не апгрейде» получил более 2 300 апвоутов, а аналогичное мнение в X — около 14 000 лайков. Пользователи также отмечают «combative» стиль общения, отказ выполнять простые запросы и избыточные ограничения безопасности.
Дополнительное раздражение вызвала стоимость. Из-за нового токенизатора Opus 4.7 требует примерно в 1,0–1,35 раза больше токенов на тот же запрос. В GitHub Copilot модель временно оценивалась до 7,5 раза дороже, а подписчики Claude Pro сообщали, что достигают лимита уже после примерно трёх запросов.
Anthropic признала наличие проблем и заявила, что работает над улучшениями. Компания также увеличила лимиты для пользователей, чтобы компенсировать рост затрат.
При этом часть аудитории поддержала релиз. Генеральный директор Y Combinator Гарри Тан отметил, что активно использует модель, а исследователь Джереми Ховард назвал её первой, которая «по-настоящему понимает задачу». Anthropic, в свою очередь, утверждает, что Opus 4.7 показывает заметный прогресс в сложных задачах программирования.
Ситуация стала редким случаем негативной реакции на продукт, ранее считавшийся одним из лидеров рынка. На фоне успеха предыдущих инструментов и популярности Claude, включая рост популярности приложения и улучшение имиджа компании, текущий релиз показал, насколько чувствителен рынок к балансу между качеством, стоимостью и пользовательским опытом.
Источник: Business Insider




