Claude Opus 4.7 критика

Claude Opus 4.7 вызвал волну критики из-за ошибок и роста стоимости

Anthropic выпустила новую модель Claude Opus 4.7, однако релиз столкнулся с массовым недовольством пользователей: модель критикуют за ошибки, «агрессивное» поведение и резкий рост потребления токенов.

Главным нововведением стала функция adaptive reasoning — механизм, позволяющий модели самостоятельно выбирать, когда тратить больше времени на «размышление». Однако именно это, по мнению части пользователей, привело к нестабильной работе.

После запуска в соцсетях начали появляться жалобы на снижение качества. Среди примеров — неверный ответ о количестве букв «p» в слове strawberry, признание моделью «лени» при проверке данных и искажение пользовательских резюме с добавлением несуществующих деталей.

Критика быстро набрала популярность: один пост на Reddit с утверждением о «регрессе, а не апгрейде» получил более 2 300 апвоутов, а аналогичное мнение в X — около 14 000 лайков. Пользователи также отмечают «combative» стиль общения, отказ выполнять простые запросы и избыточные ограничения безопасности.

Дополнительное раздражение вызвала стоимость. Из-за нового токенизатора Opus 4.7 требует примерно в 1,0–1,35 раза больше токенов на тот же запрос. В GitHub Copilot модель временно оценивалась до 7,5 раза дороже, а подписчики Claude Pro сообщали, что достигают лимита уже после примерно трёх запросов.

Anthropic признала наличие проблем и заявила, что работает над улучшениями. Компания также увеличила лимиты для пользователей, чтобы компенсировать рост затрат.

При этом часть аудитории поддержала релиз. Генеральный директор Y Combinator Гарри Тан отметил, что активно использует модель, а исследователь Джереми Ховард назвал её первой, которая «по-настоящему понимает задачу». Anthropic, в свою очередь, утверждает, что Opus 4.7 показывает заметный прогресс в сложных задачах программирования.

Ситуация стала редким случаем негативной реакции на продукт, ранее считавшийся одним из лидеров рынка. На фоне успеха предыдущих инструментов и популярности Claude, включая рост популярности приложения и улучшение имиджа компании, текущий релиз показал, насколько чувствителен рынок к балансу между качеством, стоимостью и пользовательским опытом.

Источник: Business Insider

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x