Claude Opus 4.5 назвали лучшим ИИ для веб-разработки

LMArena обновил свой рейтинг, включив в него рассуждающую и "быструю" версии Claude Opus. Модели стали лидерами в WebDev Arena, а вот в Text Arena заняли только третье и шестое места, при этом рассуждающая версия показала себя хуже, чем быстрая. Отдельно отмечено первое место в категории Expert Leaderboard - в нее попадают максимально сложные вопросы, на которых оценивают глубину знаний модели.

Напомню, что LMArena оценивает модели в слепом голосовании: пользователь вводит запрос, видит два анонимных ответа, выбирает лучший - и ему раскрывается, какая модель победила.

Claude Opus 4.5 назвали лучшим ИИ для веб-разработки

В WebDev Arena рассуждающая и быстрая версии Claude Opus 4.5 набрали 1493 и 1479 очков соответственно, а третье место заняла Gemini 3 Pro с 1473 очками.

На Text Arena, где оценивается ответы моделей в повседневных ситуациях (ответы на вопросы, перевод, следование инструкциям), Claude Opus 4.5 пропустил вперед Gemini 3 Pro и Grok 4.1 Thinking. При этом важно отметить, что рассуждающая версия пришла лишь шестой - это показывает особенность архитектуры Claude Opus 4.5, где режим рассуждений может ухудшать работу в простых ситуациях. При этом быстрая модель пришла первой в таких подкатегориях, как математика, программирование, следование инструкциям и работа с длинными промптами.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.



Внимание!

Официальный сайт бота по ссылке ниже.

Официальный сайт