Anthropic и OpenAI продолжают сражаться за нас. Продолжайте, нам нравится
Компании выпустили новинки с разницей в несколько минут - Claude Opus 4.6 и GPT-5.3-Codex. Сейчас расскажу про Opus (он все же был первый, аж на несколько минут раньше вышел).
Главная фишка - это контекст 1M токенов. Влезет весь "Мастер и Маргарита" или крупный проект с твоей работы. Модель в тестах MRCR v2 набирает 76% на поиск информации в миллионе токенов – против 18,5% у Sonnet 4.5. Для сравнения: Gemini 3 Pro на такой дистанции скатывается до 26%, хотя у него тоже 1M в спеке.
Бенчмарки: Terminal Bench 2.0 – 65,4% (агентское кодирование в терминале), GDPval-AA – 1606 Elo против 1462 у GPT-5.2 (+144 пункта, то есть примерно 70% побед). Это тесты на "офисную работу": юридические записки, финмодели, презентации. Humanity's Last Exam – 53,1% с инструментами, ARC-AGI 2 – 68,8% (человеческий уровень абстрактного мышления). Впечатляет, но есть нюанс, в SWE-bench verified модель осталась на уровне 4.5, а это важный кодинговый бенчмарк.
Что говорят пользователи: в первые часы после релиза на Reddit полно постов в духе: "Opus 4.6 пережил лоботомию" и "Opus 4.6 раздражает". Люди жалуются, что модель стала заметно хуже писать тексты и документацию, при этом кодить научилась лучше. Вот вам и классический трейдоф: для кода бери 4.6, для текстов оставайся на 4.5. Сам пока не заметил такого, но народ врать не будет.
В Claude Code запустили agent teams (бета) – система разворачивает несколько копий Opus, которые работают параллельно: один занимается фронтендом, другой бэком, третий планирует ваш стартап мечты.
Получается, что Opus 4.6 очень хорошо прокачали для агентских задач и длинного контекста, но если вам нужен универсальный помощник, который и код напишет, и статью, то пока это скорее два разных инструмента, тут мы еще не имеем чего-то универсального (придется еще чуть напрягать мозги, чтобы помнить, куда и что писать).
P.S. Интересная деталь: OpenAI впервые выпустила агентскую модель (GPT-5.3-Codex) раньше обычной GPT-5.3. Похоже, обе компании делают ставку на то, что будущее – это агенты (а то мы не знали), а не чат-ботами.
Надеюсь тебе понравилось. Лучшая благодарность - это твоя подписка на мой Telegram-канал ?