2025-й войдёт в историю как год, когда AI перестал «отвечать» и начал «делать». Модели научились рассуждать по бюджету, агенты захватили браузеры и терминалы, а видео и голос превратились из демок в часть инфраструктуры. Собрали 25 ключевых событий, разбитых по 10 главным трендам года.
2025-й — год, когда чат окончательно превратился в исполнителя: модели планируют, вызывают инструменты, выполняют действия.
OpenAI превратила Responses API в единый control plane для агентов: MCP-серверы, tool-use прямо в reasoning, File Search, Code Interpreter, генерация изображений и background mode для долгих задач — всё в одном интерфейсе.
ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру»: агентный режим теперь не демка, а продукт — доступен Plus/Pro/Team с региональными ограничениями.
Anthropic запустила Claude Integrations с упором на длинные задачи: коннекторы как продукт, MCP-плагины для сервисов, усиление «исследовательских» сценариев со сбором контекста из разных источников.
Google представила A2A — протокол для общения агентов разных производителей: Agent2Agent как попытка создать общий язык межагентного взаимодействия, Microsoft заявила поддержку.
Качество растёт не только за счёт размера, но и через умение рассуждать и управлять глубиной мышления.
OpenAI упростила модельный выбор: GPT-5 стал основным флагманом с быстрым и «глубоким» режимами и авто-роутингом задач — упор на код, мультимодальность и следование инструкциям.
Reasoning-модели научились вызывать инструменты в ходе решения задачи: в Responses API o-линейка (o3, o4-mini) получила tool calling внутри агентного цикла, а не «после ответа».
Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений: thinking budget как ручка управления — когда надо быстро, модель думает быстро, когда надо глубоко — глубоко.
DeepSeek-R1 стал новой базой сравнения для открытых моделей: китайская open-weight reasoning-модель доказала, что reasoning масштабируется не только размером, но и пост-тренингом.
Если 2024 был про Copilot-подсказчик, то 2025 — про постановку задач агенту и контроль результата.
Vibe coding стал термином года: формула «я задаю намерение → агент пишет/правит → я проверяю» стала массовой практикой.
OpenAI Codex превратился в код-агента с песочницей: изолированная среда, параллельные задачи, упор на сквозную работу с репозиторием — от автодополнения к исполнителю.
Cursor 2.0 сделал IDE оркестратором нескольких агентов: до 8 агентов параллельно, разные модели, изолированные окружения через git worktrees, контроль диффов и безопасный терминал.
Qwen3-Coder бросил вызов закрытым IDE-агентам: open-weight код-агент с agentic coding, tool use, browser use — контекст до 1M токенов, MoE-архитектура.
Видео и голос перестали быть демками и превратились в инфраструктуру: API, цены, лимиты, прод-сценарии.
Sora 2 стала платформой, а не просто генератором роликов: продуктовый формат с cameos, сценариями и выходом к API через партнёрские интеграции.
Veo 2 появилась в Gemini API с понятной экономикой: 8 секунд, 720p, цена за секунду — видео-генерация как прод-сервис в dev-экосистеме Google.
gpt-realtime вышел в GA с SIP и MCP: speech-to-speech в одной модели, низкие задержки, удалённые MCP-серверы, изображения на входе, точный function calling — голосовые агенты стали реальностью.
Параллельно с гонкой флагманов рынок полюбил узкие, дешёвые модели с понятной ценностью.
Mistral OCR сделал документы отдельным классом задач: OCR для рукописей, форм и таблиц с прозрачной экономикой — $2 за 1 000 страниц ($1 в Batch-режиме).
Microsoft Mu показала, зачем нужны специализированные малые модели: 330M параметров, работа на NPU, быстрые ответы без облака — «внутренний агент» Windows для помощи с настройками.
Китайские релизы 2025-го — это уже не «догнать», а давление темпом: много моделей, много открытости, инженерия эффективности.
Qwen 3 сделал thinking/non-thinking штатной функцией: семейство dense+MoE, переключаемые режимы вывода, thinking budget как ручка управления стоимостью/качеством, расширенная многоязычность.
ERNIE 4.5 от Baidu вышел под Apache-лицензией: пакет моделей включая крупные MoE, сильная мультимодальность, ориентация на deployment-стек — плюс Moonshot/Kimi тоже выкатили открытые веса, усиливая волну открытых релизов из Китая.
Тренд года — не один «умный чат», а связка модель + сценарии + интеграции + цена.
YandexGPT 5.1 Pro нацелился на корпоративные сценарии: RAG, работа с документами и отчётами, меньше галлюцинаций — упор на контролируемость и понятную экономику.
GigaChat 2.0 вырос до «200 страниц» контекста: в 4 раза больше контекста, лучшее следование инструкциям, опции облачного и локального развёртывания.
Sber выложил open-компоненты: Giga-Embeddings для RAG и Kandinsky Video Lite для генерации видео.
На уровне железа 2025-й — это уже не только «тренируем», а «как масштабируем инференс для миллиардов запросов».
Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс: NVIDIA продвигает концепт AI Factory для генерации в промышленных масштабах, Google показывает TPU Ironwood как специализированный инференс-ускоритель — тема энергопотребления стала узким местом в публичных обсуждениях.
Если в 2023–24 RAG был приёмом, то в 2025 он стал отдельным продуктовым слоем.
Fully-managed RAG стал стандартом: Google продвигает File Search Tool как managed-сервис — загрузка, индексация, поиск через API. OpenAI усиливает аналогичную логику через File Search в Responses API — «агент с документами» собирается без ручной инженерии.
Когда синтетики много, нужны технические маркеры доверия и практики оценки рисков.
Индустрия выстраивает provenance-слой: C2PA v2.2 обновляет спецификации происхождения медиа, Google раскатывает SynthID для детекта синтетики, OpenAI и Anthropic делают взаимные кросс-оценки безопасности моделей — редкий, но важный сигнал зрелости.
2025-й стал годом перехода от «модель отвечает» к «модель делает»: DeepSeek показал, что open-weight модели конкурируют по reasoning-качеству, MCP стал де-факто одним из главных протоколов интеграций, vibe coding изменил культуру разработки, а агенты захватили браузеры, терминалы и IDE. Железо догоняет софт — Blackwell и Ironwood задают вектор на массовый инференс.
Какой тренд 2025 года оказался для вас самым неожиданным? Делитесь в комментариях!