AI-итоги года: 25 событий 2025-го в 10 главных трендах
2025-й войдёт в историю как год, когда AI перестал «отвечать» и начал «делать». Модели научились рассуждать по бюджету, агенты захватили браузеры и терминалы, а видео и голос превратились из демок в часть инфраструктуры. Собрали 25 ключевых событий, разбитых по 10 главным трендам года.
? Тренд 1: Агенты, MCP и стандартизация действий
2025-й — год, когда чат окончательно превратился в исполнителя: модели планируют, вызывают инструменты, выполняют действия.
-
OpenAI превратила Responses API в единый control plane для агентов: MCP-серверы, tool-use прямо в reasoning, File Search, Code Interpreter, генерация изображений и background mode для долгих задач — всё в одном интерфейсе.
-
ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру»: агентный режим теперь не демка, а продукт — доступен Plus/Pro/Team с региональными ограничениями.
-
Anthropic запустила Claude Integrations с упором на длинные задачи: коннекторы как продукт, MCP-плагины для сервисов, усиление «исследовательских» сценариев со сбором контекста из разных источников.
-
Google представила A2A — протокол для общения агентов разных производителей: Agent2Agent как попытка создать общий язык межагентного взаимодействия, Microsoft заявила поддержку.
? Тренд 2: Reasoning и «думать по бюджету»
Качество растёт не только за счёт размера, но и через умение рассуждать и управлять глубиной мышления.
-
OpenAI упростила модельный выбор: GPT-5 стал основным флагманом с быстрым и «глубоким» режимами и авто-роутингом задач — упор на код, мультимодальность и следование инструкциям.
-
Reasoning-модели научились вызывать инструменты в ходе решения задачи: в Responses API o-линейка (o3, o4-mini) получила tool calling внутри агентного цикла, а не «после ответа».
-
Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений: thinking budget как ручка управления — когда надо быстро, модель думает быстро, когда надо глубоко — глубоко.
-
DeepSeek-R1 стал новой базой сравнения для открытых моделей: китайская open-weight reasoning-модель доказала, что reasoning масштабируется не только размером, но и пост-тренингом.
? Тренд 3: Вайб-кодинг и разработка через агента
Если 2024 был про Copilot-подсказчик, то 2025 — про постановку задач агенту и контроль результата.
-
Vibe coding стал термином года: формула «я задаю намерение → агент пишет/правит → я проверяю» стала массовой практикой.
-
OpenAI Codex превратился в код-агента с песочницей: изолированная среда, параллельные задачи, упор на сквозную работу с репозиторием — от автодополнения к исполнителю.
-
Cursor 2.0 сделал IDE оркестратором нескольких агентов: до 8 агентов параллельно, разные модели, изолированные окружения через git worktrees, контроль диффов и безопасный терминал.
-
Qwen3-Coder бросил вызов закрытым IDE-агентам: open-weight код-агент с agentic coding, tool use, browser use — контекст до 1M токенов, MoE-архитектура.
? Тренд 4: Видео и голос стали частью инфраструктуры
Видео и голос перестали быть демками и превратились в инфраструктуру: API, цены, лимиты, прод-сценарии.
-
Sora 2 стала платформой, а не просто генератором роликов: продуктовый формат с cameos, сценариями и выходом к API через партнёрские интеграции.
-
Veo 2 появилась в Gemini API с понятной экономикой: 8 секунд, 720p, цена за секунду — видео-генерация как прод-сервис в dev-экосистеме Google.
-
gpt-realtime вышел в GA с SIP и MCP: speech-to-speech в одной модели, низкие задержки, удалённые MCP-серверы, изображения на входе, точный function calling — голосовые агенты стали реальностью.
? Тренд 5: Спец-модели и on-device
Параллельно с гонкой флагманов рынок полюбил узкие, дешёвые модели с понятной ценностью.
-
Mistral OCR сделал документы отдельным классом задач: OCR для рукописей, форм и таблиц с прозрачной экономикой — $2 за 1 000 страниц ($1 в Batch-режиме).
-
Microsoft Mu показала, зачем нужны специализированные малые модели: 330M параметров, работа на NPU, быстрые ответы без облака — «внутренний агент» Windows для помощи с настройками.
?? Тренд 6: Китайский open-weights давит темпом
Китайские релизы 2025-го — это уже не «догнать», а давление темпом: много моделей, много открытости, инженерия эффективности.
-
Qwen 3 сделал thinking/non-thinking штатной функцией: семейство dense+MoE, переключаемые режимы вывода, thinking budget как ручка управления стоимостью/качеством, расширенная многоязычность.
-
ERNIE 4.5 от Baidu вышел под Apache-лицензией: пакет моделей включая крупные MoE, сильная мультимодальность, ориентация на deployment-стек — плюс Moonshot/Kimi тоже выкатили открытые веса, усиливая волну открытых релизов из Китая.
?? Тренд 7: Россия — локальные флагманы и прикладной AI
Тренд года — не один «умный чат», а связка модель + сценарии + интеграции + цена.
-
YandexGPT 5.1 Pro нацелился на корпоративные сценарии: RAG, работа с документами и отчётами, меньше галлюцинаций — упор на контролируемость и понятную экономику.
-
GigaChat 2.0 вырос до «200 страниц» контекста: в 4 раза больше контекста, лучшее следование инструкциям, опции облачного и локального развёртывания.
-
Sber выложил open-компоненты: Giga-Embeddings для RAG и Kandinsky Video Lite для генерации видео.
⚡ Тренд 8: AI-фабрики и железо под эпоху инференса
На уровне железа 2025-й — это уже не только «тренируем», а «как масштабируем инференс для миллиардов запросов».
-
Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс: NVIDIA продвигает концепт AI Factory для генерации в промышленных масштабах, Google показывает TPU Ironwood как специализированный инференс-ускоритель — тема энергопотребления стала узким местом в публичных обсуждениях.
? Тренд 9: RAG и поиск как продукт
Если в 2023–24 RAG был приёмом, то в 2025 он стал отдельным продуктовым слоем.
-
Fully-managed RAG стал стандартом: Google продвигает File Search Tool как managed-сервис — загрузка, индексация, поиск через API. OpenAI усиливает аналогичную логику через File Search в Responses API — «агент с документами» собирается без ручной инженерии.
? Тренд 10: Provenance и доверие к контенту
Когда синтетики много, нужны технические маркеры доверия и практики оценки рисков.
-
Индустрия выстраивает provenance-слой: C2PA v2.2 обновляет спецификации происхождения медиа, Google раскатывает SynthID для детекта синтетики, OpenAI и Anthropic делают взаимные кросс-оценки безопасности моделей — редкий, но важный сигнал зрелости.
2025-й стал годом перехода от «модель отвечает» к «модель делает»: DeepSeek показал, что open-weight модели конкурируют по reasoning-качеству, MCP стал де-факто одним из главных протоколов интеграций, vibe coding изменил культуру разработки, а агенты захватили браузеры, терминалы и IDE. Железо догоняет софт — Blackwell и Ironwood задают вектор на массовый инференс.
Какой тренд 2025 года оказался для вас самым неожиданным? Делитесь в комментариях!