Gemini 3 захватывает поиск, AI-ассистенты становятся рабочими хабами: главные новости AI за неделю
-
Google делает поиск разговорным: Gemini 3 становится дефолтной моделью для AI Overviews глобально (пока на мобильных), follow‑up вопросы переводят в диалог с AI Mode — медиа опасаются новой волны потерь трафика.
-
Google запускает агентный режим в Chrome: auto browse выполняет многошаговые задачи за пользователя — бронирование, формы, налоговые документы, покупки с промокодами; пока для AI Pro/Ultra в США; открытый стандарт UCP с Shopify, Etsy, Wayfair, Target.
-
Anthropic превращает Claude в рабочий хаб: интерактивные интеграции с Asana, Slack, Figma, Canva — можно строить таймлайны и отправлять сообщения прямо из чата.
-
Qwen3-Max‑Thinking обошёл GPT-5.2 и Gemini 3 Pro на Humanity's Last Exam: Alibaba выводит китайские reasoning‑модели в топ — 49.8 vs Gemini 3 Pro 45.8 и GPT-5.2 45.5, цены ниже западных конкурентов.
-
OpenAI запустила Prism: бесплатная среда для научных статей на GPT-5.2 с LaTeX, поиском литературы и совместной работой — заявка на рынок научных инструментов.
-
Moonshot AI выпустила Kimi K2.5 с Agent Swarm: модель сама создаёт до 100 параллельных агентов, ускоряя выполнение до 4.5× — ставка на рой вместо усиления одиночного агента.
Google делает поиск разговорным: Gemini 3 в AI Overviews по умолчанию, медиа опасаются потери трафика
Google сближает AI Overviews и AI Mode: Gemini 3 становится дефолтной моделью для AI Overviews по всему миру, а пользователи могут бесшовно переходить от краткой выдачи к диалогу.
Что изменилось:
-
AI Overviews: Gemini 3 генерирует ответы прямо на странице результатов.
-
Follow‑up: уточняющие вопросы из AI Overview с сохранением контекста.
-
AI Mode: плавный переход в диалоговый режим для сложных тем.
Проблема для медиа:
-
Ed Newton‑Rex (CEO Fairly Trained AI) в ответ на анонс: «...и вам не нужно будет посещать сайты, с которых Google соскрейпил информацию».
-
Elizabeth Reid (глава Google Search) ранее признала: некоторые сайты видят снижение трафика.
-
Позиция Google: они утверждают, что клики стали «качественнее» — пользователи переходят осознанно и реже уходят сразу.
Стратегический контекст:
-
Benjamin Kaufman (product manager AI Mode): «Надеюсь, скоро различия между продуктами исчезнут — просто спрашиваете Google и получаете нужное» — сейчас AI Overviews, AI Mode и Gemini существуют отдельно, но Google движется к единому AI‑интерфейсу.
-
The Verge запросил комментарий о планах полностью отказаться от классического поиска — Google не ответил.
Доступность:
-
Платформа: на мобильных (пока).
-
География: глобальный запуск.
Google последовательно стирает границу между поиском, AI Overviews и Gemini‑чатботом — компания движется к миру, где «просто спрашиваешь Google», а ответы всё чаще могут заменять переходы на сайты (хотя Google подчёркивает наличие заметных ссылок для продолжения). Медиа готовятся к новой волне потерь трафика.
Google запускает агентный Gemini в Chrome: auto browse выполняет многошаговые задачи за пользователя
Google продолжает AI‑наступление: вслед за обновлением поиска компания интегрирует Gemini 3 в Chrome с боковой панелью‑ассистентом и агентным режимом auto browse. Auto browse берёт на себя сложные задачи — от бронирования до заполнения форм и сбора налоговых документов.
Боковая панель:
-
Gemini‑ассистент доступен на любой вкладке.
-
Сравнение опций между вкладками, саммари отзывов, работа с календарём.
Nano Banana в Chrome:
-
Трансформация изображений прямо в браузере без скачивания.
-
Примеры: редизайн интерьера, превращение данных в инфографику.
-
Доступно всем пользователям Gemini в Chrome.
Connected Apps:
-
Интеграции с Gmail, Calendar, YouTube, Maps, Google Shopping, Google Flights.
-
Пример: найти старое письмо с деталями конференции, подобрать рейс, отправить коллегам время прилёта.
Auto browse (агентный режим):
-
Выполняет многошаговые задачи: бронирование, заполнение форм, сбор налоговых документов, проверка оплаты счетов, отчёты о расходах, управление подписками.
-
Мультимодальный: распознаёт предметы на фото, ищет похожие товары, добавляет в корзину с учётом бюджета и промокодов.
-
Может использовать Google Password Manager для логина на сайтах (с разрешения).
-
Паузы перед чувствительными действиями (покупка, публикация в соцсетях) — запрашивает подтверждение.
-
Доступно: AI Pro и Ultra подписчики в США.
Universal Commerce Protocol (UCP):
-
Открытый стандарт для покупок через AI‑агентов.
-
Разработан совместно с Shopify, Etsy, Wayfair, Target.
Personal Intelligence:
-
Появится в Chrome в ближайшие месяцы.
-
Запоминает контекст прошлых разговоров, даёт персонализированные ответы.
-
Opt‑in: пользователь сам решает, подключать ли приложения, и может отключить в любой момент.
Google превращает Chrome из браузера в агента, который работает за пользователя. Auto browse — эволюция autofill: от заполнения полей до выполнения целых workflow. UCP с Shopify, Etsy, Wayfair, Target показывает: Google хочет, чтобы AI‑агенты покупали за пользователей.
Anthropic превратила Claude в хаб для работы с внешними сервисами — Asana, Slack, Figma и другие инструменты теперь интерактивны прямо в чате
Claude получил возможность не просто подключаться к внешним сервисам, а показывать их интерактивные элементы прямо в диалоге. Пользователи могут строить таймлайны в Asana, редактировать и отправлять сообщения в Slack, создавать диаграммы в Figma — без переключения между вкладками.
Доступные интеграции:
-
Amplitude — построение аналитических графиков с интерактивной настройкой параметров.
-
Asana — создание проектов, задач и таймлайнов из чата.
-
Box — поиск файлов, превью документов, извлечение информации.
-
Canva — создание презентаций с настройкой брендинга в реальном времени.
-
Clay — исследование компаний, поиск контактов, подготовка персонализированных писем.
-
Figma — генерация flowchart'ов, диаграмм Ганта и других визуализаций в FigJam.
-
Hex — ответы на вопросы по данным с интерактивными графиками, таблицами и цитатами.
-
monday.com — управление проектами, обновление досок, визуализация прогресса.
-
Slack (от Salesforce) — поиск по переписке, генерация и форматирование сообщений с превью перед отправкой.
Техническая основа:
-
MCP Apps — новое расширение открытого стандарта Model Context Protocol.
-
Позволяет любому MCP‑серверу доставлять интерактивный интерфейс в любой поддерживающий продукт, не только Claude.
Доступность:
-
Web и desktop для планов Pro, Max, Team, Enterprise.
-
Скоро появится в Claude Cowork.
-
Анонсирована интеграция с Salesforce через Agentforce 360.
-
Как начать: зайти в [claude.ai/directory](https://claude.ai/directory) и подключить приложения с пометкой «interactive».
Anthropic расширяет MCP от протокола подключения инструментов до платформы для встраивания интерактивных элементов — шаг к превращению AI‑ассистента в единую точку входа для рабочих процессов.
Qwen3-Max-Thinking обошёл GPT-5.2 и Gemini 3 Pro на Humanity's Last Exam — Alibaba выводит китайские reasoning-модели в топ
Alibaba Cloud представила Qwen3-Max‑Thinking — проприетарную reasoning‑модель с адаптивным использованием инструментов. На бенчмарке Humanity's Last Exam (с веб‑поиском) модель набрала 49.8, обогнав Gemini 3 Pro (45.8) и GPT-5.2-Thinking (45.5). Результаты опубликованы командой Qwen.
Результаты бенчмарков (данные Qwen Team):
-
Humanity's Last Exam (с поиском): 49.8 vs Gemini 3 Pro 45.8, GPT-5.2-Thinking 45.5.
-
HMMT Feb 25 (reasoning): 98.0 vs Gemini 3 Pro 97.5, DeepSeek V3.2 92.5.
-
Arena‑Hard v2 (код): 90.2 vs Claude Opus 4.5 76.7.
-
GPQA (PhD‑level science): 92.8.
-
LiveCodeBench v6: 91.4.
Ключевые возможности:
-
Test‑time scaling: модель «торгует» вычислениями за качество — итеративная самопроверка вместо линейной генерации.
-
Adaptive tool use: автономно выбирает между веб‑поиском, памятью и code interpreter.
-
Совместимость: API поддерживает форматы OpenAI и Anthropic (работает с Claude Code).
Цены (ниже западных конкурентов):
-
Токены: $1.20 / 1M input, $6.00 / 1M output.
-
Agent Search: $10 за 1 000 вызовов.
-
Web Extractor и Code Interpreter: бесплатно (временно).
-
Для сравнения: GPT-5.2 стоит $1.75 / $14.00, Gemini 3 Pro — $2.00 / $12.00.
Контекст:
-
Qwen уже используется Airbnb как более доступная альтернатива американским моделям (по словам CEO Brian Chesky).
-
Для части американских компаний китайское происхождение — барьер из‑за требований к безопасности.
Qwen продолжает сокращать отставание от западных лабораторий — теперь не только в open source, но и в проприетарных reasoning‑моделях. Агрессивные цены и совместимость с OpenAI/Anthropic API делают модель привлекательной для enterprise, но китайское происхождение остаётся стоп‑фактором для части рынка.
OpenAI запустила Prism — бесплатную среду для написания научных текстов на базе GPT-5.2
OpenAI представила Prism — бесплатную облачную среду для написания научных текстов. GPT-5.2 интегрирован в LaTeX‑редактор (стандарт вёрстки научных статей) с доступом ко всему документу: уравнениям, цитатам, структуре.
Ключевые возможности:
-
GPT-5.2 Thinking видит всю статью, а не отдельные фрагменты.
-
Подбирает релевантные источники (включая arXiv) под содержание статьи.
-
Уравнения и диаграммы с доски → LaTeX.
-
Совместная работа в реальном времени.
Доступность:
-
Сейчас: бесплатно для пользователей с личным аккаунтом ChatGPT, без ограничений на проекты и соавторов.
-
Скоро: планы Business, Team, Enterprise, Education.
-
Продвинутые функции появятся в платных планах позже.
Контекст:
-
Построен на базе Crixet — LaTeX‑платформы, которую OpenAI приобрела.
OpenAI выходит на рынок научных инструментов с агрессивной стратегией: бесплатный доступ должен привлечь исследователей, монетизация — позже.
Moonshot AI выпустила Kimi K2.5 — open-source модель с Agent Swarm на 100 параллельных агентов
Moonshot AI представила Kimi K2.5 — мультимодальную модель, обученную на 15T токенов. Ключевая фича: Agent Swarm — модель сама создаёт до 100 суб‑агентов для параллельного выполнения задач (до 1 500 tool calls), ускоряя end‑to‑end выполнение (latency) до 4.5× по сравнению с одиночным агентом.
Результаты бенчмарков (данные Kimi, сравнение при указанных режимах thinking/effort у разных моделей):
-
HLE‑Full w/ tools: 50.2 vs GPT-5.2 45.5, Claude 4.5 Opus 43.2, Gemini 3 Pro 45.8.
-
BrowseComp (w/ context mgm): 74.9 vs GPT-5.2 65.8, Claude 57.8, Gemini 59.2.
-
SWE‑Bench Verified: 76.8 vs GPT-5.2 80.0, Claude 80.9, Gemini 76.2.
-
MMMU‑Pro (vision): 78.5 vs GPT-5.2 79.5, Gemini 81.0.
Agent Swarm:
-
Модель сама декомпозирует задачу и создаёт суб‑агентов без предопределённых ролей.
-
PARL: обучаемый orchestrator декомпозирует задачу, subagents — динамически создаваемые frozen‑исполнители.
-
Сокращает критический путь выполнения в 3–4.5× на задачах с широким поиском.
Coding with Vision:
-
Рассуждает по изображениям и видео, генерирует и чинит код — включая восстановление сайта по видео.
-
Сильна во фронтенд‑разработке: из промпта генерирует интерактивные интерфейсы с анимациями.
-
Визуальный дебаггинг: смотрит на свой output и итеративно исправляет.
-
Kimi Code — open‑source терминальный инструмент, интегрируется с VSCode, Cursor, Zed.
Office Productivity:
-
K2.5 Agent делает «офисную» работу end‑to‑end: документы, таблицы, PDF, слайды — через tool use.
-
На внутренних бенчмарках (AI Office Benchmark, General Agent Benchmark) заявляют +59.3% и +24.3% относительно K2 Thinking.
Доступность:
-
Kimi.com, Kimi App, API, Kimi Code.
-
4 режима: Instant, Thinking, Agent, Agent Swarm (beta).
-
Agent Swarm в бете на Kimi.com; бесплатные кредиты — у пользователей high‑tier платных тарифов.
Moonshot AI делает ставку на параллельное выполнение задач вместо наращивания мощности одного агента. Если результаты подтвердятся независимыми тестами, Agent Swarm может стать новым стандартом для сложных многошаговых задач.
OpenAI выводит GPT-4.1 и другие устаревшие модели из ChatGPT (не API)
13 февраля OpenAI уберёт из ChatGPT модели GPT-4o, GPT-4.1, GPT-4.1 mini и o4-mini. Основной выбор у большинства уже — GPT-5.2: лишь 0.1% пользователей выбирают GPT-4o ежедневно.
Что уходит из ChatGPT:
-
GPT-4o, GPT-4.1, GPT-4.1 mini, o4-mini.
-
GPT-5 Instant и Thinking (анонсировали вывод ранее, теперь подтвердили дату).
Контекст:
-
GPT-4o уже выводили, потом вернули после фидбека — пользователи ценили «теплоту» модели.
-
Это учли в GPT-5.1 и GPT-5.2: улучшили personality, добавили кастомизацию стиля.
Что ещё обещают:
-
Меньше лишних отказов и «нравоучительного» тона.
-
Работают над версией ChatGPT для 18+ по принципу «treating adults like adults».
-
Внедрили age prediction для пользователей до 18 на большинстве рынков.
OpenAI чистит линейку: старые модели уходят, GPT-5.2 остаётся главной.
P. S. Напоминание для разработчиков: ранее мы писали, что 17 февраля OpenAI убирает chatgpt-4o из API. Если используете 4o в своих решениях — время переходить на другие модели.
Какая новость января для вас главная? Пишите в комментариях!