Google представила обновленную версию исследовательского агента Deep Research. Ядром системы стала модель Gemini 3 Pro, которую компания называет своей самой фактологически точной на сегодня. На бенчмарке Humanity's Last Exam — наборе задач, который создавался как "последний рубеж" для ИИ — агент показал 46,4%, это лучший результат среди всех существующих систем.
Deep Research специализируется на длительных исследовательских задачах: агент сам формулирует поисковые запросы, читает результаты, выявляет пробелы в информации и ищет снова. В новой версии улучшили навигацию по сайтам — теперь агент глубже погружается в страницы за конкретными данными. Gemini 3 Pro специально обучали снижать галлюцинации и повышать качество итоговых отчетов.
На других бенчмарках агент тоже показал сильные результаты: 59,2% на BrowseComp от OpenAI и 66,1% на собственном DeepSearchQA — новом тесте Google из 900 задач в 17 областях, который компания выложила в открытый доступ. По данным Google, финансовые компании уже используют Deep Research для автоматизации первичных проверок бизнесов перед сделко, а биотех-стартап Axiom Bio — для анализа биомедицинской литературы.
Впервые Deep Research доступен разработчикам через новый Interactions API. Агент умеет работать с загруженными документами (PDF, CSV, Word), позволяет задавать структуру отчета через промпт, возвращает результаты с детальными цитатами и поддерживает JSON-формат. В ближайшее время обновленная версия также появится в Gemini App, поиске Google, NotebookLM и Google Finance.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.