Агентский опыт
Один из самых интересных аспектов Gemini 2.0 — это стремление к «агентному» ИИ, способному автономно выполнять задачи от имени пользователя. Google представила несколько прототипов для демонстрации этого:
Проект Astra : универсальный помощник на основе искусственного интеллекта, способный понимать окружающий мир и взаимодействовать с ним, предлагая помощь в режиме реального времени на нескольких языках с помощью таких инструментов Google, как Поиск, Объектив и Карты. Это может потенциально изменить подход пользователей к взаимодействию с окружающей средой через умные очки или смартфоны.
Project Mariner : экспериментальное расширение Chrome, способное перемещаться и взаимодействовать в браузерной среде, выполняя задачи на основе инструкций пользователя. Этот прототип демонстрирует потенциал ИИ для управления веб-задачами, от заполнения форм до веб-исследований, прямо из браузера.
Jules : ИИ-агент кодирования, призванный помогать разработчикам в выполнении повторяющихся задач кодирования, исправлении ошибок и даже планировании в рамках рабочего процесса GitHub. Это призвано оптимизировать процесс разработки, позволяя разработчикам сосредоточиться на более творческих аспектах кодирования
Gemini 2.0 представляет расширенные мультимодальные функции, позволяющие модели понимать, генерировать и обрабатывать различные формы данных, включая текст, изображения, аудио и видео. Благодаря этому обновлению Gemini может автоматически генерировать изображения и аудио, в отличие от предыдущих моделей, которым для таких задач требовались внешние инструменты. Благодаря этой интеграции Gemini теперь может предоставлять более гибкий интерфейс, позволяя пользователям запрашивать изображения, аудиоописания и даже сложные визуальные правки в рамках одного диалога.
Скорость и производительность
Новая модель, особенно вариант Gemini 2.0 Flash, разработана с расчётом на более высокую скорость и эффективность по сравнению с предшественниками. Она отличается вдвое большей скоростью, чем Gemini 1.5 Pro, сохраняя при этом или даже превосходя её по производительности в ключевых тестах. Эта скорость критически важна для приложений, работающих в режиме реального времени, таких как онлайн-переводчики или интерактивные помощники, где задержка может существенно повлиять на пользовательский опыт. Разработчики теперь могут использовать эту модель для создания приложений с беспрецедентной скоростью отклика, что делает возможными приложения для потоковой передачи аудио и видео в режиме реального времени.
Если вы разработчик или просто хотите попробовать Gemini 2.0, вы можете получить к нему доступ через API Gemini в Google AI Studio и Vertex AI. Для тех, кто хочет попробовать его как пользователь, он доступен в приложении Gemini в виде экспериментальной модели чата. Просто выберите её в раскрывающемся меню моделей на компьютере или мобильном устройстве.

Хотя точная информация о ценах пока не разглашается, Google обычно предлагает различные уровни доступа к своим моделям ИИ в зависимости от уровня использования и требуемых функций. Однако в Google AI Studio вы можете попробовать их совершенно бесплатно.
Подводя итог, можно сказать, что Gemini 2.0 представляет собой значительный шаг вперёд в развитии технологий искусственного интеллекта Google, предлагая новые мощные инструменты для разработчиков и обычных пользователей. Независимо от того, хотите ли вы повысить производительность или исследовать новые возможности искусственного интеллекта, эта модель произведёт значительный эффект. Я буду следить за развитием событий, поскольку Google продолжит внедрять интересные функции во всё большее количество своих продуктов в ближайшие месяцы!