Новости ChatGPT

Что такое Gemini Pro, Flash и Ultra

Обзор моделей Gemini

Gemini Pro 1.0

Первый из семейства. Он эффективен для решения несложных повседневных задач. Такая бесплатная модель объяснит философские термины, напишет простой код на jаvascript и может сочинить сценарий для видео. 

Производительность модели можно сравнить с устаревающим GPT 3.5 от Open AI.

Пользоваться Pro 1.0 можно бесплатно, но доступ ко всем версиям Gemini из ряда стран, в том числе из РФ, ограничен.

Gemini Pro Vision

С февраля 2024 года функция генерации изображений стала компонентом бесплатной Gemini Pro 1.0. Но для генерации изображений нужно иметь ввиду, что картинка генерируется только на английском языке.

Версия Ultra 1.0

 стала первой нейросетью Google, которая превзошла людей в многозадачном тесте MMLU. Модель обладает расширенными аналитическими возможностями, а при интеграции в AlphaCode2 показывает высочайшую производительность в области кодирования. Доступ к чат-боту распространяется по подписке Google Advanced.

Приобретая подписку, пользователи получают:

Доступ к Gemini Ultra 1.0.

Доступ к Gemini Pro 1.5.

Поддержку Google Документов, файлов PDF для генерации.

Поддержку таблиц, диаграмм для генерации.

Исполнение кода Python внутри диалогового окна Gemini.

Интеграцию Gemini в сервисы Google.

С простыми задачами Gemini Ultra 1.0 справляется на уровне бесплатной Pro 1.0, но есть заметные отличия при работе с более сложными сценариями. Например, чат-бот лучше пересказывает текст, выделяет ключевые мысли при суммаризации, предоставляет развернутые ответы.

Качество и стиль изображений не отличаются от генераций бесплатной версии – в Pro 1.0 и Ultra 1.0 используют один и тот же модуль Gemini Pro Vision.

Gemini Nano 1.0

Самая “маленькая” модель семейства, оптимизированная под смартфоны. Контекстное окно и бенчмарки Nano 1.0 идентичны Pro 1.0.

Возможности Nano 1.0 включают генерацию ответов в мессенджерах, распознавание голоса и визуальной информации и взаимодействие с сервисами Google.

Gemini 1.5 Pro

Эта модель уже относится к новейшему поколению LLM. Gemini 1.5 Pro и превосходит предыдущие модели Google, Chat GPT и Claude. Нейросеть обрабатывает до 2 миллионов токенов, что эквивалентно 1 400 000 слов, 2 часам видео или 22 часам аудио. Использовать Gemini 1,5 Pro можно в рамках подписки Google Advanced или бесплатно в Google AI Studio, но тут есть региональные ограничения, и Россия в такой список стран не входит.

Функцию генерации изображений для данной модели Google временно приостановил из-за проблем с исторической точностью. Gemini 1.5 Pro увлеклась расовой инклюзивностью, искажая факты, что вызвало шквал критики в соцсетях. Инцидент спровоцировал появление теорий о намеренном исключении белых людей из генерации. Компания отреагировала на жалобы пользователей и отправила функционал на доработку.

Gemini 1.5 Flash

Модель позиционируется как лучший инструмент для ежедневных задач по соотношению цены и качества. 

Flash 1.5 генерирует около 150 токенов в секунду, что превосходит результаты Open AI и Claude. Для сравнения: GPT-4o выдает около 80 токенов в секунду, а GPT-4-Turbo — всего 25 токенов в секунду.

Gemini AI против новейших моделей на рынке

Лучшими характеристиками в семействе Gemini AI обладают модели Flash 1.5 и Gemini 1.5 Pro. Они справляются с любыми задачами точнее и эффективнее, чем предыдущие версии 1.0. Самая мощная нейросеть от Гугла, обновленная в мае 2024 года — это Gemini 1.5 pro latest. Именно она соревнуется с алгоритмами Open AI, Claude, Llama за звание лучшей LLM.

Gemini Flash 1.5 демонстрирует впечатляющие результаты по метрике COMET — 89,27 баллов. Модели Gemini Pro превосходят показатели GPT-3.5   turbo и сравнимы с производительностью Claude 3 Haiku, уступая ей лишь по некоторым бенчмаркам.