Обзор моделей Gemini

Первый из семейства. Он эффективен для решения несложных повседневных задач. Такая бесплатная модель объяснит философские термины, напишет простой код на jаvascript и может сочинить сценарий для видео.
Производительность модели можно сравнить с устаревающим GPT 3.5 от Open AI.
Пользоваться Pro 1.0 можно бесплатно, но доступ ко всем версиям Gemini из ряда стран, в том числе из РФ, ограничен.
С февраля 2024 года функция генерации изображений стала компонентом бесплатной Gemini Pro 1.0. Но для генерации изображений нужно иметь ввиду, что картинка генерируется только на английском языке.
Версия Ultra 1.0
стала первой нейросетью Google, которая превзошла людей в многозадачном тесте MMLU. Модель обладает расширенными аналитическими возможностями, а при интеграции в AlphaCode2 показывает высочайшую производительность в области кодирования. Доступ к чат-боту распространяется по подписке Google Advanced.
Приобретая подписку, пользователи получают:
Доступ к Gemini Ultra 1.0.
Доступ к Gemini Pro 1.5.
Поддержку Google Документов, файлов PDF для генерации.
Поддержку таблиц, диаграмм для генерации.
Исполнение кода Python внутри диалогового окна Gemini.
Интеграцию Gemini в сервисы Google.
С простыми задачами Gemini Ultra 1.0 справляется на уровне бесплатной Pro 1.0, но есть заметные отличия при работе с более сложными сценариями. Например, чат-бот лучше пересказывает текст, выделяет ключевые мысли при суммаризации, предоставляет развернутые ответы.
Качество и стиль изображений не отличаются от генераций бесплатной версии – в Pro 1.0 и Ultra 1.0 используют один и тот же модуль Gemini Pro Vision.
Самая “маленькая” модель семейства, оптимизированная под смартфоны. Контекстное окно и бенчмарки Nano 1.0 идентичны Pro 1.0.
Возможности Nano 1.0 включают генерацию ответов в мессенджерах, распознавание голоса и визуальной информации и взаимодействие с сервисами Google.
Функцию генерации изображений для данной модели Google временно приостановил из-за проблем с исторической точностью. Gemini 1.5 Pro увлеклась расовой инклюзивностью, искажая факты, что вызвало шквал критики в соцсетях. Инцидент спровоцировал появление теорий о намеренном исключении белых людей из генерации. Компания отреагировала на жалобы пользователей и отправила функционал на доработку.
Модель позиционируется как лучший инструмент для ежедневных задач по соотношению цены и качества.
Flash 1.5 генерирует около 150 токенов в секунду, что превосходит результаты Open AI и Claude. Для сравнения: GPT-4o выдает около 80 токенов в секунду, а GPT-4-Turbo — всего 25 токенов в секунду.
Лучшими характеристиками в семействе Gemini AI обладают модели Flash 1.5 и Gemini 1.5 Pro. Они справляются с любыми задачами точнее и эффективнее, чем предыдущие версии 1.0. Самая мощная нейросеть от Гугла, обновленная в мае 2024 года — это Gemini 1.5 pro latest. Именно она соревнуется с алгоритмами Open AI, Claude, Llama за звание лучшей LLM.
Gemini Flash 1.5 демонстрирует впечатляющие результаты по метрике COMET — 89,27 баллов. Модели Gemini Pro превосходят показатели GPT-3.5 turbo и сравнимы с производительностью Claude 3 Haiku, уступая ей лишь по некоторым бенчмаркам.