Новости ChatGPT

Качественный перевод прямо на смартфоне: вышла Google TranslateGemma

Google выпустил TranslateGemma — семейство открытых моделей для машинного перевода на базе Gemma 3. Модели доступны в трех размерах: 4B параметров для смартфонов, 12B для ноутбуков и 27B для облачных GPU. Скачать можно также с Hugging Face. При этом 12B-версия превосходит базовую Gemma 3 27B по качеству перевода — вдвое меньшая модель допускает на 26% меньше ошибок.

TranslateGemma поддерживает 55 языков, включая малопопулярные: ошибки при переводе на исландский снизились более чем на 30%, на суахили — примерно на 25%. Дополнительно модель обучалась на почти 500 языковых парах. Бонусом идет перевод текста на изображениях — вывески, меню, сканы документов — без отдельного OCR-модуля и без специального дообучения на мультимодальных данных.

Для обучения Google применил двухэтапный подход: сначала supervised fine-tuning на параллельных корпусах (человеческие переводы плюс синтетика от Gemini), затем reinforcement learning с ансамблем reward-моделей, включая MetricX-QE и AutoMQM. Чтобы модель не превратилась в узкого специалиста, 30% обучающей выборки составили общие данные из оригинальной Gemma 3.

Релиз вышел через несколько часов после запуска ChatGPT Translate от OpenAI — но в отличие от закрытого решения конкурента, TranslateGemma открыта под лицензией Gemma Terms of Use. Это очередная специализированная версия Gemma 3 после MedGemma, FunctionGemma и других — Google явно делает ставку на экосистему открытых моделей под конкретные задачи.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.