Google представила TranslateGemma, открытую модель для перевода на десятки языков
Google выпустила TranslateGemma, новую открытую модель машинного перевода на базе Gemma 3. Внутри используется дообучение на синтетических данных от флагманской Gemini с последующей полировкой через reinforcement learning. Компания продолжает стратегию «тихих» сайд-релизов, выкладывая мощные инструменты без громких презентаций.
Так как основой стала Gemma 3, модель умеет работать с текстом прямо на изображениях. OCR и перевод встроены «из коробки», без внешних пайплайнов и дополнительных модулей. Это делает TranslateGemma удобным инструментом для задач вроде перевода скриншотов, документов и фото с текстом.
Google заявляет гарантированное качество на 55 языках, но также отмечает, что модель видела данные еще по примерно 500 языкам. На практике это означает, что на редких диалектах возможны заметные галлюцинации и ошибки, однако даже такой охват выглядит впечатляюще для открытой модели.
Линейка включает три версии: 4B, 12B и 27B параметров. В официальных бенчмарках Google показывает, что версия на 12B превосходит базовую Gemma 3 на 27B именно в задачах перевода. При этом компания в основном сравнивает новинку с собственными моделями, а не с классическими специализированными решениями вроде NLLB, поэтому реальное положение TranslateGemma на рынке еще предстоит оценить.
Веса уже доступны на Hugging Face и Kaggle. Версия на 12B выглядит как «золотая середина» по соотношению качества и ресурсов, но для максимального уровня перевода старшая модель все равно потребует железо уровня H100.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!