Команда PRIME-RL представила новую серию моделей P1, обученных с использованием многоступенчатого усиленного обучения и специализированной системы агентов PhysicsMinions. Главная модель P1‑235B‑A22B стала первой открытой моделью, которая сумела достичь золотого уровня на IPhO 2025, что ранее считалось достижением исключительно закрытых моделей. На основе HiPhO - бенчмарка, объединяющего 13 международных олимпиад по физике, P1‑235B‑A22B набрала 38.4 балла в среднем, уверенно обойдя такие модели, как Gemini‑2.5‑Pro и GPT‑5.
Меньшая версия модели, P1‑30B‑A3B, также продемонстрировала впечатляющие результаты: серебро на IPhO с 18.5 баллами из 30 и 8 золотых и 4 серебряных медали на других международных конкурсах. Эти показатели показывают, что даже компактные модели P1 могут успешно решать задачи на уровне топовых олимпиадников.
Важно отметить, что P1 демонстрирует отличную генерализацию не только в физике, но и в других STEM-направлениях. Модель успешно справляется с математикой, программированием и рядом интеллектуальных тестов, существенно опережая базовые версии Qwen3 и другие открытые модели в этих дисциплинах.
Теперь любой исследователь или разработчик может скачать модели P1 и использовать их для экспериментов, разработки новых алгоритмов и проведения образовательных проектов.
Впереди остаются вопросы о том, как такие модели будут применяться в долгосрочной перспективе. Можно ли их использовать для автоматизации научных исследований, разработки новых теорий или даже в инженерных задачах? Что думаете вы?
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!