Сайт Tracking AI обновил рейтинг ИИ по уровню IQ: первое место в нем теперь делят GPT-5.2 Thinking и Gemini 3 Pro. Интересно, что модели OpenAI и Google показали одинаковое количество очков в обоих тестах: классическом тестировании Mensa Norway (141 очко) и оффлайн-тесте (127 очков).
Mensa Norway — это публичный онлайн-тест из 35 задач на закономерности, средний показатель для человека в нем составляет 100 очков. Но так как задачи открытые, то высока вероятность, что они попали в обучающие дата-сеты моделей. Поэтому авторы сайта создали оффлайн-тест — он состоит из похожих задач, доступ к которым закрыт.
Многие модели проходят тест в двух режимах: в Vision они сами "рассматривают" условия задачи, а в обычном — им их описывают текстом. Это позволяет сравнивать уровень мультимодальных способностей ИИ.
Другое интересное наблюдение — в оффлайн-тесте GPT-5.2 Thinking обошла более мощный и дорогой вариант GPT-5 Pro. Однако Pro-версия отыгралась в классическом Mensa Norway, но, как я писал выше, это может значить лишь то, что модель лучше на него обучена. Неожиданно высокий уровень показала чат-версия GPT-5.2, без режима рассуждений — 120 баллов, что равно результату Claude Opus 4.5.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.