o3 от OpenAI обошла Grok 4 от xAI

o3 от OpenAI обошла Grok 4 от xAI

ИИ-модель o3 от OpenAI выиграла Grok 4 от xAI в четырех шахматных партиях подряд и стала победителем турнира в рамках Game Arena от Google.

«Они как талантливый ребенок, который не знает, как двигаются фигуры», — описал игру искусственного интеллекта чемпион мира Магнус Карлсен.

На трехдневном турнире, который проходил с 5 по 7 августа, чат-боты общего назначения играли в шахматы. В рамках кампании ИИ не настраивали специальным образом — анализировались их возможности и знания, которые они получили из интернета.

Карлсен комментировал финал чемпионата. Он отметил, что обе модели играли на уровне случайных игроков, которые недавно выучили правила игры. Таким соответствует рейтинг около 800 ELO . Для сравнения, у гроссмейстера показатель составляет 2839.

В первом матче Grok отдал одну из важнейших фигур бесплатно, а затем только усугубил ситуацию похожими решениями.

Во второй игре он пытался применить стратегию «отравленной пешки», когда фигуру можно взять, но такое решение приведет к серьезным проблемам из-за заранее подготовленной тактики соперника. Однако ИИ съел не ту пешку, из-за чего его ферзь попал в ловушку.

В третьей игре Grok построил солидную позицию, однако в середине партии начал отдавать фигуры сопернику.

В четвертой и заключительной партии o3 допустил ошибку — потерял ферзя. Однако модели удалось его вернуть и одержать победу.

o3 от OpenAI обошла Grok 4 от xAI

Gemini от Google занял третье место, победив другую модель OpenAI.

o3 убрали из приложения ChatGPT с выходом GPT-5 . Теперь только последняя модель и ее «думающая» версия доступны пользователям.

Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду , чтобы не проиграть Stockfish в шахматы.

Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Bitcoin

Amazon MGM отказалась от фильма о кризисе в OpenAI

Amazon MGM Studios отказалась от планов выпустить фильм Artificial Луки Гуаданьино о кризисе в OpenAI и увольнении Сэма Альтмана 17 ноября 2023 года. Тогда, через пять дней после отставки, он вернулся на пост CEO компании. В Amazon заявили, что картина лучше подойдет для релиза другой студией, и теперь ищут ей «новый дом». Решение приняли спустя […]

Читать дальше
Bitcoin

Почему Сенат США запретил ФРС выпускать цифровой доллар до 2030 года

Сенат США одобрил законопроект, включающий запрет на выпуск цифрового доллара Федеральной резервной системой (ФРС) до 2030 года. За проголосовали 85 сенаторов, пятеро — против. Документ еще должен пройти Палату представителей и получить подпись президента Дональда Трампа. Контекст решения Запрет на CBDC включен в законопроект о доступном жилье 21st Century ROAD to Housing Act — нетипичный […]

Читать дальше
Bitcoin

Адам Бэк: Биткоин может достичь $1 млн к 2028 году

Генеральный директор Blockstream и один из ранних сторонников биткоина Адам Бек заявил, что первая криптовалюта может подорожать до $500 000-$1 млн уже к завершению текущего цикла халвинга, то есть к 2028 году. https://x.com/WuBlockchain/status/2069164523760566296 По его словам, для такого рыночного сценария не обязательно нужны новые мощные катализаторы. «Не так уж и много. Думаю, сами рыночные механизмы […]

Читать дальше