o3 от OpenAI обошла Grok 4 от xAI

o3 от OpenAI обошла Grok 4 от xAI

ИИ-модель o3 от OpenAI выиграла Grok 4 от xAI в четырех шахматных партиях подряд и стала победителем турнира в рамках Game Arena от Google.

«Они как талантливый ребенок, который не знает, как двигаются фигуры», — описал игру искусственного интеллекта чемпион мира Магнус Карлсен.

На трехдневном турнире, который проходил с 5 по 7 августа, чат-боты общего назначения играли в шахматы. В рамках кампании ИИ не настраивали специальным образом — анализировались их возможности и знания, которые они получили из интернета.

Карлсен комментировал финал чемпионата. Он отметил, что обе модели играли на уровне случайных игроков, которые недавно выучили правила игры. Таким соответствует рейтинг около 800 ELO . Для сравнения, у гроссмейстера показатель составляет 2839.

В первом матче Grok отдал одну из важнейших фигур бесплатно, а затем только усугубил ситуацию похожими решениями.

Во второй игре он пытался применить стратегию «отравленной пешки», когда фигуру можно взять, но такое решение приведет к серьезным проблемам из-за заранее подготовленной тактики соперника. Однако ИИ съел не ту пешку, из-за чего его ферзь попал в ловушку.

В третьей игре Grok построил солидную позицию, однако в середине партии начал отдавать фигуры сопернику.

В четвертой и заключительной партии o3 допустил ошибку — потерял ферзя. Однако модели удалось его вернуть и одержать победу.

o3 от OpenAI обошла Grok 4 от xAI

Gemini от Google занял третье место, победив другую модель OpenAI.

o3 убрали из приложения ChatGPT с выходом GPT-5 . Теперь только последняя модель и ее «думающая» версия доступны пользователям.

Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду , чтобы не проиграть Stockfish в шахматы.

Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Bitcoin

Fortune представил рейтинг криптокомпаний Crypto 100

Издание Fortune опубликовало Fortune Crypto 100, рейтинг криптовалютных компаний по 10 категориям. Вместе с ним вышел Fortune Crypto Innovators 30, в нем собраны организации и проекты, которые продвигают индустрию. Из пресс-релиза следует, что создание рейтинга потребовало разработки отдельной методологии. В проекте приняла участие также компания Inca Digital. В Fortune подчеркнули, что проанализировали более 3000 организаций […]

Читать дальше
Bitcoin

Апелляционный суд оставил в силе приговор Сэму Бэнкману-Фриду

Апелляционный суд второго округа США отклонил попытку Сэма Бэнкмана-Фрида добиться нового процесса и отмены приговора по делу FTX. В 42-страничном постановлении коллегия из трех судей назвала доказательства обвинения убедительными. Суд также отверг довод защиты о том, что первая инстанция не позволила представить доказательства в пользу версии о достаточности средств FTX для выплат клиентам. Источник

Читать дальше
Bitcoin

Tether заморозила 72 млн USDT на адресе в сети Tron

Tether заморозила 72 млн USDT на адресе в сети Tron, сообщил Колин Ву со ссылкой на ончейн-детектива ZachXBT. По данным исследователя, 11 июня кошелек получил 120,2 млн USDT. ZachXBT связал адрес с крупными покупками Monero, после которых XMR вырос с $330 до $420. Он также указал, что с кошелька вывели более $12 млн на депозитные […]

Читать дальше