Модель o3 від OpenAI розгромила Grok Ілона Маска в шаховому турнірі

11:09, 10.08.2025

Модель o3 від OpenAI перемогла модель Grok 4, розроблену компанією xAI, з рахунком 4:0 у фіналі шахового турніру Kaggle AI Exhibition, повідомляє The Independent. У змаганні також брали участь інші моделі ШІ від Anthropic, DeepSeek, Google і Moonshot AI. Фінальний поєдинок набув особливого значення на тлі вкрай напружених відносин співзасновників OpenAI Сема Альтмана (Sam Altman) та Ілона Маска (Elon Musk), який після відходу з OpenAI спробував придбати компанію.

У фіналі турніру модель o3 продемонструвала бездоганну гру, вигравши всі чотири партії у Grok 4. Обидві системи пройшли до фіналу, здолавши конкурентів на попередніх етапах. У відповідь на поразку Grok 4 в шахах Маск заявив, що ігрова здатність моделі є «додатковим ефектом» і не була пріоритетом при її розробці.

Здатність комп'ютерів обігравати найкращих шахістів світу відома з 1997 року, коли суперкомп'ютер IBM Deep Blue переміг Гаррі Каспарова. Пізніше компанія Google DeepMind створила ШІ-модель, здатну самостійно навчатися грі в шахи та го. Однак новий турнір став першим великим змаганням, де тестувалися великі мовні моделі (LLM), подібні до ChatGPT.

Генеральний директор і співзасновник Take Take Take Матс Андре Крістіансен (Mats Andr? Kristiansen) зазначив, що, хоча в 1990-х матч Каспарова проти Deep Blue став гучною подією, ключова цінність нинішнього турніру полягає в дослідженні того, як сучасні моделі ШІ міркують і приймають рішення.

Цікаво, що в липні чинний чемпіон світу з шахів Магнус Карлсен (Magnus Carlsen) переміг ChatGPT в онлайн-матчі, не втративши жодної фігури. Коментуючи фінал між Grok і o3, Карлсен оцінив шаховий рейтинг Grok приблизно в 800 пунктів, а модель o3 в 1200. Для порівняння, його власний рейтинг на піку становить 2882 пункти. Відповідаючи на питання користувача в соцмережі X, сам Grok оцінив свій рівень в діапазоні від 1600 до 1800.

Обговорення новини

Коментариев пока никто не оставил. Станьте первым!

Попередні новини

Netflix зізналася, що почала використовувати ШІ при створенні серіалів20:52 18.07.2025

Netflix повідомила, що під час створення візуальних ефектів для одного зі своїх оригінальних серіалів використовувався генеративний штучний інтелект. Це допомогло прискорити роботу над проєктом і заощадити кошти.

У ChatGPT з'явиться онлайн-шопінг - OpenAI почне заробляти на комісіях із замовлень20:37 16.07.2025

OpenAI планує впровадити в ChatGPT систему для купівлі різних товарів онлайн, яка дасть змогу оформляти замовлення без переходу на сайти самих інтернет-магазинів. Продавці, які приймають замовлення через ChatGPT, платитимуть компанії комісію за кожну транзакцію.

Google почала тестувати нову панель пошуку в Chrome з акцентом на ШІ20:59 15.07.2025

Нова вкладка Chrome скоро може виглядати інакше. У бета-версії для Android Google тестує оновлений дизайн пошукового рядка, де кнопка ШІ-режиму (AI Mode) посяде більш помітне місце.