
Модель o3 від OpenAI перемогла модель Grok 4, розроблену компанією xAI, з рахунком 4:0 у фіналі шахового турніру Kaggle AI Exhibition, повідомляє The Independent. У змаганні також брали участь інші моделі ШІ від Anthropic, DeepSeek, Google і Moonshot AI. Фінальний поєдинок набув особливого значення на тлі вкрай напружених відносин співзасновників OpenAI Сема Альтмана (Sam Altman) та Ілона Маска (Elon Musk), який після відходу з OpenAI спробував придбати компанію.
У фіналі турніру модель o3 продемонструвала бездоганну гру, вигравши всі чотири партії у Grok 4. Обидві системи пройшли до фіналу, здолавши конкурентів на попередніх етапах. У відповідь на поразку Grok 4 в шахах Маск заявив, що ігрова здатність моделі є «додатковим ефектом» і не була пріоритетом при її розробці.
Здатність комп'ютерів обігравати найкращих шахістів світу відома з 1997 року, коли суперкомп'ютер IBM Deep Blue переміг Гаррі Каспарова. Пізніше компанія Google DeepMind створила ШІ-модель, здатну самостійно навчатися грі в шахи та го. Однак новий турнір став першим великим змаганням, де тестувалися великі мовні моделі (LLM), подібні до ChatGPT.
Генеральний директор і співзасновник Take Take Take Матс Андре Крістіансен (Mats Andr? Kristiansen) зазначив, що, хоча в 1990-х матч Каспарова проти Deep Blue став гучною подією, ключова цінність нинішнього турніру полягає в дослідженні того, як сучасні моделі ШІ міркують і приймають рішення.
Цікаво, що в липні чинний чемпіон світу з шахів Магнус Карлсен (Magnus Carlsen) переміг ChatGPT в онлайн-матчі, не втративши жодної фігури. Коментуючи фінал між Grok і o3, Карлсен оцінив шаховий рейтинг Grok приблизно в 800 пунктів, а модель o3 в 1200. Для порівняння, його власний рейтинг на піку становить 2882 пункти. Відповідаючи на питання користувача в соцмережі X, сам Grok оцінив свій рівень в діапазоні від 1600 до 1800.