Искусственный интеллект впервые обыграл пятерых чемпионов в покер

На это достижение у ученых ушло более двух лет.

12 июл
Мария Азарова
Комментариев: 0

Добавить в закладки 

https%3A%2F%2Fnaked-science.ru%2Farticle%2Fsci%2Fiskusstvennyy-intellekt-vpervye
0
0

Обсудить 0 комм.
3 235

Выбор редакции

10 самых маленьких стран в мире

В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов.

 

Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы — Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, «сидя» с ними всеми за одним столом, прямо как в традиционных казино. О разработке ученых пишет журнал Science.

 

Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру.

 

Авторы Pluribus оснастили его «абстрактным действием» и «абстрактной информацией» — так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения. Во время тестов Pluribus, используя метод самообучения и систему «минимизации сожалений» (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад. Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре.

 

Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ.

 

Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов. В итоге с помощью своей уникальной и в чем-то «парадоксальной» стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов.

 

«Главный плюс Pluribus — способность совмещать разные стратегии. Это то, к чему идут профессиональные игроки в покер. Мало у кого получается менять тактику случайным образом и оставаться в плюсе. Почти все люди не справляются с такой задачей», — рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ.

 

А если вы хотите понять, что движет любителями игр и к чему может привести эта страсть, — прочитайте наш большой материал о психологии азарта.

Источник: naked-science.ru

Вы можете оставить комментарий, или ссылку на Ваш сайт.