Noticias de ciencia

de organizaciones de investigación

El programa de IA de póquer primero en vencer a los profesionales en Texas Hold'em sin límite

Fecha :: 2 de marzo de 2017
Fuente :: Universidad de Alberta
Resumen :: Un equipo de científicos informáticos está capturando una vez más la fascinación colectiva del mundo con la inteligencia artificial. En un resultado histórico para la floreciente comunidad de investigación de IA, el equipo ha desarrollado un sistema de IA llamado DeepStack que derrotó a los jugadores profesionales de póker en diciembre de 2016.
Compartir :

HISTORIA COMPLETA

Un equipo de científicos informáticos del Computer Poker Research Group de la Universidad de Alberta está capturando una vez más la fascinación colectiva del mundo con la inteligencia artificial. En un resultado histórico para la floreciente comunidad de investigación de IA, el equipo, que incluye investigadores de la Universidad de Charles enPraga y Universidad Técnica Checa: ha desarrollado un sistema de inteligencia artificial llamado DeepStack que derrotó a los jugadores profesionales de póker en diciembre de 2016. Los hallazgos históricos acaban de publicarse en Ciencia

anuncio

DeepStack cierra la brecha entre los enfoques utilizados para juegos de información perfecta, como los utilizados en las damas, el ajedrez y el Go, con los utilizados para juegos de información imperfecta, razonando mientras juega usando la "intuición" perfeccionada a través del aprendizaje profundo para reevaluarsu estrategia con cada decisión.

"El póker ha sido un problema de desafío de larga data en inteligencia artificial", dice Michael Bowling, profesor de la Facultad de Ciencias de la Universidad de Alberta e investigador principal del estudio. "Es el juego por excelencia de información imperfecta en el sentido de que los jugadoresno tienen la misma información ni comparten la misma perspectiva mientras juegan "

No deje que el nombre lo engañe: los juegos de información imperfecta son un asunto serio. Estos "juegos" son un modelo matemático general que describe cómo interactúan los encargados de tomar decisiones. La investigación de inteligencia artificial tiene una historia histórica de uso de juegos de salón para estudiar estos modelos, pero la atención se ha centrado principalmente en juegos de información perfectos. "Necesitamos nuevas técnicas de inteligencia artificial que puedan manejar casos en los que los tomadores de decisiones tengan diferentes perspectivas", dice Bowling, explicando que el desarrollo de técnicas para resolver juegos de información imperfecta tendrá aplicaciones mucho más allá del póker.mesa.

"Piensa en cualquier problema del mundo real. Todos tenemos una perspectiva ligeramente diferente de lo que está sucediendo, al igual que cada jugador solo conoce sus propias cartas en un juego de póker". Las aplicaciones inmediatas incluyen recomendaciones sólidas de tratamiento médico, planificación estratégica de defensay negociación.

Este último descubrimiento se basa en un conjunto ya impresionante de hallazgos de investigación sobre inteligencia artificial y juegos de información imperfecta que se remonta a la creación del Grupo de Investigación de Poker de Computadora de la Universidad de Alberta en 1996. Bowling, quien se convirtió en el investigador principal del grupo en 2006,ha llevado al grupo a varios hitos para la inteligencia artificial. Él y sus colegas desarrollaron Polaris en 2008, superando a los mejores jugadores de póker en el Texas Head'em Poker con límite heads-up. Luego pasaron a resolver el Hold'em limit Hold-Em con Cepheus, publicado en 2015 en ciencia .

DeepStack extiende la capacidad de pensar acerca de cada situación durante el juego, que ha tenido un éxito famoso en juegos como damas, ajedrez y Go, a juegos de información imperfecta usando una técnica llamada resolución continua. Esto permite que DeepStack determine elestrategia correcta para una situación particular de póker sin pensar en todo el juego utilizando su "intuición" para evaluar cómo podría desarrollarse el juego en el futuro cercano.

"Entrenamos nuestro sistema para aprender el valor de las situaciones", dice Bowling. "Cada situación en sí es un mini juego de póker. En lugar de resolver un gran juego de póker, resuelve millones de estos pequeños juegos de póker, cada uno ayudando al sistemapara refinar su intuición de cómo funciona el juego de póker. Y esta intuición es el combustible detrás de cómo DeepStack juega el juego completo ".

Pensar en cada situación a medida que se presenta es importante para problemas complejos como el heads-up sin límite hold'em, que tiene situaciones mucho más únicas que los átomos en el universo, en gran parte debido a la capacidad de los jugadores para apostar diferentes cantidades, incluyendoel dramático "all-in". A pesar de la complejidad del juego, DeepStack actúa a la velocidad humana, con un promedio de solo tres segundos de tiempo de "pensamiento", y se ejecuta en una simple computadora portátil para juegos con una unidad de procesamiento de gráficos Nvidia.

Para probar el enfoque, DeepStack jugó contra un grupo de jugadores de póker profesionales en diciembre de 2016, reclutados por la Federación Internacional de Póker. Se reclutaron treinta y tres jugadores de 17 países, y se pidió a cada uno que jugara un partido de 3000 manos duranteun período de cuatro semanas. DeepStack venció a cada uno de los 11 jugadores que terminaron su partido, con solo uno fuera del margen de significación estadística, convirtiéndolo en el primer programa de computadora en vencer a jugadores profesionales en el póquer heads-up sin límite Texas Hold'em.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Universidad de Alberta . Original escrito por Jennifer Pascoe. Nota: El contenido puede ser editado por estilo y longitud.

Referencia del diario :

Matej Moravčík y otros DeepStack: Inteligencia artificial de nivel experto en póker sin límite . ciencia , 2017 DOI: 10.1126 / science.aam6960

Cita esta página :

Universidad de Alberta. "El programa de IA de póquer primero en vencer a los profesionales en Texas Hold'em sin límite". ScienceDaily. ScienceDaily, 2 de marzo de 2017. .

Universidad de Alberta. 2017, 2 de marzo. El programa de IA de juego de póker primero en vencer a los profesionales en Texas Hold'em sin límite. ScienceDaily . Recuperado el 13 de julio de 2020 de www.science-things.com/releases/2017/03/170302143957.htm

Universidad de Alberta. "El programa de IA de póquer primero en vencer a los profesionales en Texas Hold'em sin límite". ScienceDaily. Www.science-things.com/releases/2017/03/170302143957.htm consultado el 13 de julio,2020.

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

El programa de IA de póquer primero en vencer a los profesionales en Texas Hold'em sin límite

1

2

3

4

5

1

2

3

4

5

Los niños rara vez transmiten COVID-19, los médicos escriben en nuevos comentarios

Estudio de toda la ciudad revela que más del 40% de las infecciones por COVID-19 no tenían síntomas

Los cerebros transgénero se parecen más a su género deseado desde una edad temprana

Sin claves para el reino: el nuevo algoritmo de inicio de sesión único proporciona una privacidad superior

Los trabajos de escritorio pueden ofrecer protección contra la mala cognición en la edad adulta

¿Por qué algunas palabras pueden ser más memorables que otras?

'¿Podría mi hijo tener autismo? Diez signos de posibles retrasos relacionados con el autismo en niños de 6 a 12 meses

Jugar con papá puede mejorar el autocontrol de los niños

Paso de tiempo distorsionado durante el bloqueo de COVID-19

Los investigadores prevén problemas lingüísticos durante los viajes espaciales

Teletransportación en la actuación musical en vivo

Niños engreídos: los niños de cuatro años con el mismo exceso de confianza que los banqueros que toman riesgos

La física que impulsa las recesiones económicas periódicas

Los nuevos algoritmos de aprendizaje automático ofrecen garantías de seguridad y equidad

La física cuántica proporciona una forma de ocultar la ignorancia

Para las aulas universitarias, ¿son los robots de telepresencia la mejor opción para estar allí?

Nueva herramienta convierte automáticamente las matemáticas en imágenes