Un equipo de científicos informáticos del Computer Poker Research Group de la Universidad de Alberta está capturando una vez más la fascinación colectiva del mundo con la inteligencia artificial. En un resultado histórico para la floreciente comunidad de investigación de IA, el equipo, que incluye investigadores de la Universidad de Charles enPraga y Universidad Técnica Checa: ha desarrollado un sistema de inteligencia artificial llamado DeepStack que derrotó a los jugadores profesionales de póker en diciembre de 2016. Los hallazgos históricos acaban de publicarse en Ciencia
DeepStack cierra la brecha entre los enfoques utilizados para juegos de información perfecta, como los utilizados en las damas, el ajedrez y el Go, con los utilizados para juegos de información imperfecta, razonando mientras juega usando la "intuición" perfeccionada a través del aprendizaje profundo para reevaluarsu estrategia con cada decisión.
"El póker ha sido un problema de desafío de larga data en inteligencia artificial", dice Michael Bowling, profesor de la Facultad de Ciencias de la Universidad de Alberta e investigador principal del estudio. "Es el juego por excelencia de información imperfecta en el sentido de que los jugadoresno tienen la misma información ni comparten la misma perspectiva mientras juegan "
No deje que el nombre lo engañe: los juegos de información imperfecta son un asunto serio. Estos "juegos" son un modelo matemático general que describe cómo interactúan los encargados de tomar decisiones. La investigación de inteligencia artificial tiene una historia histórica de uso de juegos de salón para estudiar estos modelos, pero la atención se ha centrado principalmente en juegos de información perfectos. "Necesitamos nuevas técnicas de inteligencia artificial que puedan manejar casos en los que los tomadores de decisiones tengan diferentes perspectivas", dice Bowling, explicando que el desarrollo de técnicas para resolver juegos de información imperfecta tendrá aplicaciones mucho más allá del póker.mesa.
"Piensa en cualquier problema del mundo real. Todos tenemos una perspectiva ligeramente diferente de lo que está sucediendo, al igual que cada jugador solo conoce sus propias cartas en un juego de póker". Las aplicaciones inmediatas incluyen recomendaciones sólidas de tratamiento médico, planificación estratégica de defensay negociación.
Este último descubrimiento se basa en un conjunto ya impresionante de hallazgos de investigación sobre inteligencia artificial y juegos de información imperfecta que se remonta a la creación del Grupo de Investigación de Poker de Computadora de la Universidad de Alberta en 1996. Bowling, quien se convirtió en el investigador principal del grupo en 2006,ha llevado al grupo a varios hitos para la inteligencia artificial. Él y sus colegas desarrollaron Polaris en 2008, superando a los mejores jugadores de póker en el Texas Head'em Poker con límite heads-up. Luego pasaron a resolver el Hold'em limit Hold-Em con Cepheus, publicado en 2015 en ciencia .
DeepStack extiende la capacidad de pensar acerca de cada situación durante el juego, que ha tenido un éxito famoso en juegos como damas, ajedrez y Go, a juegos de información imperfecta usando una técnica llamada resolución continua. Esto permite que DeepStack determine elestrategia correcta para una situación particular de póker sin pensar en todo el juego utilizando su "intuición" para evaluar cómo podría desarrollarse el juego en el futuro cercano.
"Entrenamos nuestro sistema para aprender el valor de las situaciones", dice Bowling. "Cada situación en sí es un mini juego de póker. En lugar de resolver un gran juego de póker, resuelve millones de estos pequeños juegos de póker, cada uno ayudando al sistemapara refinar su intuición de cómo funciona el juego de póker. Y esta intuición es el combustible detrás de cómo DeepStack juega el juego completo ".
Pensar en cada situación a medida que se presenta es importante para problemas complejos como el heads-up sin límite hold'em, que tiene situaciones mucho más únicas que los átomos en el universo, en gran parte debido a la capacidad de los jugadores para apostar diferentes cantidades, incluyendoel dramático "all-in". A pesar de la complejidad del juego, DeepStack actúa a la velocidad humana, con un promedio de solo tres segundos de tiempo de "pensamiento", y se ejecuta en una simple computadora portátil para juegos con una unidad de procesamiento de gráficos Nvidia.
Para probar el enfoque, DeepStack jugó contra un grupo de jugadores de póker profesionales en diciembre de 2016, reclutados por la Federación Internacional de Póker. Se reclutaron treinta y tres jugadores de 17 países, y se pidió a cada uno que jugara un partido de 3000 manos duranteun período de cuatro semanas. DeepStack venció a cada uno de los 11 jugadores que terminaron su partido, con solo uno fuera del margen de significación estadística, convirtiéndolo en el primer programa de computadora en vencer a jugadores profesionales en el póquer heads-up sin límite Texas Hold'em.
Fuente de la historia :
Materiales proporcionado por Universidad de Alberta . Original escrito por Jennifer Pascoe. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :