La investigación de la teoría de juegos del Ejército de EE. UU. Que utiliza inteligencia artificial puede ayudar a tratar el cáncer y otras enfermedades, mejorar la ciberseguridad, desplegar soldados y activos de manera más eficiente e incluso ganar un juego de póker.
Nueva investigación, publicada en ciencia y realizado por científicos de la Universidad Carnegie Mellon, desarrolló un programa de inteligencia artificial llamado Pluribus que derrotó a los profesionales líderes en el póquer Texas Hold'em sin límite para seis jugadores.
El Ejército y la Fundación Nacional de Ciencias financiaron la parte de modelado matemático de la investigación, mientras que la financiación de Facebook fue específica para el póker.
"Se trata de estrategia", dijo el Dr. Purush Iyer, jefe de división, ciencias de la red en la Oficina de Investigación del Ejército, un elemento del Laboratorio de Investigación del Ejército del Comando de Desarrollo de Capacidades de Combate del Ejército de los Estados Unidos. "Un factor limitante en la teoría de juegos siempre ha sidoescalabilidad es decir, la capacidad de lidiar con un espacio de estado que aumenta exponencialmente. El póker es un ejemplo accesible para mostrar cómo estos modelos matemáticos se pueden utilizar para diseñar estrategias para situaciones en las que una persona no tiene información completa, no saben quélos adversarios harán y cuáles son sus capacidades "
Esta investigación es extremadamente relevante para muchos desafíos militares y del mundo real que involucran a múltiples partes, como la seguridad cibernética y la postura de defensa, dijo.
El póker ha sido un desafío de IA porque es un juego de información incompleto, donde los jugadores no pueden estar seguros de qué cartas están en juego y los oponentes pueden, y lo harán, farolear, al igual que la estrategia militar.
"Hasta ahora, los hitos de la IA sobrehumana en el razonamiento estratégico se han limitado a la competencia de dos partes", dijo el Dr. Tuomas Sandholm, Profesor de Ciencias Computacionales de Angel Jordan, quien desarrolló Pluribus con Noam Brown, quien está terminando su doctorado en Carnegie Mellon'sEl Departamento de Ciencias de la Computación como científico investigador en Facebook AI ". La capacidad de vencer a otros cinco jugadores en un juego tan complicado abre nuevas oportunidades para usar la inteligencia artificial para resolver una amplia variedad de problemas del mundo real".
"Jugar un juego de seis jugadores en lugar de enfrentarse cara a cara requiere cambios fundamentales en cómo la IA desarrolla su estrategia de juego", dijo Brown, quien se unió a Facebook AI el año pasado.
Pluribus prescinde de las garantías teóricas de éxito y, sin embargo, desarrolla estrategias que le permiten superar constantemente a los oponentes. Pluribus primero calcula una estrategia de planos jugando seis copias de sí mismo, que es suficiente para la primera ronda de apuestas. A partir de ese momento, Pluribusrealiza una búsqueda más detallada de posibles movimientos en una abstracción más precisa del juego. Mira hacia adelante varios movimientos a medida que lo hace, pero no requiere mirar hacia el final del juego, lo que sería computacionalmente prohibitivo.la búsqueda anticipada es un enfoque estándar en los juegos de información perfecta, pero es extremadamente desafiante en los juegos de información imperfecta. Un nuevo algoritmo de búsqueda anticipada limitada es el avance principal que permitió a Pluribus lograr el póker multijugador sobrehumano.
El software también busca ser impredecible. Por ejemplo, las apuestas tendrían sentido si la IA tuviera la mejor mano posible, pero si la IA apuesta solo cuando tiene la mejor mano, los oponentes se darán cuenta rápidamente. Entonces Pluribus calcula cómoactuaría con todas las manos posibles que pudiera sostener y luego calcularía una estrategia equilibrada en todas esas posibilidades.
Con fondos del Ejército, Sandholm y algunos de sus otros estudiantes están desarrollando técnicas relacionadas para la dirección biológica, donde los investigadores están calculando planes de tratamiento óptimos que dirigen el sistema inmunitario del paciente para combatir mejor los cánceres, las enfermedades autoinmunes, las infecciones, etc.
La Administración de Seguridad del Transporte, la Guardia Costera de los EE. UU. Y el Tren del Metro de Los Ángeles están utilizando la investigación anterior sobre teoría de juegos financiada por el Ejército para programar los recursos de una manera que disminuya el costo para las organizaciones que garantizan la seguridad al tiempo que aumentan los costos para unadversario, reduciendo así las posibilidades de ataques.
Además, la investigación fundacional financiada por el Ejército en teoría algorítmica de juegos se ha utilizado en la sociedad civil para reducir la caza furtiva de elefantes en el bosque de la Reina Isabel, Uganda y tigres en el sudeste asiático, así como para abordar la falta de vivienda e implementar campañas de prevención del VIH enLos Angeles.
"El trabajo de investigación del Dr. Sandholm y otros se utilizará en una variedad de formas en un futuro no muy lejano para abordar los problemas sociales de una manera rentable", dijo Iyer. "El trabajo del Dr. Sandholm es unemocionante avance en la teoría de juegos; las aplicaciones son enormes "
El Laboratorio de Investigación del Ejército de CCDC ARL es un elemento del Comando de Desarrollo de Capacidades de Combate del Ejército de los EE. UU. Como laboratorio de investigación corporativa del Ejército, ARL descubre, innova y transita la ciencia y la tecnología para garantizar el poder de la tierra estratégica dominante. A través de la colaboración a través del comandoCCDC lidera el descubrimiento, el desarrollo y la entrega de las capacidades tecnológicas necesarias para hacer que los soldados sean más letales para ganar las guerras de nuestra nación y volver a casa de manera segura. CCDC es un comando subordinado importante del Comando de Futuros del Ejército de los EE. UU.
Fuente de la historia :
Materiales proporcionado por Laboratorio de investigación del ejército de EE. UU. . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :