Noticias de ciencia

de organizaciones de investigación

Usando historias para enseñar valores humanos a agentes artificiales

Fecha :: 12 de febrero de 2016
Fuente :: Instituto de Tecnología de Georgia
Resumen :: La técnica de inteligencia artificial Quixote enseña la 'alineación de valores' a los robots al entrenarlos para leer historias, aprender secuencias aceptables de eventos y comprender formas exitosas de comportarse en las sociedades humanas.
Compartir :

HISTORIA COMPLETA

El rápido ritmo de la inteligencia artificial IA ha generado temores sobre si los robots podrían actuar de manera poco ética o si pronto elegirían dañar a los humanos. Algunos piden prohibiciones en la investigación de robótica; otros piden más investigación para comprender cómo se puede limitar la IA.Pero, ¿cómo pueden los robots aprender un comportamiento ético si no hay un "manual de usuario" para ser humano?

anuncio

Los investigadores Mark Riedl y Brent Harrison de la Escuela de Computación Interactiva del Instituto de Tecnología de Georgia creen que la respuesta está en "Quijote", que se dará a conocer en la Conferencia AAAI-16 en Phoenix, Arizona 12-17 de febrero, 2016. Quijote enseña "alineación de valores" a los robots al entrenarlos para leer historias, aprender secuencias aceptables de eventos y comprender formas exitosas de comportarse en las sociedades humanas.

"Las historias recopiladas de diferentes culturas enseñan a los niños cómo comportarse de manera socialmente aceptable con ejemplos de comportamiento apropiado e inapropiado en fábulas, novelas y otra literatura", dice Riedl, profesor asociado y director del Entertainment Intelligence Lab. "CreemosLa comprensión de la historia en los robots puede eliminar el comportamiento de aparición psicótica y reforzar las elecciones que no dañarán a los humanos y aún así alcanzarán el propósito deseado ".

El Quijote es una técnica para alinear los objetivos de una IA con los valores humanos al otorgar recompensas por el comportamiento socialmente apropiado. Se basa en la investigación previa de Riedl, el sistema Scheherazade, que demostró cómo la inteligencia artificial puede reunir una secuencia correcta de acciones mediante una historia de crowdsourcingtramas de Internet.

Scheherazade aprende qué es un gráfico de trama normal o "correcto". Luego pasa esa estructura de datos a Quijote, que la convierte en una "señal de recompensa" que refuerza ciertos comportamientos y castiga otros comportamientos durante el aprendizaje de prueba y error.En esencia, Quijote aprende que será recompensado cada vez que actúe como el protagonista de una historia en lugar de al azar o como el antagonista.

Por ejemplo, si un robot tiene la tarea de recoger una receta para un humano lo más rápido posible, el robot podría a robar la farmacia, tomar el medicamento y correr;b interactuar educadamente con los farmacéuticos, o c esperar en la cola.Sin una alineación de valores y un refuerzo positivo, el robot aprendería que robar es la forma más rápida y económica de realizar su tarea.Con la alineación de valores de Quijote, el robot sería recompensado por esperar pacientemente en línea y pagar la receta.

Riedl y Harrison demuestran en su investigación cómo se puede producir una señal de recompensa alineada con el valor para descubrir todos los pasos posibles en un escenario dado, mapearlos en un árbol de trayectoria de la trama, que luego es utilizado por el agente robótico para hacer "elecciones de la trama"similar a lo que los humanos podrían recordar como una novela de Choose-Your-Own-Adventure y recibir recompensas o castigos en función de su elección.

La técnica Quijote es mejor para los robots que tienen un propósito limitado pero que necesitan interactuar con los humanos para lograrlo, y es un primer paso primitivo hacia el razonamiento moral general en IA, dice Riedl.

"Creemos que la IA tiene que ser inculturada para adoptar los valores de una sociedad en particular, y al hacerlo, se esforzará por evitar un comportamiento inaceptable", agrega. "Dar a los robots la capacidad de leer y comprender nuestras historias puede serel medio más conveniente en ausencia de un manual de usuario humano "

Este proyecto realizado fue o está patrocinado por la Agencia de Proyectos de Investigación Avanzada de Defensa de EE. UU. DARPA con la subvención # D11AP00270 y la Oficina de Investigación Naval ONR con la subvención # N00014-14-1-0003. Cualquier opinión, hallazgo yLas conclusiones o recomendaciones expresadas en este material son las del autor es y no reflejan necesariamente la opinión de DARPA o la ONR.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Instituto de Tecnología de Georgia . Nota: El contenido puede ser editado por estilo y longitud.

Cita esta página :

Instituto de Tecnología de Georgia. "Uso de historias para enseñar valores humanos a agentes artificiales". ScienceDaily. ScienceDaily, 12 de febrero de 2016. .

Instituto de Tecnología de Georgia. 12 de febrero de 2016. Uso de historias para enseñar valores humanos a agentes artificiales. ScienceDaily . Recuperado el 21 de julio de 2020 de www.science-things.com/releases/2016/02/160212200239.htm

Instituto de Tecnología de Georgia. "Uso de historias para enseñar valores humanos a agentes artificiales". ScienceDaily. Www.science-things.com/releases/2016/02/160212200239.htm consultado el 21 de julio de 2020.

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Usando historias para enseñar valores humanos a agentes artificiales

1

2

3

4

5

1

2

3

4

5

Nueva investigación de la luz más antigua confirma la edad del universo

Los científicos proponen un plan para determinar si el Planeta Nueve es un agujero negro primordial

Las primeras imágenes del Orbitador Solar revelan 'fogatas' en el sol

Prueba de sangre innovadora detecta el resultado positivo de COVID-19 en 20 minutos

El mejor material para las mascarillas caseras puede ser una combinación de dos telas

Los mejores y peores materiales para máscaras

Creado 'neurotransistor artificial'

Robot Jaws muestra que el chicle medicado podría ser el futuro

prediciendo su personalidad a partir de los datos de su teléfono inteligente

Los científicos descubren que los volcanes en Venus todavía están activos

¿Podrían las mini-Neptunas ser planetas oceánicos irradiados?

Separando ráfagas de rayos gamma: los estudiantes hacen un avance crítico

Misterio Ultrafrío: Resuelto

Excitación cuántica encontrada en material magnético Van Der Waals NiPS3

Platón tenía razón. La Tierra está hecha, en promedio, de cubos

El dispositivo atomtrónico podría sondear el límite entre los mundos cuánticos y cotidianos

Los cristales 'parpadeantes' pueden convertir CO2 en combustibles

Una GoPro para escarabajos: los investigadores crean una mochila con cámara robótica para insectos