La inteligencia artificial ha llegado a nuestra vida cotidiana, desde los motores de búsqueda hasta los automóviles autónomos. Esto tiene que ver con la enorme potencia informática que ha estado disponible en los últimos años. Pero los nuevos resultados de la investigación de IA ahora muestran que más simple, más pequeñoLas redes neuronales se pueden usar para resolver ciertas tareas de manera aún mejor, más eficiente y más confiable que nunca.
Un equipo de investigación internacional de TU Wien Viena, IST Austria y MIT EE. UU. Ha desarrollado un nuevo sistema de inteligencia artificial basado en los cerebros de animales diminutos, como lombrices intestinales. Este novedoso sistema de inteligencia artificial puede controlar un vehículo con soloalgunas neuronas artificiales. El equipo dice que el sistema tiene ventajas decisivas sobre los modelos de aprendizaje profundo anteriores: se adapta mucho mejor a la entrada ruidosa y, debido a su simplicidad, su modo de funcionamiento se puede explicar en detalle. No tiene que serconsiderado como una "caja negra" compleja, pero que puede ser entendido por los humanos. Este nuevo modelo de aprendizaje profundo se ha publicado ahora en la revista Inteligencia natural de la máquina .
Aprendiendo de la naturaleza
Similar a los cerebros vivos, las redes neuronales artificiales consisten en muchas células individuales. Cuando una célula está activa, envía una señal a otras células. Todas las señales recibidas por la siguiente célula se combinan para decidir si esta célula también se activará.La forma en que una célula influye en la actividad de la siguiente determina el comportamiento del sistema; estos parámetros se ajustan en un proceso de aprendizaje automático hasta que la red neuronal puede resolver una tarea específica.
"Durante años, hemos estado investigando lo que podemos aprender de la naturaleza para mejorar el aprendizaje profundo", dice el profesor Radu Grosu, jefe del grupo de investigación "Cyber-Physical Systems" en TU Wien. "El nematodo C. elegans,por ejemplo, vive su vida con una cantidad asombrosamente pequeña de neuronas y aún muestra patrones de comportamiento interesantes. Esto se debe a la forma eficiente y armoniosa en que el sistema nervioso del nematodo procesa la información ".
"La naturaleza nos muestra que todavía hay mucho margen de mejora", dice la profesora Daniela Rus, directora del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT CSAIL. "Por lo tanto, nuestro objetivo era reducir enormemente la complejidad y mejorar la interpretabilidad demodelos de redes neuronales. "
"Inspirándonos en la naturaleza, desarrollamos nuevos modelos matemáticos de neuronas y sinapsis", dice el profesor Thomas Henzinger, presidente de IST Austria.
"El procesamiento de las señales dentro de las células individuales sigue principios matemáticos diferentes a los modelos de aprendizaje profundo anteriores", dice el Dr. Ramin Hasani, asociado postdoctoral en el Instituto de Ingeniería Informática, TU Wien y MIT CSAIL. "Además, nuestras redes sonmuy escasa: esto significa que no todas las células están conectadas a todas las demás. Esto también simplifica la red ".
mantenimiento de carril autónomo
Para probar las nuevas ideas, el equipo eligió una tarea de prueba particularmente importante: los autos autónomos que permanecen en su carril. La red neuronal recibe imágenes de la cámara de la carretera como entrada y debe decidir automáticamente si se debe conducir hacia la derecha o hacia la izquierda..
"Hoy en día, los modelos de aprendizaje profundo con muchos millones de parámetros se utilizan a menudo para aprender tareas complejas como la conducción autónoma", dice Mathias Lechner, ex alumno de TU Wien y estudiante de doctorado en IST Austria. "Sin embargo, nuestro nuevo enfoque nos permite reducirel tamaño de las redes en dos órdenes de magnitud. Nuestros sistemas solo utilizan 75.000 parámetros entrenables ".
Alexander Amini, estudiante de doctorado en MIT CSAIL explica que el nuevo sistema consta de dos partes: la entrada de la cámara se procesa primero mediante una llamada red neuronal convolucional, que solo percibe los datos visuales para extraer características estructurales de los píxeles entrantes.La red decide qué partes de la imagen de la cámara son interesantes e importantes, y luego pasa señales a la parte crucial de la red: un "sistema de control" que luego dirige el vehículo.
Ambos subsistemas se apilan juntos y se capacitan simultáneamente. Se recopilaron muchas horas de videos de tráfico de conducción humana en el área metropolitana de Boston y se introdujeron en la red, junto con información sobre cómo conducir el automóvil en cualquier situación determinada.hasta que el sistema haya aprendido a conectar automáticamente imágenes con la dirección de dirección adecuada y pueda manejar de forma independiente nuevas situaciones.
La parte de control del sistema denominada política de circuito neuronal o NCP, que traduce los datos del módulo de percepción en un comando de dirección, solo consta de 19 neuronas. Mathias Lechner explica que los NCP son hasta 3 órdenes de magnitud más pequeñosde lo que hubiera sido posible con modelos anteriores de última generación.
Causalidad e interpretabilidad
El nuevo modelo de aprendizaje profundo se probó en un vehículo autónomo real. "Nuestro modelo nos permite investigar en qué enfoca la red su atención mientras conduce. Nuestras redes se enfocan en partes muy específicas de la imagen de la cámara: la acera y el horizonte.Este comportamiento es muy deseable, y es único entre los sistemas de inteligencia artificial ", dice Ramin Hasani." Además, vimos que se puede identificar el papel de cada célula en cualquier decisión de conducción. Podemos entender la función de las células individuales y sucomportamiento. Alcanzar este grado de interpretabilidad es imposible para modelos de aprendizaje profundo más grandes.
robustez
"Para probar qué tan robustos son los NCP en comparación con modelos profundos anteriores, perturbamos las imágenes de entrada y evaluamos qué tan bien los agentes pueden lidiar con el ruido", dice Mathias Lechner. "Si bien esto se convirtió en un problema insuperable para otras redes neuronales profundas,nuestros NCP demostraron una fuerte resistencia a los artefactos de entrada. Este atributo es una consecuencia directa del nuevo modelo neuronal y la arquitectura ".
"La interpretabilidad y la robustez son las dos principales ventajas de nuestro nuevo modelo", dice Ramin Hasani. "Pero hay más: con nuestros nuevos métodos, también podemos reducir el tiempo de entrenamiento y la posibilidad de implementar IA en sistemas relativamente simples.Los NCP permiten el aprendizaje de imitación en una amplia gama de posibles aplicaciones, desde el trabajo automatizado en almacenes hasta la locomoción de robots. Los nuevos hallazgos abren nuevas e importantes perspectivas para la comunidad de IA: los principios de computación en sistemas nerviosos biológicos pueden convertirse en un gran recurso para crear altas-AI interpretable de rendimiento - como alternativa a los sistemas de aprendizaje automático de caja negra que hemos utilizado hasta ahora ".
Repositorio de códigos : http://github.com/mlech26l/keras-ncp
Fuente de la historia :
Materiales proporcionado por Instituto de Ciencia y Tecnología de Austria . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :