Los investigadores han demostrado que es posible entrenar redes neuronales artificiales directamente en un chip óptico. El avance significativo demuestra que un circuito óptico puede realizar una función crítica de una red neuronal artificial basada en electrónica y podría conducir a un costo menor, más rápido yformas más eficientes energéticamente para realizar tareas complejas como el reconocimiento de voz o imagen.
"El uso de un chip óptico para realizar cálculos de redes neuronales de manera más eficiente de lo que es posible con las computadoras digitales podría permitir la resolución de problemas más complejos", dijo el líder del equipo de investigación Shanhui Fan de la Universidad de Stanford. "Esto mejoraría la capacidad de las redes neuronales artificialespara realizar las tareas necesarias para los automóviles sin conductor o para formular una respuesta adecuada a una pregunta hablada, por ejemplo. También podría mejorar nuestras vidas de formas que no podemos imaginar ahora ".
Una red neuronal artificial es un tipo de inteligencia artificial que utiliza unidades conectadas para procesar información de manera similar a como el cerebro procesa la información. El uso de estas redes para realizar una tarea compleja, por ejemplo, reconocimiento de voz, requiere el paso crítico deentrenar los algoritmos para categorizar entradas, como diferentes palabras.
Aunque las redes neuronales artificiales ópticas se demostraron recientemente de forma experimental, el paso de entrenamiento se realizó utilizando un modelo en una computadora digital tradicional y la configuración final se importó al circuito óptico. óptica , la revista de la Sociedad Óptica para la investigación de alto impacto, los investigadores de la Universidad de Stanford informan un método para entrenar estas redes directamente en el dispositivo mediante la implementación de un análogo óptico del algoritmo de 'retropropagación', que es la forma estándar de entrenar redes neuronales convencionales.
"El uso de un dispositivo físico en lugar de un modelo de computadora para el entrenamiento hace que el proceso sea más preciso", dijo Tyler W. Hughes, primer autor del artículo. "Además, porque el paso del entrenamiento es una parte computacionalmente costosa de la implementación dela red neuronal, realizar este paso ópticamente es clave para mejorar la eficiencia computacional, la velocidad y el consumo de energía de las redes artificiales ".
una red basada en luz
Aunque el procesamiento de la red neuronal se realiza típicamente usando una computadora tradicional, hay esfuerzos significativos para diseñar hardware optimizado específicamente para la computación de la red neuronal. Los dispositivos basados en óptica son de gran interés porque pueden realizar cálculos en paralelo mientras usan menos energía que los dispositivos electrónicos.
En el nuevo trabajo, los investigadores superaron un desafío importante para implementar una red neuronal totalmente óptica al diseñar un chip óptico que replica la forma en que las computadoras convencionales entrenan redes neuronales.
Una red neuronal artificial puede considerarse como una caja negra con una serie de botones. Durante el paso de entrenamiento, estos botones se giran un poco y luego se prueba el sistema para ver si el rendimiento de los algoritmos mejoró.
"Nuestro método no solo ayuda a predecir en qué dirección girar las perillas, sino también cuánto debe girar cada perilla para acercarse al rendimiento deseado", dijo Hughes. "Nuestro enfoque acelera significativamente el entrenamiento, especialmente para redes grandes,porque obtenemos información sobre cada perilla en paralelo "
Entrenamiento en chip
El nuevo protocolo de entrenamiento opera en circuitos ópticos con divisores de haz sintonizables que se ajustan cambiando la configuración de los cambiadores de fase ópticos. Los rayos láser que codifican la información a procesar se disparan en el circuito óptico y son transportados por guías de onda ópticas a través de los divisores de haz, quese ajustan como perillas para entrenar los algoritmos de la red neuronal.
En el nuevo protocolo de entrenamiento, el láser se alimenta primero a través del circuito óptico. Al salir del dispositivo, se calcula la diferencia con el resultado esperado. Esta información se utiliza para generar una nueva señal de luz, que se envía de vuelta a través delred óptica en la dirección opuesta. Al medir la intensidad óptica alrededor de cada divisor de haz durante este proceso, los investigadores mostraron cómo detectar, en paralelo, cómo cambiará el rendimiento de la red neuronal con respecto a la configuración de cada divisor de haz.cambiar en función de esta información, y el proceso puede repetirse hasta que la red neuronal produzca el resultado deseado.
Los investigadores probaron su técnica de entrenamiento con simulaciones ópticas enseñando un algoritmo para realizar funciones complicadas, como seleccionar características complejas dentro de un conjunto de puntos. Descubrieron que la implementación óptica funcionaba de manera similar a una computadora convencional.
"Nuestro trabajo demuestra que puede usar las leyes de la física para implementar algoritmos informáticos", dijo Fan. "Al entrenar estas redes en el dominio óptico, muestra que los sistemas de redes neuronales ópticas podrían construirse para llevar a cabo ciertas funcionalidades utilizandoóptica sola "
Los investigadores planean optimizar aún más el sistema y desean usarlo para implementar una aplicación práctica de una tarea de red neuronal. El enfoque general que diseñaron podría usarse con varias arquitecturas de red neuronal y para otras aplicaciones como la óptica reconfigurable.
Fuente de la historia :
Materiales proporcionados por La sociedad óptica . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :