Los sistemas informáticos de "aprendizaje profundo", basados en redes neuronales artificiales que imitan la forma en que el cerebro aprende a partir de una acumulación de ejemplos, se han convertido en un tema candente en la informática. Además de habilitar tecnologías como el software de reconocimiento facial y de voz, estos sistemas podrían rastrear grandes cantidades de datos médicos para encontrar patrones que pudieran ser útiles para el diagnóstico, o escanear fórmulas químicas en busca de posibles nuevos productos farmacéuticos.
Pero los cálculos que deben realizar estos sistemas son muy complejos y exigentes, incluso para las computadoras más potentes.
Ahora, un equipo de investigadores en el MIT y en otros lugares ha desarrollado un nuevo enfoque para tales cálculos, utilizando luz en lugar de electricidad, lo que, según ellos, podría mejorar enormemente la velocidad y la eficiencia de ciertos cálculos de aprendizaje profundo. Sus resultados aparecen hoy en la revista Fotónica de la naturaleza en un artículo del postdoctorado del MIT Yichen Shen, el estudiante graduado Nicholas Harris, los profesores Marin Soljacic y Dirk Englund, y otros ocho.
Soljacic dice que muchos investigadores a lo largo de los años han hecho afirmaciones sobre las computadoras basadas en óptica, pero que "la gente prometió demasiado en exceso y resultó contraproducente". Si bien muchos usos propuestos de tales computadoras fotónicas resultaron no ser prácticos, una luz-sistema de red neuronal desarrollado por este equipo "puede ser aplicable para el aprendizaje profundo para algunas aplicaciones", dice.
Las arquitecturas informáticas tradicionales no son muy eficientes cuando se trata de los tipos de cálculos necesarios para ciertas tareas importantes de la red neuronal. Estas tareas suelen implicar multiplicaciones repetidas de matrices, que pueden ser muy intensivas desde el punto de vista informático en chips de CPU o GPU convencionales.
Después de años de investigación, el equipo del MIT ha ideado una forma de realizar estas operaciones de forma óptica. "Este chip, una vez que lo sintonizas, puede realizar la multiplicación de matrices con, en principio, energía cero, casi instantáneamente", Soljacicdice. "Hemos demostrado los bloques de construcción cruciales, pero aún no el sistema completo".
A modo de analogía, Soljacic señala que incluso una lente de anteojos ordinaria realiza un cálculo complejo la llamada transformada de Fourier sobre las ondas de luz que la atraviesan. La forma en que los rayos de luz realizan cálculos en los nuevos chips fotónicoses mucho más general, pero tiene un principio subyacente similar. El nuevo enfoque utiliza múltiples haces de luz dirigidos de tal manera que sus ondas interactúan entre sí, produciendo patrones de interferencia que transmiten el resultado de la operación prevista. El dispositivo resultante es algo que los investigadoresllamar a un procesador nanofotónico programable.
El resultado, dice Shen, es que los chips ópticos que usan esta arquitectura podrían, en principio, realizar cálculos realizados en algoritmos típicos de inteligencia artificial mucho más rápido y usando menos de una milésima parte de energía por operación que los chips electrónicos convencionales ".La ventaja natural de usar la luz para hacer la multiplicación de matrices juega un papel importante en la aceleración y el ahorro de energía, porque las multiplicaciones de matrices densas son la parte que más energía consume y consume más tiempo en los algoritmos de IA ", dice.
El nuevo procesador nanofotónico programable, que fue desarrollado en el laboratorio de Englund por Harris y colaboradores, utiliza una serie de guías de ondas que están interconectadas de manera que se pueden modificar según sea necesario, programando ese conjunto de haces para un cálculo específico. "puede programar en cualquier operación matricial ", dice Harris. El procesador guía la luz a través de una serie de guías de ondas fotónicas acopladas. La propuesta completa del equipo requiere capas intercaladas de dispositivos que apliquen una operación llamada función de activación no lineal, en analogía con la operación de las neuronasen el cerebro.
Para demostrar el concepto, el equipo configuró el procesador nanofotónico programable para implementar una red neuronal que reconozca cuatro sonidos vocales básicos. Incluso con este sistema rudimentario, pudieron lograr un nivel de precisión del 77 por ciento, en comparación con aproximadamente el 90 por ciento de los sonidos convencionales.sistemas. No hay "obstáculos sustanciales" para ampliar el sistema para una mayor precisión, dice Soljacic.
Englund agrega que el procesador nanofotónico programable también podría tener otras aplicaciones, incluido el procesamiento de señales para la transmisión de datos. "El procesamiento de señales analógicas de alta velocidad es algo que esto podría administrar" más rápido que otros enfoques que primero convierten la señal a forma digital, ya quela luz es un medio inherentemente analógico. "Este enfoque podría realizar el procesamiento directamente en el dominio analógico", dice.
El equipo dice que aún se necesitará mucho más esfuerzo y tiempo para hacer que este sistema sea útil; sin embargo, una vez que el sistema se amplía y funciona completamente, puede encontrar muchos casos de usuarios, como centros de datos o sistemas de seguridad.También podría ser una bendición para los vehículos autónomos o los drones, dice Harris, o "siempre que necesite hacer muchos cálculos pero no tenga mucha energía o tiempo".
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por David Chandler. Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :