En los últimos años, algunos de los avances más emocionantes en inteligencia artificial han sido cortesía de redes neuronales convolucionales, grandes redes virtuales de unidades simples de procesamiento de información, que están modeladas libremente en la anatomía del cerebro humano.
Las redes neuronales generalmente se implementan utilizando unidades de procesamiento de gráficos GPU, chips de gráficos de propósito especial que se encuentran en todos los dispositivos informáticos con pantallas. Una GPU móvil, del tipo que se encuentra en un teléfono celular, podría tener casi 200 núcleos, o unidades de procesamiento, lo que lo hace muy adecuado para simular una red de procesadores distribuidos.
En la Conferencia Internacional de Circuitos de Estado Sólido en San Francisco esta semana, los investigadores del MIT presentaron un nuevo chip diseñado específicamente para implementar redes neuronales. Es 10 veces más eficiente que una GPU móvil, por lo que podría permitir que los dispositivos móviles ejecuten potentes dispositivos artificiales.algoritmos de inteligencia localmente, en lugar de cargar datos a Internet para su procesamiento.
Las redes neuronales se estudiaron ampliamente en los primeros días de la investigación de inteligencia artificial, pero en la década de 1970, habían caído en desgracia. En la última década, sin embargo, han disfrutado de un renacimiento, bajo el nombre de "aprendizaje profundo"
"El aprendizaje profundo es útil para muchas aplicaciones, como el reconocimiento de objetos, el habla y la detección de rostros", dice Vivienne Sze, profesora asistente de ingeniería eléctrica en el MIT cuyo grupo desarrolló el nuevo chip. "En este momento, las redes son bastante complejasy se ejecutan principalmente en GPU de alta potencia. Puede imaginar que si puede llevar esa funcionalidad a su teléfono celular o dispositivos integrados, aún podría operar incluso si no tiene una conexión Wi-Fi. También es posible que deseeprocesar localmente por razones de privacidad. Procesarlo en su teléfono también evita cualquier latencia de transmisión, de modo que pueda reaccionar mucho más rápido para ciertas aplicaciones ".
El nuevo chip, que los investigadores denominaron "Eyeriss", también podría ayudar a introducir la "Internet de las cosas": la idea de que los vehículos, electrodomésticos, estructuras de ingeniería civil, equipos de fabricación e incluso ganado tendrían sensores que informaninformación directamente a los servidores en red, ayudando con el mantenimiento y la coordinación de tareas. Con potentes algoritmos de inteligencia artificial a bordo, los dispositivos en red podrían tomar decisiones importantes a nivel local, confiando solo sus conclusiones, en lugar de datos personales en bruto, a Internet. Y, por supuesto,las redes neuronales a bordo serían útiles para los robots autónomos que funcionan con baterías.
división del trabajo
Una red neuronal generalmente se organiza en capas, y cada capa contiene una gran cantidad de nodos de procesamiento. Los datos entran y se dividen entre los nodos en la capa inferior. Cada nodo manipula los datos que recibe y pasa los resultados anodos en la siguiente capa, que manipulan los datos que reciben y transmiten los resultados, y así sucesivamente. El resultado de la capa final proporciona la solución a algún problema computacional.
En una red neuronal convolucional, muchos nodos en cada capa procesan los mismos datos de diferentes maneras. Por lo tanto, las redes pueden aumentar a proporciones enormes. Aunque superan a los algoritmos más convencionales en muchas tareas de procesamiento visual, requieren recursos computacionales mucho mayores.
Las manipulaciones particulares realizadas por cada nodo en una red neuronal son el resultado de un proceso de entrenamiento, en el que la red trata de encontrar correlaciones entre los datos sin procesar y las etiquetas aplicadas por los anotadores humanos. Con un chip como el desarrollado por elInvestigadores del MIT, una red capacitada simplemente podría exportarse a un dispositivo móvil.
Esta aplicación impone restricciones de diseño a los investigadores. Por un lado, la forma de reducir el consumo de energía del chip y aumentar su eficiencia es hacer que cada unidad de procesamiento sea lo más simple posible; por otro lado, el chip debe ser lo suficientemente flexiblepara implementar diferentes tipos de redes adaptadas a diferentes tareas.
Sze y sus colegas: Yu-Hsin Chen, un estudiante graduado en ingeniería eléctrica y ciencias de la computación y primer autor del documento de la conferencia; Joel Emer, profesor de la práctica en el Departamento de Ingeniería Eléctrica y Ciencias de la Computación del MIT, y undistinguido científico investigador sénior en el fabricante de chips NVidia y, con Sze, uno de los dos investigadores principales del proyecto, y Tushar Krishna, que era un postdoctorado con la Alianza Singapur-MIT para Investigación y Tecnología cuando el trabajo se realizó y ahora es unprofesor asistente de ingeniería informática y eléctrica en Georgia Tech: se instaló en un chip con 168 núcleos, aproximadamente tantos como una GPU móvil.
Actuar localmente
La clave para la eficiencia de Eyeriss es minimizar la frecuencia con la que los núcleos necesitan intercambiar datos con bancos de memoria distantes, una operación que consume una gran cantidad de tiempo y energía. Mientras que muchos de los núcleos en una GPU comparten una sola memoria grandebanco, cada uno de los núcleos de Eyeriss tiene su propia memoria. Además, el chip tiene un circuito que comprime los datos antes de enviarlos a los núcleos individuales.
Cada núcleo también puede comunicarse directamente con sus vecinos inmediatos, de modo que si necesitan compartir datos, no tienen que enrutarlos a través de la memoria principal. Esto es esencial en una red neuronal convolucional, en la que hay tantos nodosestán procesando los mismos datos.
La clave final para la eficiencia del chip es un circuito de propósito especial que asigna tareas a través de los núcleos. En su memoria local, un núcleo necesita almacenar no solo los datos manipulados por los nodos que está simulando, sino también datos que describen los nodos mismos. El circuito de asignaciónpuede reconfigurarse para diferentes tipos de redes, distribuyendo automáticamente ambos tipos de datos entre núcleos de manera que maximice la cantidad de trabajo que cada uno de ellos puede hacer antes de obtener más datos de la memoria principal.
En la conferencia, los investigadores del MIT utilizaron Eyeriss para implementar una red neuronal que realiza una tarea de reconocimiento de imágenes, la primera vez que se demostró una red neuronal de última generación en un chip personalizado.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :