Cuando las computadoras identifican de forma independiente los cuerpos de agua y sus contornos en imágenes satelitales o superan a los mejores jugadores profesionales del mundo en el juego de mesa Go, los algoritmos adaptativos funcionan en segundo plano. Los programadores proporcionan estos algoritmos con ejemplos conocidos en una fase de entrenamiento:imágenes de cuerpos de agua y tierra, o secuencias de movimientos Go que han llevado al éxito o al fracaso en torneos. De manera similar a cómo nuestras células nerviosas cerebrales producen nuevas redes durante los procesos de aprendizaje, los algoritmos especiales se adaptan en la fase de aprendizaje en función de los ejemplos presentadospara ellos. Esto continúa hasta que sean capaces de diferenciar los cuerpos de agua de la tierra en fotos desconocidas, o secuencias exitosas de movimientos de los que no tuvieron éxito.
Hasta ahora, estas redes neuronales artificiales se han utilizado en el aprendizaje automático con un criterio conocido de toma de decisiones: sabemos qué es un cuerpo de agua y qué secuencias de movimientos tuvieron éxito en los torneos Go.
separación de trigo de paja
Ahora, un grupo de científicos que trabajan con Sebastian Huber, profesor de teoría de la materia condensada y óptica cuántica en ETH Zurich, han ampliado las aplicaciones para estas redes neuronales mediante el desarrollo de un método que no solo permite la categorización de cualquier dato, sino que también reconoce silos conjuntos de datos complejos contienen categorías.
Las preguntas de este tipo surgen en la ciencia: por ejemplo, el método podría ser útil para el análisis de mediciones de aceleradores de partículas u observaciones astronómicas. Los físicos podrían filtrar las mediciones más prometedoras de sus cantidades de datos de medición a menudo inmanejables. Los farmacólogos podrían extraermoléculas con una cierta probabilidad de tener un efecto farmacéutico específico o un efecto secundario de grandes bases de datos moleculares. Y los científicos de datos podrían clasificar enormes masas de ondas de datos desordenadas y obtener información utilizable minería de datos.
Buscar un límite
Los investigadores de ETH aplicaron su método a un fenómeno de física teórica intensamente investigado: un sistema de dipolos magnéticos interactivos de muchos cuerpos que nunca alcanza un estado de equilibrio, incluso a largo plazo. Estos sistemas se han descrito recientemente, peroTodavía no se sabe con detalle qué propiedades físicas cuánticas impiden que un sistema de muchos cuerpos entre en un estado de equilibrio. En particular, no está claro dónde se encuentra exactamente el límite entre los sistemas que alcanzan el equilibrio y los que no lo hacen.
Para localizar este límite, los científicos desarrollaron el principio de "actuar como si": tomando datos de sistemas cuánticos, establecieron un límite arbitrario basado en un parámetro y lo usaron para dividir los datos en dos grupos. Luego entrenaron a unred neuronal artificial pretendiendo que un grupo alcanzó un estado de equilibrio mientras que el otro no. Por lo tanto, los investigadores actuaron como si supieran dónde estaba el límite.
Los científicos confundieron el sistema
Capacitaron a la red innumerables veces en general, con un límite diferente cada vez, y probaron la capacidad de la red para ordenar datos después de cada sesión. El resultado fue que, en muchos casos, la red tuvo problemas para clasificar los datos como lo hicieron los científicos.Pero en algunos casos, la división en los dos grupos fue muy precisa.
Los investigadores pudieron demostrar que este rendimiento de clasificación depende de la ubicación del límite. Evert van Nieuwenburg, un estudiante de doctorado en el grupo de Huber, explica esto de la siguiente manera: "Al elegir entrenar con un límite muy alejado del límite reallo cual no sé, puedo engañar a la red. En última instancia, estamos entrenando la red de manera incorrecta, y las redes entrenadas incorrectamente son muy malas para clasificar los datos ". Sin embargo, si por casualidad se elige un límite cercano aEn el límite real, se produce un algoritmo altamente eficiente. Al determinar el rendimiento del algoritmo, los investigadores pudieron rastrear el límite entre los sistemas cuánticos que alcanzan el equilibrio y los que no: el límite se encuentra donde el rendimiento de clasificación de la red es más alto.
Los investigadores también demostraron las capacidades de su nuevo método utilizando dos preguntas adicionales de la física teórica: las transiciones de fase topológicas en sólidos unidimensionales y el modelo de Ising, que describe el magnetismo dentro de los sólidos.
Categorización sin conocimiento previo
El nuevo método también se puede ilustrar en forma simplificada con un experimento mental, en el que queremos clasificar las bolas rojas, rojizas, azuladas y azules en dos grupos. Suponemos que no tenemos idea de cómo podría verse razonablemente tal clasificación.
Si una red neuronal se entrena diciéndole que la línea divisoria se encuentra en algún lugar de la región roja, entonces esto confundirá a la red. "Intenta enseñarle a la red que las bolas azules y rojizas son iguales y le pide que diferencie entrebolas rojas y rojas, que simplemente no puede hacer ", dice Huber.
Por otro lado, si coloca el límite en el espectro de color violeta, la red aprende una diferencia real y clasifica las bolas en grupos rojo y azul. Sin embargo, no es necesario saber de antemano que la línea divisoria debe seren la región violeta. Al comparar el rendimiento de clasificación en una variedad de límites elegidos, este límite se puede encontrar sin conocimiento previo.
Fuente de la historia :
Materiales proporcionados por ETH Zúrich . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :