Los modelos y algoritmos para analizar redes complejas se utilizan ampliamente en la investigación y afectan a la sociedad en general a través de sus aplicaciones en redes sociales en línea, motores de búsqueda y sistemas de recomendación. Sin embargo, según un nuevo estudio, un enfoque algorítmico ampliamente utilizado para modelar estoslas redes son fundamentalmente defectuosas, ya que no capturan propiedades importantes de redes complejas del mundo real.
"No es que estas técnicas le estén dando basura absoluta. Probablemente tengan algo de información, pero no tanta información como mucha gente cree", dijo C. "Sesh" Seshadhri, profesor asociado de ciencias de la computación e ingeniería en elBaskin School of Engineering en UC Santa Cruz.
Seshadhri es el primer autor de un artículo sobre los nuevos hallazgos publicados el 2 de marzo en Actas de la Academia Nacional de Ciencias . El estudio evaluó técnicas conocidas como "incrustaciones de baja dimensión", que se utilizan comúnmente como entrada para los modelos de aprendizaje automático. Esta es un área activa de investigación, con nuevos métodos de incrustación que se desarrollan a un ritmo rápido. Pero Seshadhri y sulos coautores dicen que todos estos métodos comparten las mismas deficiencias.
Para explicar por qué, Seshadhri utilizó el ejemplo de una red social, un tipo familiar de red compleja. Muchas empresas aplican el aprendizaje automático a los datos de la red social para generar predicciones sobre el comportamiento de las personas, recomendaciones para los usuarios, etc. Las técnicas de integración esencialmente conviertenLa posición de una persona en una red social en un conjunto de coordenadas para un punto en un espacio geométrico, produciendo una lista de números para cada persona que se puede conectar a un algoritmo.
"Eso es importante porque algo abstracto como la posición de una persona en una red social" se puede convertir en una lista concreta de números. Otra cosa importante es que desee convertir esto en un espacio de baja dimensión, de modo que la lista delos números que representan a cada persona son relativamente pequeños ", explicó Seshadhri.
Una vez que se ha realizado esta conversión, el sistema ignora la red social real y hace predicciones basadas en las relaciones entre puntos en el espacio. Por ejemplo, si muchas personas cercanas a usted en ese espacio están comprando un producto en particular, el sistemapodría predecir que es probable que compre el mismo producto.
Seshadhri y sus coautores demostraron matemáticamente que importantes aspectos estructurales de las redes complejas se pierden en este proceso de incrustación. También confirmaron este resultado empíricamente al probar varias técnicas de incrustación en diferentes tipos de redes complejas.
"No estamos diciendo que ciertos métodos específicos fallan. Estamos diciendo que cualquier método de inclusión que le dé una pequeña lista de números fallará fundamentalmente, porque una geometría de baja dimensión simplemente no es lo suficientemente expresiva para las redes socialesy otras redes complejas ", dijo Seshadhri.
Una característica crucial de las redes sociales del mundo real es la densidad de triángulos o conexiones entre tres personas.
"Cuando tienes muchos triángulos, significa que hay mucha estructura comunitaria en esa parte de una red social", dijo Seshadhri. "Además, estos triángulos son aún más significativos cuando estás mirando a personas que tienen limitacionesredes sociales. En una red social típica, algunas personas tienen toneladas de conexiones, pero la mayoría de las personas no tienen muchas conexiones ".
En su análisis de las técnicas de inclusión, los investigadores observaron que muchos de los triángulos sociales que representan la estructura de la comunidad se pierden en el proceso de inclusión. "Toda esta información parece desaparecer, por lo que es casi como lo que querías encontrarperdido cuando construyes estas representaciones geométricas ", dijo Seshadhri.
Las incrustaciones de baja dimensión no son los únicos métodos que se utilizan para generar predicciones y recomendaciones. Por lo general, son solo una de las muchas entradas en un modelo de aprendizaje automático muy grande y complejo.
"Este modelo es una gran caja negra, y muchos de los resultados positivos que se informan dicen que si incluye estas incrustaciones de baja dimensión, su rendimiento aumenta, tal vez obtenga un ligero golpe. Pero si lo usó solo, parece que faltaría mucho ", dijo Seshadhri.
También señaló que los nuevos métodos de inclusión se comparan principalmente con otros métodos de inserción. Sin embargo, el trabajo empírico reciente de otros investigadores muestra que diferentes técnicas pueden dar mejores resultados para tareas específicas.
"Digamos que quiere predecir quién es republicano y quién es demócrata. Existen técnicas desarrolladas específicamente para esa tarea que funcionan mejor que las incrustaciones", dijo. "La afirmación es que estas técnicas de incrustación funcionan para muchas tareas diferentes, yes por eso que mucha gente los ha adoptado. También es muy fácil conectarlos a un sistema de aprendizaje automático existente. Pero para cualquier tarea en particular, resulta que siempre hay algo mejor que puedes hacer ".
Dada la creciente influencia del aprendizaje automático en nuestra sociedad, Seshadhri dijo que es importante investigar si las suposiciones subyacentes detrás de los modelos son válidas.
"Tenemos todas estas máquinas complicadas que hacen cosas que afectan nuestras vidas de manera significativa. Nuestro mensaje es que debemos ser más cuidadosos al evaluar estas técnicas", dijo. "Especialmente en estos tiempos en que el aprendizaje automático está aumentandoy más complicado, es importante tener cierta comprensión de lo que se puede y no se puede hacer "
Fuente de la historia :
Materiales proporcionado por Universidad de California - Santa Cruz . Original escrito por Tim Stephens. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :