Un equipo de investigación del Centro RIKEN para el Proyecto de Inteligencia Avanzada AIP ha desarrollado con éxito un nuevo método para el aprendizaje automático que permite a una IA hacer clasificaciones sin lo que se conoce como "datos negativos", un hallazgo que podría conducir a una aplicación más ampliaa una variedad de tareas de clasificación.
Clasificar cosas es fundamental para nuestra vida diaria. Por ejemplo, tenemos que detectar el correo no deseado, las noticias políticas falsas, así como cosas más mundanas como objetos o caras. Cuando se usa AI, estas tareas se basan en la "tecnología de clasificación"en el aprendizaje automático: hacer que la computadora aprenda utilizando el límite que separa los datos positivos y negativos. Por ejemplo, los datos "positivos" serían fotos que incluyen una cara feliz y fotos de datos "negativos" que incluyen una cara triste. Una vez que un límite de clasificación esaprendido, la computadora puede determinar si ciertos datos son positivos o negativos. La dificultad con esta tecnología es que requiere datos tanto positivos como negativos para el proceso de aprendizaje, y los datos negativos no están disponibles en muchos casos por ejemplo, es difícilpara encontrar fotos con la etiqueta, "esta foto incluye una cara triste", ya que la mayoría de la gente sonríe frente a una cámara.
En términos de programas de la vida real, cuando un minorista intenta predecir quién realizará una compra, puede encontrar fácilmente datos sobre los clientes que los compraron datos positivos, pero es básicamente imposible obtener datos sobre los clientes queno les compraron datos negativos, ya que no tienen acceso a los datos de sus competidores. Otro ejemplo es una tarea común para los desarrolladores de aplicaciones: necesitan predecir qué usuarios continuarán usando la aplicación positivo o dejarán de hacerlo negativoSin embargo, cuando un usuario se da de baja, los desarrolladores pierden los datos del usuario porque tienen que eliminar completamente los datos relacionados con ese usuario de acuerdo con la política de privacidad para proteger la información personal.
Según el autor principal, Takashi Ishida, de RIKEN AIP, "los métodos de clasificación anteriores no podían hacer frente a la situación en la que no había datos negativos disponibles, pero hemos hecho posible que las computadoras aprendan solo con datos positivos, siempre que tengamospuntaje de confianza para nuestros datos positivos, construido a partir de información como la intención de compra o la tasa activa de usuarios de la aplicación. Con nuestro nuevo método, podemos permitir que las computadoras aprendan un clasificador solo a partir de datos positivos equipados con confianza ".
Ishida propuso, junto con el investigador Niu Gang de su líder de grupo y equipo Masashi Sugiyama, que permitieran que las computadoras aprendieran bien al agregar el puntaje de confianza, que matemáticamente corresponde a la probabilidad de si los datos pertenecen a una clase positiva o no. Tuvieron éxitoen el desarrollo de un método que permita a las computadoras aprender un límite de clasificación solo a partir de datos positivos e información sobre su confianza confiabilidad positiva frente a problemas de clasificación del aprendizaje automático que dividen los datos de manera positiva y negativa.
Para ver qué tan bien funcionaba el sistema, lo usaron en un conjunto de fotos que contiene varias etiquetas de artículos de moda. Por ejemplo, eligieron "camiseta" como la clase positiva y otro artículo, por ejemplo, "sandalia", "como la clase negativa. Luego adjuntaron un puntaje de confianza a las fotos de la" camiseta ". Descubrieron que sin acceder a los datos negativos por ejemplo, fotos de" sandalias ", en algunos casos, su método era tan bueno comoun método que implica el uso de datos positivos y negativos
Según Ishida, "este descubrimiento podría ampliar la gama de aplicaciones en las que se puede utilizar la tecnología de clasificación. Incluso en los campos donde se ha utilizado activamente el aprendizaje automático, nuestra tecnología de clasificación se podría utilizar en situaciones nuevas en las que solo se pueden obtener datos positivos debidoa la regulación de datos o restricciones comerciales. En el futuro cercano, esperamos utilizar nuestra tecnología en varios campos de investigación, como el procesamiento del lenguaje natural, la visión por computadora, la robótica y la bioinformática ".
Fuente de la historia :
Materiales proporcionados por RIKEN . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :