El estadístico de la Universidad de Rice, Genevera Allen, dice que los científicos deben seguir cuestionando la precisión y la reproducibilidad de los descubrimientos científicos realizados por técnicas de aprendizaje automático hasta que los investigadores desarrollen nuevos sistemas computacionales que puedan criticarse a sí mismos.
Allen, profesor asociado de estadística, ciencias de la computación e ingeniería eléctrica e informática en Rice y de pediatría-neurología en el Baylor College of Medicine, abordará el tema en una conferencia de prensa y una sesión general hoy en la Reunión Anual 2019 de laAsociación Americana para el Avance de la Ciencia AAAS.
"La pregunta es: '¿Realmente podemos confiar en los descubrimientos que se están haciendo actualmente utilizando técnicas de aprendizaje automático aplicadas a grandes conjuntos de datos?'", Dijo Allen. "La respuesta en muchas situaciones es probablemente 'No sin verificar'pero se está trabajando en los sistemas de aprendizaje automático de próxima generación que evaluarán la incertidumbre y la reproducibilidad de sus predicciones ".
Machine learning ML es una rama de la estadística y la informática relacionada con la construcción de sistemas computacionales que aprenden de los datos en lugar de seguir instrucciones explícitas. Allen dijo que mucha atención en el campo de ML se ha centrado en desarrollar modelos predictivos que permitan a ML hacer prediccionessobre datos futuros basados en su comprensión de los datos que ha estudiado.
"Muchas de estas técnicas están diseñadas para hacer siempre una predicción", dijo. "Nunca vuelven con 'No sé' o 'No descubrí nada' porque no están hechasa."
Ella dijo que los descubrimientos basados en datos no corroborados de estudios de ML publicados recientemente sobre datos de cáncer son un buen ejemplo.
"En medicina de precisión, es importante encontrar grupos de pacientes que tengan perfiles genómicamente similares para que pueda desarrollar terapias farmacológicas dirigidas al genoma específico para su enfermedad", dijo Allen. "Las personas han aplicado el aprendizaje automático a los datos genómicos decohortes clínicas para encontrar grupos o grupos de pacientes con perfiles genómicos similares.
"Pero hay casos en los que los descubrimientos no son reproducibles; los grupos descubiertos en un estudio son completamente diferentes a los grupos encontrados en otro", dijo. "¿Por qué? Porque la mayoría de las técnicas de aprendizaje automático de hoy siempre dicen: 'Encontréun grupo. 'A veces, sería mucho más útil si dijeran:' Creo que algunos de estos están realmente agrupados, pero no estoy seguro acerca de estos otros '".
Allen discutirá la incertidumbre y la reproducibilidad de las técnicas de ML para los descubrimientos basados en datos en una conferencia de prensa a las 10 am de hoy, y discutirá los estudios de caso y la investigación destinados a abordar la incertidumbre y la reproducibilidad en la sesión general de las 3:30 pm, "Machine Learningy Estadísticas: Aplicaciones en Genómica y Visión por Computadora ". Ambas sesiones son en el Marriott Wardman Park Hotel.
Fuente de la historia :
Materiales proporcionado por Universidad de Rice . Original escrito por Jade Boyd. Nota: El contenido puede ser editado por estilo y longitud.
Cite esta página :