Noticias de ciencia

de organizaciones de investigación

Enseñar computadoras para guiar la ciencia: el método de aprendizaje automático ve bosques y árboles

Los 'Bosques aleatorios iterativos' proporcionarán información científica poderosa, dicen los investigadores

Fecha :: 6 de marzo de 2018
Fuente :: DOE / Laboratorio Nacional Lawrence Berkeley
Resumen :: Si bien puede ser la era de las supercomputadoras y los 'grandes datos', sin métodos inteligentes para extraer todos esos datos, es solo una gran cantidad de detritos digitales. Ahora los investigadores han creado un nuevo método de aprendizaje automático que permite a los científicos obtener información desistemas de complejidad previamente intratable en tiempo récord.
Compartir :

HISTORIA COMPLETA

Si bien puede ser la era de las supercomputadoras y los "grandes datos", sin métodos inteligentes para extraer todos esos datos, es solo una gran cantidad de detritos digitales. Ahora los investigadores del Laboratorio Nacional Lawrence Berkeley Berkeley Lab del Departamento de Energía y UC BerkeleyHemos creado un novedoso método de aprendizaje automático que permite a los científicos obtener información de sistemas de complejidad previamente intratable en tiempo récord.

anuncio

En un artículo publicado recientemente en el Actas de la Academia Nacional de Ciencias PNAS, los investigadores describen una técnica llamada "Bosques aleatorios iterativos", que dicen que podría tener un efecto transformador en cualquier área de la ciencia o la ingeniería con sistemas complejos, incluyendo biología, medicina de precisión, ciencia de materiales, ciencia ambiental yfabricación, por nombrar algunos.

"Tome una célula humana, por ejemplo. Hay 10¹⁷⁰ posibles interacciones moleculares en una sola célula. Eso crea desafíos informáticos considerables en la búsqueda de relaciones ", dijo Ben Brown, jefe del Departamento de Biología de Ecosistemas Moleculares de Berkeley Lab." Nuestro método permite la identificación de interacciones de alto orden al mismo costo computacionalcomo efectos principales, incluso cuando esas interacciones son locales con débiles efectos marginales "

Brown y Bin Yu de UC Berkeley son los principales autores principales de "Bosques aleatorios iterativos para descubrir interacciones de alto orden predictivas y estables". Los coautores son Sumanta Basu anteriormente un postdoc conjunto de Brown y Yu y ahora un asistenteprofesor de la Universidad de Cornell y Karl Kumbier estudiante de doctorado de Yu en el Departamento de Estadística de UC Berkeley. El documento es la culminación de tres años de trabajo que los autores creen que transformarán la forma en que se hace la ciencia "."podemos obtener información radicalmente más rica que la que hemos podido obtener de una máquina de aprendizaje", dijo Brown.

Las necesidades del aprendizaje automático en ciencias son diferentes de las de la industria, donde el aprendizaje automático se ha utilizado para cosas como jugar al ajedrez, fabricar autos sin conductor y predecir el mercado de valores.

"El aprendizaje automático desarrollado por la industria es excelente si desea realizar operaciones de alta frecuencia en el mercado de valores", dijo Brown. "No le importa por qué puede predecir que las acciones subirán o bajarán".Solo quieres saber que puedes hacer las predicciones "

Pero en ciencia, las preguntas sobre por qué un proceso se comporta de ciertas maneras son críticas. Comprender "por qué" permite a los científicos modelar o incluso diseñar procesos para mejorar o lograr el resultado deseado. Como resultado, el aprendizaje automático para la ciencia debe mirar hacia adentrola caja negra y entender por qué y cómo las computadoras llegaron a las conclusiones a las que llegaron. Un objetivo a largo plazo es utilizar este tipo de información para modelar o diseñar sistemas para obtener los resultados deseados.

anuncio

En sistemas altamente complejos, ya sea una sola célula, el cuerpo humano o incluso un ecosistema completo, hay una gran cantidad de variables que interactúan de manera no lineal. Eso hace que sea difícil, si no imposible, construir un modelo que puedadeterminar la causa y el efecto. "Desafortunadamente, en biología, te encuentras con interacciones de orden 30, 40, 60 todo el tiempo", dijo Brown. "Es completamente intratable con los enfoques tradicionales de aprendizaje estadístico".

El método desarrollado por el equipo liderado por Brown y Yu, Bosques aleatorios iterativos iRF, se basa en un algoritmo llamado bosques aleatorios, una herramienta de modelado predictivo popular y eficaz, que traduce los estados internos del alumno de caja negra en un ser humano.forma interpretable: su enfoque permite a los investigadores buscar interacciones complejas desacoplando el orden o el tamaño de las interacciones del costo computacional de identificación.

"No hay diferencia en el costo computacional de detectar una interacción de orden 30 versus una interacción de orden dos", dijo Brown. "Y eso es un cambio radical".

En el documento de PNAS, los científicos demostraron su método en dos problemas de genómica, el papel de los potenciadores de genes en el embrión de la mosca de la fruta y el empalme alternativo en una línea celular derivada de humanos. En ambos casos, el uso de iRF confirmó hallazgos previos mientras descubría tambiéninteracciones de orden superior no identificadas previamente para el estudio de seguimiento.

Brown dijo que ahora están utilizando su método para diseñar sistemas láser de matriz en fase y optimizar sistemas de agricultura sostenible.

anuncio

"Creemos que este es un paradigma diferente para hacer ciencia", dijo Yu, profesor en los departamentos de Estadística e Ingeniería Eléctrica y Ciencias de la Computación en UC Berkeley. "Hacemos predicciones, pero introducimos estabilidad además de predicciones en iRFpara aprender de manera más confiable la estructura subyacente en los predictores "

"Esto nos permite aprender a diseñar sistemas para la optimización orientada a objetivos y simulaciones y experimentos de seguimiento más precisos", agregó Brown.

En un comentario de PNAS sobre la técnica, Danielle Denisko y Michael Hoffman de la Universidad de Toronto escribieron: "iRF es muy prometedor como una forma nueva y efectiva de detectar interacciones en una variedad de entornos, y su uso nos ayudará a asegurar que nola rama u hoja se deja sin girar "

La investigación fue apoyada por subvenciones del programa de Transferencia de Tecnología para Pequeñas Empresas STTR del DOE, el programa de Investigación y Desarrollo Dirigido por el Laboratorio LDRD, el Instituto Nacional de Investigación del Genoma Humano, la Oficina de Investigación del Ejército, la Oficina de Investigación Naval y elFundación Nacional de Ciencia.

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por DOE / Laboratorio Nacional Lawrence Berkeley . Nota: El contenido puede ser editado por estilo y longitud.

Referencias de revistas :

Sumanta Basu, Karl Kumbier, James B. Brown, Bin Yu. Bosques aleatorios iterativos para descubrir interacciones de alto orden predictivas y estables . Actas de la Academia Nacional de Ciencias , 2018; 115 8: 1943 DOI: 10.1073 / pnas.1711236115
Danielle Denisko, Michael M. Hoffman. Clasificación e interacción en bosques aleatorios . Actas de la Academia Nacional de Ciencias , 2018; 115 8: 1690 DOI: 10.1073 / pnas.1800256115

Cite esta página :

DOE / Laboratorio Nacional Lawrence Berkeley. "Enseñanza de las computadoras para guiar la ciencia: el método de aprendizaje automático ve los bosques y los árboles: los 'Bosques aleatorios iterativos' proporcionarán información científica poderosa, dicen los investigadores". ScienceDaily. ScienceDaily, 6 de marzo de 2018. .

DOE / Lawrence Berkeley National Laboratory. 6 de marzo de 2018. Enseñanza de las computadoras para guiar la ciencia: el método de aprendizaje automático ve los bosques y los árboles: los 'Bosques aleatorios iterativos' proporcionarán ideas científicas poderosas, dicen los investigadores. ScienceDaily . Recuperado el 12 de julio de 2020 de www.science-things.com/releases/2018/03/180306100503.htm

TEMAS RELACIONADOS
- Computadoras y matemáticas

anuncio

TÉRMINOS RELACIONADOS

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Enseñar computadoras para guiar la ciencia: el método de aprendizaje automático ve bosques y árboles

Los 'Bosques aleatorios iterativos' proporcionarán información científica poderosa, dicen los investigadores

1

2

3

4

5

1

2

3

4

5

Las enanas blancas revelan nuevas ideas sobre el origen del carbono en el universo

Mayor concentración de metal en los cráteres de la luna proporciona nuevas ideas sobre su origen

Para encontrar agujeros negros gigantes, comience con Júpiter

Los mejores y peores materiales para máscaras

El mejor material para las mascarillas caseras puede ser una combinación de dos telas

matar el coronavirus con un dispositivo portátil de luz ultravioleta puede ser factible

Sin claves para el reino: el nuevo algoritmo de inicio de sesión único proporciona una privacidad superior

¿Cómo corre el riesgo de contraer un virus en un avión?

Los consumidores prefieren los números redondos incluso cuando el número específico es una mejor noticia

Enorme 'Superflare' detectado en estrella cercana

El poder colectivo de los cuerpos oscuros e helados del sistema solar

El viaje cósmico hacia la formación de estrellas y planetas

Los globos programables allanan el camino para nuevos dispositivos de transformación de formas

Gusanos brillantes proporcionan películas de acción en vivo del andamiaje interno del cuerpo

Ciencia detrás de la técnica tradicional de fabricación de mezcal

Los científicos crean un nuevo dispositivo para iluminar el camino para las tecnologías cuánticas

Sistema portátil que aumenta la precisión del láser a temperatura ambiente

Nueva evidencia ayuda a formar la reconstrucción digital del santuario medieval más importante