Los investigadores, desde bioquímicos hasta científicos de materiales, han dependido durante mucho tiempo de la rica variedad de moléculas orgánicas para resolver desafíos apremiantes. Algunas moléculas pueden ser útiles para tratar enfermedades, otras para iluminar nuestras pantallas digitales, y otras para pigmentos, pinturas y plásticos. Las propiedades únicas de cada molécula están determinadas por su estructura, es decir, por la conectividad de sus átomos constituyentes. Una vez que se identifica una estructura prometedora, queda la difícil tarea de hacer que la molécula objetivo sea sometida a una secuencia de reacciones químicas.¿cuáles?
Los químicos orgánicos generalmente trabajan hacia atrás desde la molécula objetivo a los materiales de partida usando un proceso llamado análisis retrosintético. Durante este proceso, el químico enfrenta una serie de decisiones complejas e interrelacionadas. Por ejemplo, de las decenas de miles de diferentes químicosreacciones, ¿cuál debería elegir para crear la molécula objetivo? Una vez que se toma esa decisión, puede encontrarse con múltiples moléculas reactivas necesarias para la reacción. Si estas moléculas no están disponibles para comprar, entonces ¿cómo selecciona las reacciones apropiadas para¿Producirlos? Elegir de manera inteligente qué hacer en cada paso de este proceso es fundamental para navegar por la gran cantidad de caminos posibles.
Los investigadores de Columbia Engineering han desarrollado una nueva técnica basada en el aprendizaje por refuerzo que entrena un modelo de red neuronal para seleccionar correctamente la "mejor" reacción en cada paso del proceso retrosintético. Esta forma de IA proporciona un marco para que los investigadores diseñen síntesis químicasque optimizan los objetivos especificados por el usuario, tales como costo de síntesis, seguridad y sostenibilidad. El nuevo enfoque, publicado el 31 de mayo por Ciencia Central de ACS , es más exitoso ~ 60% que las estrategias existentes para resolver este desafiante problema de búsqueda.
"El aprendizaje por refuerzo ha creado jugadores de computadora que son mucho mejores que los humanos para jugar videojuegos complejos. ¡Quizás la retrosíntesis no es diferente! ¡Este estudio nos da la esperanza de que los algoritmos de aprendizaje por refuerzo sean quizás algún día mejores que los jugadores humanos en el 'juego''de retrosíntesis ", dice Alán Aspuru-Guzik, profesor de química y ciencias de la computación en la Universidad de Toronto, que no participó en el estudio.
El equipo enmarcó el desafío de la planificación retrosintética como un juego como el ajedrez y el Go, donde el número combinatorio de opciones posibles es astronómico y el valor de cada opción es incierto hasta que se completa el plan de síntesis y se evalúa su costo. A diferencia de estudios anteriores que utilizaronfunciones de puntuación heurísticas - reglas básicas simples - para guiar la planificación retrosintética, este nuevo estudio utilizó técnicas de aprendizaje por refuerzo para hacer juicios basados en la propia experiencia del modelo neural.
"Somos los primeros en aplicar el aprendizaje por refuerzo al problema del análisis retrosintético", dice Kyle Bishop, profesor asociado de ingeniería química. "A partir de un estado de completa ignorancia, donde el modelo no sabe absolutamente nada sobre estrategia y aplica reaccionesaleatoriamente, el modelo puede practicar y practicar hasta que encuentre una estrategia que supere a una heurística definida por el ser humano ".
En su estudio, el equipo de Bishop se enfocó en usar el número de pasos de reacción como la medida de lo que hace un "buen" camino sintético. Tenían su modelo de aprendizaje de refuerzo para adaptar su estrategia con este objetivo en mente. Usando experiencia simulada, el equipoentrenó la red neuronal del modelo para estimar el costo o el valor de síntesis esperado de cualquier molécula dada en función de una representación de su estructura molecular.
El equipo planea explorar diferentes objetivos en el futuro, por ejemplo, entrenar el modelo para minimizar los costos en lugar del número de reacciones, o para evitar moléculas que podrían ser tóxicas. Los investigadores también están tratando de reducir el número de simulaciones requeridaspara que el modelo aprenda su estrategia, ya que el proceso de capacitación fue computacionalmente costoso.
"Esperamos que nuestro juego de retrosíntesis pronto siga el camino del ajedrez y el Go, en el que los algoritmos autodidactas superan constantemente a los expertos humanos", señala Bishop. "Y damos la bienvenida a la competencia. Al igual que con los programas de computadora que juegan al ajedrez, la competencia esel motor para mejoras en el estado de la técnica, y esperamos que otros puedan aprovechar nuestro trabajo para demostrar un rendimiento aún mejor ".
Fuente de la historia :
Materiales proporcionado por Escuela de Ingeniería y Ciencias Aplicadas de la Universidad de Columbia . Original escrito por Holly Evarts. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :