Un investigador de la Universidad de Waterloo ha encabezado el desarrollo de una herramienta de software que puede proporcionar respuestas concluyentes a algunas de las preguntas más fascinantes del mundo.
La herramienta, que combina el aprendizaje automático supervisado con el procesamiento de señal digital ML-DSP, podría permitir por primera vez responder definitivamente a preguntas como cuántas especies diferentes existen en la Tierra y en los océanos.¿especies recientemente descubiertas y extintas relacionadas entre sí? ¿Cuáles son los orígenes bacterianos del ADN mitocondrial humano? ¿El ADN de un parásito y su huésped tienen una firma genómica similar?
La herramienta también tiene el potencial de impactar positivamente en la industria de la medicina personalizada al identificar la cepa específica de un virus y permitir así que se desarrollen y receten medicamentos precisos para tratarlo.
ML-DSP es una herramienta de software sin alineación que funciona transformando una secuencia de ADN en una señal digital numérica y utiliza métodos de procesamiento de señal digital para procesar y distinguir estas señales entre sí.
"Con este método, incluso si solo tenemos pequeños fragmentos de ADN, aún podemos clasificar las secuencias de ADN, independientemente de su origen, o si son naturales, sintéticas o generadas por computadora", dijo Lila Kari, profesora de la Facultad de Waterlooof Mathematics. "Otra aplicación potencial importante de esta herramienta es en el sector de la salud, ya que en esta era de la medicina personalizada podemos clasificar los virus y personalizar el tratamiento de un paciente en particular dependiendo de la cepa específica del virus que los afecta".
En el estudio, los investigadores realizaron una comparación cuantitativa con otras herramientas de software de clasificación de vanguardia en dos conjuntos de datos de referencia pequeños y un gran conjunto de datos del genoma mitocondrial de 4.322 vertebrados. "Nuestros resultados muestran que ML-DSP supera abrumadoramente a los resultados basados en la alineación"Kari dijo." Comparado con otro software sin alineación, ML-DSP tiene una precisión de clasificación significativamente mejor en términos de tiempo de procesamiento, mientras que tiene precisiones de clasificación que son comparables en el caso de conjuntos de datos pequeños y superiores en el caso de conjuntos de datos grandes.y en general es más rápido "
Los autores también realizaron experimentos preliminares que indican el potencial de ML-DSP para ser utilizado en otros conjuntos de datos, clasificando 4,271 genomas completos del virus del dengue en subtipos con un 100% de precisión, y 4,710 genomas bacterianos en divisiones con un 95.5% de precisión.
Un documento que detalla la nueva herramienta de software, titulada ML-DSP: Aprendizaje automático con procesamiento digital de señales para una clasificación del genoma ultrarrápida, precisa y escalable en todos los niveles taxonómicos, que fue creada por Kari junto con el candidato a doctorado de la Universidad de Western Western, Gurjit Randhawa y el Dr.Kathleen Hill, profesora asociada en el Departamento de Biología de We
Fuente de la historia :
Materiales proporcionados por Universidad de Waterloo . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :