Los científicos de la Universidad de Rice han desarrollado una técnica de big data que podría tener un impacto significativo en la atención médica.
El laboratorio de Rice de la bioingeniera Amina Qutub diseñó un algoritmo llamado "agrupación de progenie" que se está utilizando en un estudio hospitalario para identificar qué tratamientos deben administrarse a los niños con leucemia.
Los detalles del trabajo aparecen en la revista en línea de Nature Informes científicos .
La agrupación es importante por su capacidad para revelar información en conjuntos complejos de datos como registros médicos. La técnica se utiliza en bioinformática, un tema de interés para los científicos de Rice que trabajan en estrecha colaboración con otras instituciones del Centro Médico de Texas.
"Los médicos que diseñan ensayos clínicos necesitan saber cómo agrupar a los pacientes para que reciban el tratamiento más apropiado", dijo Qutub. "Primero, necesitan estimar la cantidad óptima de grupos en sus datos". Cuanto más precisos sean los grupos,cuanto más personalizado puede ser el tratamiento, dijo.
Separar grupos por un solo punto de datos, como el color de ojos, sería fácil, dijo. Pero cuando se separa a las personas por los tipos de proteínas en su torrente sanguíneo, se vuelve más difícil.
"Ese es el tipo de datos que prevalece en todas partes en biología, y es bueno tenerlos", dijo Qutub. "Queremos conocer cientos de características de una sola persona. El problema es identificar cómo usar todos esos datos".
El algoritmo de Rice proporciona una manera de asegurar que el número de grupos sea lo más preciso posible, dijo. El algoritmo extrae características de los pacientes de un conjunto de datos, mezclándolos y combinándolos al azar para crear poblaciones artificiales: la "progenie"o descendientes, de los datos de los padres. Las características aparecen aproximadamente en las mismas proporciones en los descendientes que entre los padres.
Estas características, llamadas dimensiones, pueden ser cualquier cosa: tan simples como el color del cabello o el lugar de nacimiento, o tan detalladas como el recuento de células sanguíneas o las proteínas expresadas por las células tumorales. Incluso para una población pequeña, cada individuo puede tener cientos oincluso miles de dimensiones.
Al crear una progenie con las mismas dimensiones de características, el algoritmo de Rice aumenta el tamaño del conjunto de datos. Con estos datos adicionales, los distintos patrones se vuelven más evidentes, lo que permite que el algoritmo optimice el número de grupos que requieren la atención de los médicos ycientíficos.
Qutub y la investigadora principal Wendy Hu, estudiante de posgrado en su laboratorio de Rice's BioScience Research Collaborative, dijeron que su técnica es tan confiable como los algoritmos de evaluación de agrupamiento de última generación, pero a una fracción del costo computacional.pruebas de laboratorio, la agrupación de la progenie se comparó favorablemente con otros métodos populares, escribieron, y fue el único método para descubrir con éxito agrupaciones clínicamente significativas en un conjunto de datos de matriz de proteínas de fase inversa de leucemia mieloide aguda.
La agrupación de la progenie también permite a los investigadores determinar el número ideal de agrupaciones en poblaciones pequeñas, dijo Qutub.
El algoritmo se puso en funcionamiento en un ensayo en curso en el que participaron pacientes con leucemia en el Texas Children's Hospital. Allí, dijo Qutub, "el agrupamiento de la progenie les permitió diseñar un ensayo clínico sólido, aunque ese ensayo no involucró a una gran cantidad de niños. Significaba que no tenían que esperar para inscribirse más ".
Las tecnologías que recopilan datos sobre los pacientes, desde sofisticados equipos hospitalarios hasta simples monitores de salud de muñeca, están avanzando rápidamente, dijo Qutub. Eso hace que las herramientas que pueden descifrar montañas crecientes de datos, por ejemplo, sean muy importantes.puede haber pocos en número, pero puede haber cientos o miles de dimensiones para cada uno, dijo.
"Los macrodatos son solo números, pero los números no tienen ningún valor si no obtienes información de ellos", dijo Hu. "Mi trabajo es mirar estos números y usar herramientas computacionales y conocimientos de la biología paragenerar nueva información. Esto puede ayudarnos a conocer más sobre las enfermedades y a idear soluciones terapéuticas y esquemas de diagnóstico e identificar nuevos objetivos farmacológicos ".
"Si no sabe cómo manejar esos datos, está perdido", dijo Qutub. "No sabrá la mejor manera de agrupar a las personas o asignarlas a una determinada terapia o régimen de ejercicio".
El algoritmo podría aplicarse a cualquier conjunto de datos, dijo Qutub. "Podríamos usarlo con la misma facilidad para que una población de votantes vea quién debe obtener materiales de campaña de un candidato", dijo. "La agrupación de progenie tiene muchas posibilidadesaplicaciones. "
El laboratorio planea hacer que el algoritmo esté disponible de forma gratuita a través de su sitio web, dijo.
Fuente de la historia :
Materiales proporcionado por Universidad de Rice . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :