Como pasar de una cámara estenopeica a una Polaroid, una actualización matemática significativa de la fórmula de un método popular de visualización de datos bioinformáticos permitirá a los investigadores desarrollar instantáneas de la expresión génica unicelular no solo varias veces más rápido sino también con una resolución mucho mayor. Publicado en Métodos de la naturaleza , esta innovación de los matemáticos de Yale reducirá el tiempo de procesamiento de un conjunto de datos de secuenciación de ARN unicelular de un millón de puntos scRNA-seq de más de tres horas a solo quince minutos.
Los científicos dicen que el método existente de hace una década, incrustación de vecindad estocástica distribuida en t t-SNE, es excelente para representar patrones en los datos de secuenciación de ARN recopilados a nivel de una sola célula, datos de scRNA-seq, en dos dimensiones ".En este entorno, t-SNE 'organiza' las células por los genes que expresan y se ha utilizado para descubrir nuevos tipos de células y estados celulares ", dijo George Linderman, autor principal y un estudiante de Yale MD-Ph.D. especializado en matemáticas aplicadas.
Según los estándares computacionales, t-SNE es bastante lento. Por lo tanto, los investigadores a menudo "reducen la resolución" de su conjunto de datos scRNA-seq toman una muestra más pequeña de la muestra inicial antes de aplicar t-SNE. Sin embargo, la reducción de la resolución es un compromiso deficiente, ya que hace que sea poco probable que t-SNE capture poblaciones de células raras, que a menudo son las que los investigadores quieren identificar.
Hace más de 30 años, otro equipo de matemáticos de Yale desarrolló el método rápido multipolar FMM, una técnica numérica revolucionaria que aceleró el cálculo de fuerzas de largo alcance en el problema de n cuerpos. Los investigadores de este estudio reconocieron queLos principios detrás del FMM también podrían aplicarse a problemas de reducción dimensional no lineal, como t-SNE, y t-SNE acelerado hasta obtener su nuevo nombre: FIt-SNE, o t-SNE basado en interpolación rápida.
"Con nuestro enfoque, los investigadores no solo pueden analizar los datos de secuenciación de ARN de una sola célula más rápido, sino que también se pueden usar para caracterizar subpoblaciones de células raras que no se pueden detectar si los datos se submuestran antes de t-SNE", dijo Yuval Kluger., autor principal y profesor de patología de Yale. Además, el equipo utilizó una visualización de estilo mapa de calor para sus resultados FIt-SNE, lo que facilita a los investigadores ver los patrones de expresión de miles de genes a nivel de células individuales simultáneamente.
Los investigadores dijeron que 2019 no podría ser un mejor año nuevo para que t-SNE obtenga el "ajuste". En diciembre de 2018, la revista Science nombró el seguimiento del desarrollo de embriones célula por célula, imposible de lograr sin visualizaciones basadas en scRNA-seqdatos: el avance del año. FIt-SNE acelerará el trabajo adicional en este campo de la biología del desarrollo, así como en campos como la neurociencia y la investigación del cáncer, donde la secuenciación unicelular se ha convertido en una herramienta invaluable para mapear el cerebro ycomprender los tumores, dijeron los investigadores.
Fuente de la historia :
Materiales proporcionado por Universidad de Yale . Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :