¡Big Data está de moda hoy en día, pero Small Data también importa! Sacar conclusiones confiables de pequeños conjuntos de datos, como los de ensayos clínicos para enfermedades raras o en estudios de especies en peligro de extinción, sigue siendo uno de los obstáculos más difíciles en las estadísticas. Ahora, fríoLos investigadores del Laboratorio Spring Harbor CSHL han desarrollado una nueva forma de analizar datos pequeños, inspirada en métodos avanzados en física teórica, pero disponible como software fácil de usar.
"Tratar con pequeños conjuntos de datos es una parte fundamental de hacer ciencia", explicó el profesor asistente de CSHL, Justin Kinney. El desafío es que, con muy pocos datos, no solo es difícil llegar a una conclusión; también es difícil determinar qué tan ciertotus conclusiones son
"Es importante no solo producir la mejor suposición de lo que está sucediendo, sino también decir: 'Esta suposición probablemente sea correcta'", dijo Kinney.
Un buen ejemplo son los ensayos clínicos de drogas.
"Cuando cada punto de datos es un paciente, siempre se tratará de pequeños conjuntos de datos y, por muy buenas razones", dijo. "No desea probar un tratamiento en más personas de las que tiene antes de determinar siel medicamento es seguro y efectivo. Es realmente importante poder tomar estas decisiones con la menor cantidad de datos posible "
Cuantificar que la certeza ha sido difícil debido a los supuestos que hacen los métodos estadísticos comunes. Estos supuestos fueron necesarios cuando se desarrollaron los métodos estándar, antes de la era de la computadora. Pero estas aproximaciones, señala Kinney, "pueden ser catastróficas" en conjuntos de datos pequeños.
Ahora, el laboratorio de Kinney ha creado un enfoque computacional moderno llamado Estimación de densidad usando la teoría de campo, o DEFT, que corrige estas deficiencias. DEFT está disponible gratuitamente a través de un paquete de código abierto llamado SUFTware.
En su reciente artículo, publicado en Cartas de revisión física , el laboratorio de Kinney demuestra DEFT en dos conjuntos de datos: estadísticas nacionales de salud compiladas por la Organización Mundial de la Salud, y rastros de partículas subatómicas utilizadas por los físicos en el Gran Colisionador de Hadrones para revelar la existencia de la partícula del bosón de Higgs.
Kinney dice que ser capaz de aplicar DEFT a situaciones tan drásticamente diversas del "mundo real", a pesar de que sus cálculos están inspirados en la física teórica, es lo que hace que el nuevo enfoque sea tan poderoso.
"La flexibilidad es algo realmente bueno ... Ahora estamos adaptando DEFT a los problemas en el análisis de supervivencia, el tipo de estadísticas utilizadas en los ensayos clínicos", dijo Kinney. "Esas nuevas capacidades se agregarán a SUFTware a medida que creamoscontinuar desarrollando este nuevo enfoque de las estadísticas "
Fuente de la historia :
Materiales proporcionado por Laboratorio Cold Spring Harbor . Original escrito por Brian Stallard. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :