La mayoría de nosotros conoce este fenómeno demasiado bien: tan pronto como hace calor afuera, tienes apetito por un helado refrescante. ¿Pero habrías pensado que las matemáticas podrían estar involucradas?
Expliquemos: el aumento de las temperaturas y el aumento del consumo de hielo son dos variables estadísticas en dependencia lineal; están correlacionadas.
En estadística, las correlaciones son importantes para predecir el comportamiento futuro de las variables. Tales pronósticos científicos son frecuentemente solicitados por los medios, ya sea para el fútbol o los resultados electorales
Para medir la dependencia lineal, los científicos usan el llamado coeficiente de correlación, que fue introducido por primera vez por el científico natural británico Sir Francis Galton 1822-1911 en la década de 1870. Poco después, el matemático Karl Pearson proporcionó una justificación matemática formal parael coeficiente de correlación. Por lo tanto, los matemáticos también hablan de la "correlación de momento-producto de Pearson" o la "correlación de Pearson".
Sin embargo, si la dependencia entre las variables no es lineal, el coeficiente de correlación ya no es una medida adecuada para su dependencia.
René Schilling, profesor de Probabilidad en TU Dresden, enfatiza: "Hasta ahora, se ha requerido un gran esfuerzo computacional para detectar dependencias entre más de dos variables de alta dimensión, en particular cuando están involucradas relaciones no lineales complicadas. Ahora hemos encontrado una solución eficiente y práctica para este problema ".
El Dr. Björn Böttcher, el Prof. Martin Keller-Ressel y el Prof. René Schilling del Instituto de Estocástico Matemático de TU Dresden han desarrollado una medida de dependencia llamada "multivariancia a distancia". La definición de esta nueva medida y la teoría matemática subyacente se publicaron enla revista internacional líder Anales de estadísticas bajo el título "Distancia multivariante: nuevo
Medidas de dependencia para vectores aleatorios ".
Martin Keller-Ressel explica: "Para calcular la medida de dependencia, no solo se registran los valores de las variables observadas, sino también sus distancias mutuas y, a partir de estas matrices de distancia, se calcula la multivariancia de distancia. Este paso intermedio permitedetección de dependencias complejas, que el coeficiente de correlación habitual simplemente ignoraría. Nuestro método se puede aplicar a preguntas en bioinformática, donde los grandes conjuntos de datos deben analizarse ".
En un estudio de seguimiento, se demostró que el coeficiente de correlación clásico y otras medidas de dependencia conocidas pueden recuperarse como casos límite de la multivariancia a distancia.
Björn Böttcher concluye señalando: "Proporcionamos todas las funciones necesarias en el paquete 'multivariancia' para el software de estadísticas gratuito 'R', para que todas las partes interesadas puedan probar la aplicación de la nueva medida de dependencia".
Fuente de la historia :
Materiales proporcionado por Technische Universität Dresden . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :