Para diagnosticar la depresión, los médicos entrevistan a los pacientes y les hacen preguntas específicas sobre, por ejemplo, enfermedades mentales pasadas, estilo de vida y estado de ánimo, e identifican la condición según las respuestas del paciente.
En los últimos años, el aprendizaje automático ha sido defendido como una ayuda útil para el diagnóstico. Por ejemplo, se han desarrollado modelos de aprendizaje automático que pueden detectar palabras y entonaciones del habla que pueden indicar depresión. Pero estos modelos tienden a predecir que unla persona está deprimida o no, según las respuestas específicas de la persona a preguntas específicas. Estos métodos son precisos, pero su dependencia del tipo de pregunta que se hace limita cómo y dónde se pueden usar.
En un documento presentado en la conferencia Interspeech, los investigadores del MIT detallan un modelo de red neuronal que se puede liberar en texto sin procesar y datos de audio de entrevistas para descubrir patrones de habla indicativos de depresión. Dado un nuevo tema, puede predecir con precisión siel individuo está deprimido, sin necesitar ninguna otra información sobre las preguntas y respuestas.
Los investigadores esperan que este método se pueda utilizar para desarrollar herramientas para detectar signos de depresión en una conversación natural. En el futuro, el modelo podría, por ejemplo, impulsar aplicaciones móviles que controlen el texto y la voz de un usuario para detectar angustia mental y enviar alertas.Esto podría ser especialmente útil para aquellos que no pueden llegar a un médico para un diagnóstico inicial, debido a la distancia, el costo o la falta de conciencia de que algo puede estar mal.
"Los primeros indicios que tenemos de que una persona está feliz, emocionada, triste o tiene alguna condición cognitiva grave, como la depresión, es a través de su discurso", dice el primer autor Tuka Alhanai, investigador en Ciencias de la Computación e Inteligencia ArtificialLaboratorio CSAIL ". Si desea implementar modelos [de detección de depresión] de forma escalable ... desea minimizar la cantidad de restricciones que tiene sobre los datos que está utilizando. Desea implementarlo en cualquier conversación normaly que el modelo recoja, a partir de la interacción natural, el estado del individuo ".
La tecnología aún podría, por supuesto, usarse para identificar la angustia mental en conversaciones casuales en consultorios clínicos, agrega el coautor James Glass, un investigador científico principal en CSAIL. "Cada paciente hablará de manera diferente, y si el modelo ve cambiostal vez sea una bandera para los médicos ", dice." Este es un paso adelante para ver si podemos hacer algo de ayuda para ayudar a los médicos ".
El otro coautor del artículo es Mohammad Ghassemi, miembro del Instituto de Ingeniería y Ciencia Médica IMES.
modelado sin contexto
La innovación clave del modelo radica en su capacidad para detectar patrones indicativos de depresión, y luego mapear esos patrones a nuevos individuos, sin información adicional. "Lo llamamos 'sin contexto', porque no está poniendo ningúnrestricciones en los tipos de preguntas que está buscando y el tipo de respuestas a esas preguntas ", dice Alhanai.
Otros modelos reciben un conjunto específico de preguntas, y luego se dan ejemplos de cómo responde una persona sin depresión y ejemplos de cómo responde una persona con depresión, por ejemplo, la pregunta directa, "¿Tiene antecedentes de depresión?"Utiliza esas respuestas exactas para determinar si un nuevo individuo está deprimido cuando se le hace exactamente la misma pregunta." Pero no es así como funcionan las conversaciones naturales ", dice Alhanai.
Los investigadores, por otro lado, utilizaron una técnica llamada modelado de secuencias, a menudo utilizada para el procesamiento del habla. Con esta técnica, alimentaron las secuencias modelo de texto y datos de audio de preguntas y respuestas, tanto de individuos deprimidos como no deprimidos., una por una. A medida que se acumulaban las secuencias, el modelo extraía los patrones de habla que surgieron para las personas con o sin depresión. Las palabras como, por ejemplo, "triste", "bajo" o "deprimido", pueden combinarse con señales de audio queson más planos y más monótonos.
Las personas con depresión también pueden hablar más despacio y usar pausas más largas entre las palabras. Estos identificadores de texto y audio para la angustia mental han sido explorados en investigaciones anteriores. En última instancia, dependía del modelo determinar si algún patrón era predictivo de depresión o no.
"El modelo ve secuencias de palabras o estilo de expresión, y determina que estos patrones tienen más probabilidades de verse en personas deprimidas o no deprimidas", dice Alhanai. "Entonces, si ve las mismas secuencias en temas nuevos,puede predecir si también están deprimidos "
Esta técnica de secuenciación también ayuda al modelo a mirar la conversación como un todo y a notar las diferencias entre cómo las personas con y sin depresión hablan con el tiempo.
Detección de depresión
Los investigadores entrenaron y probaron su modelo en un conjunto de datos de 142 interacciones del Distress Analysis Interview Corpus que contiene entrevistas de audio, texto y video de pacientes con problemas de salud mental y agentes virtuales controlados por humanos. Cada sujeto se clasifica en términosde depresión en una escala entre 0 y 27, utilizando el Cuestionario de salud personal. Los puntajes por encima de un límite entre moderado 10 a 14 y moderadamente severo 15 a 19 se consideran deprimidos, mientras que todos los demás por debajo de ese umbral se consideran no deprimidos.De todos los sujetos en el conjunto de datos, 28 20 por ciento están etiquetados como deprimidos.
En los experimentos, el modelo se evaluó utilizando métricas de precisión y recuperación. La precisión mide cuáles de los sujetos deprimidos identificados por el modelo fueron diagnosticados como deprimidos. La recuperación mide la precisión del modelo en la detección de todos los sujetos diagnosticados como deprimidos en elconjunto de datos completo. En precisión, el modelo obtuvo un 71 por ciento y, al recordarlo, obtuvo un 83 por ciento. El puntaje combinado promedio para esas métricas, considerando cualquier error, fue del 77 por ciento. En la mayoría de las pruebas, el modelo de los investigadores superó a casi todos los demásmodelos.
Una idea clave de la investigación, señala Alhanai, es que, durante los experimentos, el modelo necesitaba mucha más información para predecir la depresión del audio que el texto. Con el texto, el modelo puede detectar la depresión con precisión utilizando un promedio de siete secuencias de preguntas y respuestasCon el audio, el modelo necesitaba alrededor de 30 secuencias. "Eso implica que los patrones en las palabras que las personas usan para predecir la depresión suceden en un lapso de tiempo más corto en el texto que en el audio", dice Alhanai. Estas ideas podrían ayudar a los investigadores del MIT, yotros, refinan aún más sus modelos.
Este trabajo representa un piloto "muy alentador", dice Glass. Pero ahora los investigadores buscan descubrir qué patrones específicos identifica el modelo a través de puntajes de datos sin procesar.
"En este momento es un poco como una caja negra", dice Glass. "Sin embargo, estos sistemas son más creíbles cuando tienes una explicación de lo que están recogiendo ... El próximo desafío es descubrir qué datosse apoderó de él "
Los investigadores también tienen como objetivo probar estos métodos en datos adicionales de muchos más sujetos con otras condiciones cognitivas, como la demencia. "No se trata tanto de detectar la depresión, pero es un concepto similar de evaluar, a partir de una señal diaria en el habla, sialguien tiene un deterioro cognitivo o no ", dice Alhanai.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :