En un momento tenso cuando se desata una pandemia, los políticos luchan por los votos y los manifestantes exigen justicia racial, un poco de cortesía y cortesía hacen mucho. Ahora los investigadores de la Universidad Carnegie Mellon han desarrollado un método automatizado para hacer que las comunicaciones sean más educadas.
Específicamente, el método toma directivas o solicitudes no educadas, aquellas que usan un lenguaje descortés o neutral, y las reestructura o agrega palabras para hacerlas más educadas. "Enviarme los datos", por ejemplo, podría convertirse en "¿Podrían enviarme los datos? "
Los investigadores presentarán su estudio sobre transferencia de cortesía en la reunión anual de la Asociación de Lingüística Computacional, que se realizará virtualmente a partir del 5 de julio.
La idea de transferir un estilo o sentimiento de una comunicación a otra, por ejemplo, hacer que las declaraciones negativas sean positivas, es algo que los tecnólogos del lenguaje han estado haciendo durante algún tiempo. Shrimai Prabhumoye, estudiante de doctorado en Language Technologies de CMUInstituto LTI, dijo que la transferencia de cortesía ha sido un objetivo durante mucho tiempo.
"Es extremadamente relevante para algunas aplicaciones, como si desea que sus correos electrónicos o chatbot suenen más amables o si está escribiendo un blog", dijo. "Pero nunca podríamos encontrar los datos correctos para realizar estotarea."
Ella y los estudiantes de maestría de LTI Aman Madaan, Amrith Setlur y Tanmay Parekh resolvieron ese problema al generar un conjunto de datos de 1.39 millones de oraciones etiquetadas por cortesía, que usaron para sus experimentos.
La fuente de estas oraciones puede parecer sorprendente. Se derivaron de correos electrónicos intercambiados por empleados de Enron, una compañía de energía con sede en Texas que, hasta su desaparición en 2001, era mejor conocida por el fraude corporativo y la corrupción que por las sutilezas sociales. Peromedio millón de correos electrónicos corporativos se hicieron públicos como resultado de demandas judiciales relacionadas con el escándalo de fraude de Enron y posteriormente se utilizaron como conjunto de datos para una variedad de proyectos de investigación.
Pero incluso con un conjunto de datos, los investigadores fueron desafiados simplemente a definir la cortesía.
"No se trata solo de usar palabras como 'por favor' y 'gracias'", dijo Prabhumoye. A veces, significa hacer el lenguaje un poco menos directo, de modo que en lugar de decir "deberías hacer X", la oración se convierte enalgo así como "déjenos hacer X"
Y la cortesía varía de una cultura a otra. Es común que los norteamericanos nativos usen "por favor" en las solicitudes a amigos cercanos, pero en la cultura árabe se consideraría incómodo, si no grosero. Para su estudio, los investigadores de CMUrestringió su trabajo a hablantes de inglés norteamericano en un entorno formal.
El conjunto de datos de cortesía se analizó para determinar la frecuencia y distribución de las palabras en las oraciones educadas y no educadas. Luego, el equipo desarrolló una tubería de "etiquetar y generar" para realizar transferencias de cortesía. Primero, se etiquetan las palabras o frases maleducadas o no educadas y luegoun generador de texto reemplaza cada elemento etiquetado. El sistema se encarga de no cambiar el significado de la oración.
"No se trata solo de limpiar palabras malas", dijo Prabhumoye sobre el proceso. Inicialmente, el sistema tenía la tendencia de simplemente agregar palabras a las oraciones, como "por favor" o "lo siento". Si "Por favor, ayúdame" eraconsiderado educado, el sistema considerado "Por favor, por favor, ayúdame" aún más educado.
Pero con el tiempo el sistema de puntuación se hizo más realista y los cambios se hicieron más sutiles. Los pronombres en primera persona del singular, como yo, yo y el mío, fueron reemplazados por pronombres en primera persona del plural, como nosotros, nosotros y nuestro. Y en lugar de la posición"por favor" al comienzo de la oración, el sistema aprendió a insertarla dentro de la oración: "¿Podrían enviarme el archivo?"
Prabhumoye dijo que los investigadores han publicado su conjunto de datos etiquetado para que otros investigadores lo usen, con la esperanza de alentarlos a seguir estudiando la cortesía.
Fuente de la historia :
Materiales proporcionado por Universidad Carnegie Mellon . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :