Un paper publicado hoy en PNAS (Human language reveals a universal positivity bias) asevera que existiría en nosotros una “tendencia universal hacia la positividad”, y que esta supuesta tendencia se manifestaría en el lenguaje humano. A continuación, el resumen (traducción mía):
Utilizando la evaluación humana de 100.000 palabras distribuidas en 24 corpora provenientes de 10 lenguas de diversas orígenes y culturas, presentamos evidencia de la existencia de una profunda influencia de la sociabilidad humana en el lenguaje; observamos (i) que las palabras de las lenguas humanas naturales poseen una tendencia (bias) universal hacia la positividad, (ii) que el contenido emocional estimado de las palabras es consistente entre las lenguas al traducirse, y (iii) esta tendencia (bias) hacia la positividad es fuertemente independiente de la frecuencia de uso de las palabras. […] También mostramos cómo nuestras evaluaciones de las palabras pueden utilizarse para construir instrumentos de tipo físico para medir el contenido emocional de textos de gran envergadura, tanto en tiempo real como en modo offline.
Los autores –todos del ámbito de la computación, la matemática y la ingeniería– buscan poner a prueba la hipótesis de Pollyanna de Boucher y Osgood, la cual postula que existiría una tendencia universal hacia la positividad en la comunicación humana.
Para hacerlo, reunieron 24 corpora de textos provenientes de 10 lenguas: inglés, castellano, francés, alemán, portugués brasileño, coreano, “chino simplificado”, ruso, indonesio y árabe (coloco “chino simplificado” entre comillas porque, al contrario de lo que piensan los autores, no es una lengua, sino un sistema de escritura).
Luego, extrajeron las palabras más frecuentes de cada corpus (debo suponer que eliminaron las palabras gramaticales –palabras como a, en, por, para–, pero no encuentro ninguna mención de este procedimiento en el paper) y las sometieron al juicio de una serie de personas mediante una encuesta. La tarea específica consistió en elegir el emoticón que mejor expresaba la respuesta emocional que cada palabra provocaba:
Finalmente, en base a estas evaluaciones y la frecuencia de uso de las distintas palabras (mientras más frecuentes, más importantes), concluyen que existe una tendencia universal hacia la positividad en la comunicación humana, tal como se apreciaría en el siguiente gráfico (donde el color celeste representa las palabras negativas y el amarillo, las palabras positivas):
La técnica que emplean los autores aquí se llama bolsa de palabras. Este método descarta toda la información pragmática y sintáctica de los textos, para enfocarse exclusivamente en la semántica: qué significan las palabras de manera aislada. Veamos un ejemplo de cómo funciona…
Tomemos la siguiente lista de palabras léxicas (es decir, palabras no gramaticales): amor atención campeones clínica corazón deseo doncella equipo eternos jugadores llenó médica maravillosa mejor metió pulcra todos. Luego, evaluemos cada palabra en términos de su positividad. Para los fines de este ejemplo, en vez de utilizar una escala de 1 a 10, simplemente vamos a decir si una determinada palabra nos parece positiva (verde) o no (negro):
- amor
- atención
- campeones
- clínica
- corazón
- deseo
- doncella
- equipo
- eternos
- jugadores
- llenó
- médica
- maravillosa
- mejor
- metió
- pulcra
- todos
Finalmente, calculemos la positividad de la lista de palabras (simplificando de nuevo: no vamos a ponderar su frecuencia). Vemos que de 17 palabras, 11 son positivas (a mi juicio; otros podrían evaluarlas de manera levemente distinta), lo cual da un puntaje de positividad de 0,647. ¡Muy positiva la lista! Es en base a una versión más sofisticada de este procedimiento que los autores sacan conclusiones sobre el lenguaje y la misma naturaleza humana.
Ahora bien, como señalé más arriba, la técnica de la bolsa de palabras descarta toda la información pragmática y sintáctica de los textos antes de analizarlos. Veamos la misma lista que acabamos de analizar, pero ahora con toda la información presente (y las palabras gramaticales también):
A la pulcra doncella que me llenó el corazón de amor y luego se metió con todos los jugadores del equipo de los eternos campeones, sólo le deseo la mejor atención médica en una maravillosa clínica.
No sabemos exactamente cuáles son las emociones que estaba experimentando el autor de este texto al escribirlo –odio, rencor, desprecio, enojo, rabia, indignación, etcétera– pero está más que claro que eran profundamente negativas. Desde el comienzo hasta el final, estas palabras desprenden ponzoña. Pero según la técnica de la bolsa de palabras, es un texto muy positivo.
Los problemas de este método son antiguos, profundos y archiconocidos. Es tan burdo que no es capaz de distinguir “contento” de “no contento”, “muchas posibilidades” de “cero posibilidades” ni “murió” de “nunca morirá”.
Así las cosas, no es particularmente atrevido decir que este estudio no nos dice absolutamente nada sobre el lenguaje, la naturaleza humana ni universales de ningún tipo. Pero sí brinda una lección importante sobre los peligros de tratar el lenguaje humano como un conjunto de datos cualquiera.