LA DIARIA / CIENCIA
Orsi dominó el debate según una técnica de análisis de la voz reportada por la ciencia para este tipo de encuentros
19.11.2024
MONTEVIDEO (Uypress)- Aplicando un método usado en debates presidenciales de Estados Unidos, basado en la teoría del ajuste de la voz de parte de quien se percibe en una posición desfavorable, un estudio impulsado por la sección Ciencia de La Diaria arroja que Yamandú Orsi se impuso a Álvaro Delgado.
Tras el debate que tuvo lugar el domingo 17 de noviembre entre los candidatos que disputan la presidencia en el balotaje del domingo 24, Álvaro Delgado y Yamandú Orsi, los análisis sobre cuál de los dos se desempeñó mejor, a quién le sirvió más el encuentro y quién fue percibido como "ganador" han ocupado buena parte de la agenda. En las páginas de la diaria, escribe en su nota Leo Lagos, hemos publicado notas sobre cómo algunos actores políticos evaluaron el encuentro y también cómo lo apreciaron especialistas de disciplinas como la sociología y la ciencia y comunicación política.
Desde esta sección quisimos hacer un aporte al tema procurando si habría alguna forma científica -y, por lo tanto, no sólo con un alto grado de objetividad con relación a las ideas y sentimientos de quien analiza, sino también de los contenidos propuestos y las estrategias desplegadas- para determinar si uno de los dos candidatos se impuso o no a su rival. El espaldarazo para intentarlo vino de unas breves líneas de un libro escrito por un fabuloso primatólogo, es decir, una persona que investiga a chimpancés, bonobos y otros integrantes del orden al que pertenecemos los seres humanos.
En el capítulo titulado "Poder" del libro El mono que llevamos dentro, el siempre fabuloso Frans de Waal escribía sobre las jerarquías presentes tanto en monos no humanos como en nosotros. Contaba entonces que se habían hecho investigaciones analizando las frecuencias de la voz humana por debajo de los 500 Hertz, una frecuencia de nuestra voz en la que las palabras no son prácticamente distinguibles (quienes quieran explorar estos sonidos pueden entrar a alguna página generadora de tonos), que mostraron que durante una conversación entre dos personas, la de "menor estatus" trata de ajustar esas frecuencias a las de la persona de "mayor estatus" con la que habla.
"Esto se demostró por primera vez en un análisis de entrevistas del programa de televisión Larry King Live", narra De Waal. "El presentador, Larry King, adaptaba su timbre al de los invitados de alto rango, como Mike Wallace o Elizabeth Taylor", dice, mientras que "los invitados de bajo rango adaptaban su timbre al de King". La política y el poder le interesaban muchísimo al primatólogo, por lo que destacaba que "el ajuste más claro a la voz de King, que indicaba falta de confianza, provino del vicepresidente Dan Quayle", quien ocupó ese cargo en Estados Unidos entre 1989 y 1993. Hasta allí me dejaba llevar por la siempre lúcida e informativa prosa de Frans de Waal. Pero el siguiente pasaje me dio una bofetada inspiradora que recién ahora, siete años después de haber sido leído, logré concretar.
"El mismo análisis espectral se ha aplicado a los debates televisados entre candidatos presidenciales estadounidenses. En las ocho elecciones celebradas entre 1960 y 2000, el voto popular coincidió con el análisis de voz: la mayoría de la gente votó por el candidato que mantenía su propio timbre en lugar de por el que se adaptaba", escribía De Waals. "En algunos casos, las diferencias fueron extremas, como entre Ronald Reagan y Walter Mondale, y sólo en 2000 fue elegido un candidato con un patrón de voz ligeramente subordinado, George W Bush", informaba, aclarando que en realidad aquello no contradecía el trabajo: "Esto no fue realmente una excepción a la regla", sostenía, porque "el voto popular en realidad fue para el candidato con el patrón de voz dominante, Al Gore". El primatólogo redondeaba entonces: "Por debajo del radar de la conciencia, comunicamos nuestro estatus cada vez que hablamos con alguien".
Boooom. La idea estalló en mi cabeza. ¿Y si aplicáramos la metodología de tales estudios a un debate presidencial en Uruguay? Rápidamente fui a la bibliografía citada en el libro y vi dos artículos científicos que hablaban del tema: "Una señal no verbal en las voces de los entrevistados predice eficazmente la adaptación comunicativa y las percepciones del estatus social", de 1996, y "Análisis espectral de la comunicación vocal no verbal de los candidatos: predicción de los resultados de las elecciones presidenciales de Estados Unidos", de 2002, ambos con el investigador Stanford Gregory como primer autor. Tras leer este libro, las próximas elecciones con debate fueron las que disputaron Daniel Martínez y Luis Lacalle. Entonces no llegué a tiempo con la idea de hacer este análisis. Pero en 2024 las cosas fueron distintas.
Buscando ayuda de investigadores para analizar las voces del debate
Para este debate de 2024 entre Álvaro Delgado y Yamandú Orsi, bajé la bibliografía y la leí con detenimiento. A su vez, esos trabajos científicos me llevaron a otros. Todo apuntaba a que podía intentar aplicarse este método para determinar si en el debate presidencial uno de los dos dominaba y el otro estaba subordinado. Pero una cosa es escribir sobre ciencia y otra hacer ciencia. Así que recurrí a investigadores.
El biomecánico Ernesto Blanco, del Instituto de Física de la Facultad de Ciencias de la Universidad de la República, colaboró buscando más bibliografía que aclarara bien el método empleado para analizar las voces, los programas estadísticos para analizar los componentes de esas mediciones y demás. Así dimos con un trabajo de 2017, titulado "Adaptación vocal no verbal y percepciones de la audiencia sobre dominio y prestigio", en el que, en los materiales suplementarios, se describía el método paso a paso tanto para realizar las mediciones a partir de la grabación del audio del debate como los pasos para hacer el análisis estadístico de componentes que determina quién tiene mayor estatus (el de menor estatus de los dos es el que más cambiará su frecuencia de voz procurando acercarse a la del contrincante). Había algunas dudas de si el método era el mejor para estudiar el fenómeno medido, pero aun así quedó claro que si así se había medido en los trabajos publicados, medirlo de la misma manera en esta oportunidad iría de la mano con el conocimiento existente.
Entra entonces en escena el astrónomo Gonzalo Tancredi, quien, entre algunos otros investigadores tanteados, cumplía con la doble condición de entusiasmarle la idea y de tener el tiempo y los medios -por ejemplo, el software de análisis de datos SPSS- para llevarla a cabo. Así como Blanco, Tancredi también disfruta aplicando la ciencia a la que se dedica a otras cuestiones, como ya demostró en ocasiones anteriores cuando lo apodamos "el astrónomo de masas". Gonzalo leyó la bibliografía, hizo exploraciones extra y, recurriendo también al auxilio de Thomas Gallot, del Laboratorio de Acústica Ultrasonora de la Facultad de Ciencias, se embarcó en la tarea de ver si podía aplicarse esta metodología exitosamente, con los medios que contaba, para analizar qué había sucedido en el debate de 2019 entre Luis Lacalle y Daniel Martínez. Estudiar señales sísmicas y aplicar análisis estadísticos a los datos es tarea de todos los días para estos colegas.
¿Quién dominó el debate Lacalle-Martínez en 2019?
Bajando la grabación del debate y analizando los audios de Lacalle y Martínez con los parámetros detallados por Will Kalkhoff y colaboradores en su artículo de 2017 "Adaptación vocal no verbal y percepciones de la audiencia sobre dominio y prestigio", así como el consiguiente análisis de componentes, los datos obtenidos dieron dos grandes resultados. El primero de ellos: la técnica podía emplearse. El segundo: se obtenía un ganador en esto del estatus y un perdedor que acomodó su timbre de voz en las frecuencias por debajo de los 500 Hz.
Según las indicaciones metodológicas, las intervenciones de Martínez y Lacalle debían registrarse en cada uno de los bloques del debate, que en aquella oportunidad fueron cuatro. Los datos obtenidos una vez realizado el análisis de componentes rotados arrojó para Luis Lacalle promedios de 0,937 para el primer bloque, 0,94 para el segundo, 0,917 para el tercero y 0,917 para el cuarto. Daniel Martínez, por su parte, puntuó 0,187 en el primer bloque, 0,297 en el segundo, 0,477 en el tercero y 0,285 en el cuarto. El análisis de componentes rotados, tal como se propone en el referido artículo, arrojó que el promedio del primer componente (denominado "resultado del análisis acústico", AAR por su sigla en inglés) fue de 0,92 para Lacalle y de 0,31 para Martínez.
Como sostenían Kalkhoff y colaboradores en su trabajo, "la persona más dominante tiene el valor AAR más alto". Agregaron que "los valores AAR altos reflejan un menor ajuste vocal hacia un interlocutor y los valores AAR relativamente más bajos indican una mayor acomodación vocal". Siguiendo esto, puede decirse que Lacalle fue la persona más dominante en aquel debate.
De esto se desprende otro dato sumamente relevante. En el ya mencionado artículo "Análisis espectral de la comunicación vocal no verbal de los candidatos: predicción de los resultados de las elecciones presidenciales de Estados Unidos", publicado en 2002 por Stanford Gregory y colaboradores, se mostraba que el ganador en ese sentido de dominar el debate al lograr que el otro ajustara más su voz en ocho debates televisados para elecciones presidenciales de Estados Unidos (1960 Kennedy-Nixon, 1976 Carter-Ford, 1980 Reagan-Carter, 1984 Reagan-Mondale, 1988 Bush-Dukakis, 1994 Clinton-Bush, 1996 Clinton-Dole y 2000 Bush-Gore) había luego obtenido más votos en las elecciones. Por lo tanto, Gregory y colaboradores concluían que esta métrica "predice con precisión los resultados del voto popular en todas esas ocho elecciones".
Al analizar el debate entre Martínez y Lacalle, aquí también se habría dado ese valor predictivo de la métrica: Lacalle dominó el debate medido por esta métrica del ajuste vocal y luego se impuso en las urnas, obteniendo la presidencia. Esta nueva observación, coincidente con lo reportado en la literatura científica consultada, aumentaba la curiosidad de ver qué pasaba con el debate Delgado-Orsi.
¿Quién dominó el debate Delgado-Orsi?
El domingo nos repartimos el trabajo: mientras que en mis hombros recayó la tarea de grabar el debate capturando en mi computadora la transmisión por streaming de la señal de la Televisión Pública, Canal 5, cortar las intervenciones en tres bloques de similar duración -primer bloque con introducción y dos temas, segundo bloque con dos temas y tercer bloque con el tema final y el cierre- y exportar luego cada pista de audio con las especificaciones requeridas (audios en formato wav con una frecuencia de sampleo 48 kHz y una precisión de 16 bits), Tancredi y Gallot obtuvieron una transformada rápida de Fourier (FFT por su sigla en inglés) de los audios empleando el software Matlab, con el que están familiarizados, para posteriormente hacer el análisis de componentes con el software SPSS, con el que se obtienen los números como los ya comentados para el debate Lacalle-Martínez.
Todo este trabajo, que llevó su tiempo y mensajes en la madrugada que continuaron durante la mañana y la tarde del lunes, arrojó las cifras para cada debatiente en cada bloque. En el componente 1 del resultado rotado, Delgado obtuvo una puntuación de 0,275 en el primer bloque, de 0,361 en el segundo y de 0,257 en el tercero. Por su parte, Orsi registró 0,919 en el primer bloque, 0,931 en el segundo y 0,941 en el tercero. Al promediar todo esto para cada uno se obtiene el resultado del AAR de 0,93 para Orsi y 0,30 para Delgado.
Con estos datos aportados por los físicos, cabe hacer una interpretación de los resultados. Dado que "los valores AAR altos reflejan un menor ajuste vocal hacia un interlocutor y los valores AAR relativamente más bajos indican una mayor acomodación vocal", se puede concluir entonces que Orsi ajustó menos su voz durante el debate, lo que implica que dominó jerárquicamente a Delgado (siempre de acuerdo con la literatura consultada y ya aplicada y publicada en revistas científicas internacionales). Teniendo presente aquello que decía De Waal, que "por debajo del radar de la conciencia comunicamos nuestro estatus cada vez que hablamos con alguien", Delgado habría tratado de acomodar su voz ante un Orsi al que percibió como dominando el debate.
A este respecto, vale la pena citar un dato no menor señalado por Gregory y colegas en su artículo ya citado de 2002: "Las percepciones de los candidatos y los votantes sobre los participantes en la campaña presidencial incluyen nociones sobre el dominio relativo de un candidato sobre otro; estas percepciones se construyen en el curso de la campaña mediante una serie de atributos convencionales como el partidismo, la proximidad a los temas, las evaluaciones de la personalidad y el carácter, el financiamiento de la campaña y la cobertura de los medios de comunicación". También señalan que "estos atributos culminan y se expresan en las encuestas realizadas en varios puntos antes de la elección", y agregan que "es obvio que un buen resultado en las encuestas influye en la autoestima del candidato y en sus percepciones de su estatus personal". Según todas las encuestas acerca del resultado del balotaje publicadas antes del día del debate, Orsi estaba por arriba en la intención de voto que Delgado. Esto, entre otros factores, podría haber tenido que ver con lo que estas métricas recogen.
¿Quién ganará las elecciones el domingo?
Estas métricas para determinar quién domina un debate presidencial y qué participante ajusta su voz de acuerdo a lo que impone el candidato de mayor estatus ya fueron empleadas en ocho elecciones presidenciales de Estados Unidos y en todas ellas quien dominó en este sentido el debate ganó luego las elecciones. Eso también ocurrió al analizar el debate Lacalle-Martínez, en el que el primero de los dos resultó dominante en el debate y luego ganó en las urnas. El 24 de noviembre sabremos si eso nuevamente se cumple aquí en Uruguay.
Artículo: A nonverbal signal in voices of interview partners effectively predicts communication accommodation and social status perceptions
Publicación: Journal of Personality and Social Psychology (1996)
Autores: Stanford Gregory y Stephen Webster
Artículo: Spectral analysis of candidates' nonverbal vocal communication: predicting U.S. presidential election outcomes
Publicación: Social Psychology Quarterly (2002)
Autores: Stanford Gregory y Timothy Gallagher
Artículo: Nonverbal vocal adaptation and audience perceptions of dominance and prestige
Publicación: Social Psychology Quarterly (2017)
Autores: Will Kalkhoff, Shane Thye y Stanford Gregory
¿Qué entendemos por dominancia y ajustar la voz en relación al estatus?
Consultando la literatura, podemos señalar que "el fenómeno de la adaptación en conversaciones y entrevistas ha sido ampliamente reportado por investigadores lingüísticos, psicólogos sociales y de la comunicación", desde la década de 1970 en adelante. La teoría del ajuste de la comunicación (CAT en inglés por communication accommodation theory) postula entonces que "las personas de estatus social más bajo adaptan sus patrones vocales no verbales a las personas de estatus más alto", y agrega que "estas últimas modifican sus patrones vocales relativamente poco".
Aclaramos entonces que estatus social no tiene que ver con clase social ni con factores socioeconómicos -aunque puede ser afectado por ellos-. Como sostuvo el investigador Allan Mazur en su trabajo A biosocial model of status in face-to-face primate groups, de 1985, "la persona de alto estatus marca el ritmo y el estado de ánimo de la conversación, y la persona de bajo estatus le sigue".
Como reportan Will Kalkhoff y colegas en su trabajo de 2017, "la investigación posterior de Gregory (1990) determinó que la adaptación vocal está presente principalmente en el rango inferior, no verbal, de los espectros de frecuencia de los interlocutores (es decir, por debajo de 500 Hz). Esta banda de frecuencia se denomina 'no verbal' porque se percibe como un 'sonido murmurado' como el que se podría escuchar en una conversación que se 'filtra' a través de una pared", tal como definieran el investigador Timothy Gallagher y colegas en 2005.
Al comentar el trabajo de Gregory y colegas analizando los debates presidenciales, Kalkhoff y los suyos destacan que "basándose en investigaciones anteriores relacionadas, enfatizaron que el 'contenido' decodificado inconscientemente de las señales vocálicas no verbales podría influir en el surgimiento del significado social en las interacciones más que el razonamiento manifiesto (es decir, más que la evaluación consciente de los argumentos verbales). La sugerencia audaz aquí es que, independientemente de lo que suceda durante una interacción, la persona que muestra una mayor adaptación vocal no verbal durante una conversación puede ser percibida por los observadores como menos prestigiosa y/o menos dominante".
Foto: Javier Calvelo / adhocFOTOS
UyPress - Agencia Uruguaya de Noticias