Captions (Subtitulaje) vs Intérpretes

Captions (Subtitulaje) vs Intérpretes

1. HIPAA

Para la HIPAA el intérprete debe ser una Entidad Cubierta (Covered Entitiy) o un Asosiado de Negocio (Business Associate). Hasta el momento ningún programa de captions ni subtitluaje se encuentra registrado como CE o BA.

2. Código de ética

El punto 1 del código de ética del intérprete es la confidencialidad, cuándo y porqué romperla. Un programa de IA no conoce la HIPAA ni tiene conocimiento del cómo, cuándo y porqué sí o no romper la confidencialidad del paciente, por lo que si el algoritmo está programado para compartir información, lo hará sin ninguna consideración ética, a menos de que los programadores lo hayan determinado así, cosa que nosotros no podemos saber.

En el punto 2 se determina que la interpretación debe ser fiel por lo que debe incluir también la intensión y el sentido de la interpretación, de momento no existe ninguna IA que contenga esta característica y probablemente tomará décadas para que así sea. 

Difícilmente el intérprete puede estar poniendo atención a la lectura del captions y a la intención al mismo tiempo, y desarrollar la capacidad de escucha precisa es más rápido, más fácil y más preciso que desarrollar esta capacidad de leer y escuchar al mismo tiempo mientras se hace la traducción mental.

Tampoco existe de momento ninguna IA al alcance que consiga entregar el valor de la interpretación como acto de beneficencia, es decir, nuestra interpretación debe ser un medio para hacer el bien y ayudar.

Ninguna IA a nuestro alcance, de momento tiene la capacidad de diferenciar las culturas y aportar los comentarios necesarios para dar una aportación cultural precisa.

De momento las IA al alcance para subtitular no cuentan con autocorrección derivada del contexto. Los intérpretes estamos preparados, o deberíamos, para autocorregirnos constantemente, sobre todo si en algún punto hubo alguna malinterpretación del contexto, tenemos la posibilidad de corregir y debemos hacerlo de inmediato.

En la parte 8 menciona que los intérpretes tenemos la responsabilidad de mejorar nuestras habilidades y conocimientos con respecto a nuestra profesión de intérpretes y esto nos lleva a la razón que personalmente encuentro más importante para nuestro desarrollo como intérpretes, que es perfeccionar la habilidad de escuchar y entender lo que estamos escuchando, el llamado “listening”.

El “listening” o la comprensión de ambos idiomas es una habilidad muy importante, necesitamos mejorarla e incrementarla día con día, así como lo hicimos con nuestra lengua materna o con personas que n hablan claramente, pero que tenemos cerca, como un bebé pequeño o una persona con afasia, sus familiares desarrollan la capacidad de comprender sus palabras aunque estén entrecortadas o mal pronunciadas. Esta habilidad se ve disminuida o truncada cuando utilizamos captions o subtitulado.

También es importante recordar que los procesos mentales de leer y traducir, y escuchar y traducir son diferentes, nuestro trabajo como intérpretes implica escuchar y traducir, por lo que cuando leemos y traducimos desarrollamos una habilidad diferente, mermando la habilidad que sí requerimos en nuestra profesión.

¿Qué tan precisos son los Live-captions?

En el estudio “The accuracy of automatic and human live captions in English” del 2023, de la revista Linguistica Antverpiensia New Series – Themes in Translation Studies No. 22 páginas 114–133, por los investigadores Nazaret Fresno y Pablo Romero-Fresco, quienes hicieron un análisis de 17,000 ejemplos, encontraron que, en el subtitulaje de programas de televisión, la precisión del subtitulaje humano oscila entre el 99.4 y el 95%, mientras el subtitulaje automático por IA oscila entre el 95.7 y el 96.3%, siendo el humano visiblemente más preciso que el IA y recordando que los programas de televisión se realizan en estudios de grabación con poco o nada de ruido ambiental, locutores calificados que generalmente usan telepromter con una redacción y sintaxis perfectas.

No logré encontrar un análisis de la precisión entre un intérprete médico calificado y uno que utiliza live-captions, pero si alguna vez has utilizado captions (creo que todos alguna vez caímos en la trampa), sabes que la precisión en un entorno como el de los consultorios médicos y mucho más de la sala de emergencias, es realmente pobre, ya que la IA, a diferencia del desempeño oído-cerebro humano, no tiene la capacidad de discernir entre una palabra que cumple con el contexto o no, sólo se basa en el sonido “estricto” del fonema, es decir, cuántas veces pronunciamos una “b” por una “p” debido a la rapidez, cuantas veces articulamos mal alguna vocal, sobre todo en inglés donde existen 12 vocales distintas que se “contaminan” con las consonantes subsecuentes.

Perspectiva personal y recomendación

Hace tres años, en mis comienzos como intérprete médico, me pareció fascinante la idea de poder “apoyarme” con live-captions, cayendo en la trampa, en ese entonces trabajaba para una compañía freelance que difícilmente nos observaba, en un año jamás me llegó una llamada de calidad, ni siquiera una tabla de rendimiento, y como a penas estaba estudiando para certificarme, no conocía bien todavía los códigos de ética ni había reflexionado al respecto, pero en ese entonces pude notar que era yo más tendiente a la traducción con anacolutos, es decir, mi traducción sintácticamente era correcta, pero solía caer en una falta de significado, de por sí los médicos tienden a omitir o dar por hecho, por eso es tan importante que un humano realice la interpretación médica. 

Así que usé el captions dos veces y a la tercera me di cuenta de que tardaba más en corregir el anacoluto (sintaxis correcta sin significado semántico) o agredía el estándar de propiciar la fluidez en la comunicación, porque el paciente preguntaba, “¿Qué dijo? Perdón no le entendí” y el doctor tenía que volver a dar toda la explicación de nuevo, en este caso no cambió ni una coma, por lo que noté que me confundí más tratando de arreglar mi propio anacoluto, que si de inicio hubiera puesto atención, no palabra por palabra, sino significado por significado.

Esto nos lleva al siguiente punto: ¿Podemos leer y escuchar al mismo tiempo? La respuesta es: ¡No! Y tal vez estés pensando en nuestros LU’s, cuando escuchamos y leemos, o cuando estudiamos pronunciación lo bueno que es escuchar y leer al mismo tiempo para aprender a pronunciar correctamente y claro, estamos escuchando y leyendo la misma palabra al mismo tiempo, tal vez incluso estás poniendo atención y decodificando la información, pero este no es el caso de captions: 

1.- Captions tiene segundos de desface, por lo que es imposible escuchar y leer exactamente al tiempo. 

2.- Captions puede cometer errores que tal vez tú como intérprete familiarizado con la terminología y el contexto no cometerías tras la práctica que captions está impidiendo. 

3.- El multitask es imposible, no existe, es decir, nuestro cerebro puede cambiar la tarea que está realizando rápidamente, tan rápido que nos genera la fantasía de que estamos diferentes tareas al mismo tiempo.

La Dra. Susan Weinschenk en su libro 100 Thinkgs Every Presenter Needs to Know About Peolple, dice lo siguiente y cito literal:

  • Conmutar de tarea es “caro”: tardas más tiempo en completar tareas si conmutas entre ellas que si te concentras en cada una.
  • Cometes más errores cuando conmutas que cuando realizas tareas de una en una.
  • Cuanto más complejas sean las tareas, mayores serán el coste y los errores.
  • Aunque conmutar de tarea puede llevar 1/40 de segundo, a medida que pasas más tiempo conmutando, puedes llegar a perder un 40% de tu productividad.
  • La conmutación de tareas involucra numerosas áreas de tu cerebro. Puedes consultar numerosas investigaciones en este campo en la página de la American Psychological Association Multitasking: Switching costs.

Después de mi experiencia personal y después de leer toda esta evidencia, me di cuenta de que el uso de live captions es inapropiado por todas las razones anteriores, pero además  estaba entorpeciendo mi crecimiento en la profesión de intérprete, ya que no me permitía practicar y perfeccionar habilidades fundamentales para nuestra profesión como:

  • Escucha activa
  • Comprensión auditiva del idioma no nativo
  • Conciencia durante la práctica
  • Toma de notas
  •  Traducción significado por significado

Ahora que sigo practicando y desarrollando estas habilidades me siento mucho más preparada, más tranquila y disfruto mucho más de mi tiempo como intérprete, siempre disfruté interpretar, pero ahora de verdad tengo la paz emocional de gozar cada minuto, incluso de aquellos momentos en que el audio es malo, esto es debido a que con toda seguridad puedo decir que no entendí, no porque no esté lo suficientemente preparada, sino porque el audio es muy malo o entender, como lo haría en español, que el doctor o la doctora está usando un dialecto con el que no estoy familiarizada, gracias a ello reviso la zona en la que estamos y luego busco videos o podcast de esa zona para practicar.

No mentiré, al inicio fue un camino sinuoso, hace tres años cuando comencé a hacer interpretación médica, me di cuenta de que este trabajo implicaba una enorme responsabilidad, por lo que para mejorar mi habilidad de comprensión al escuchar el inglés, decidí ingresar a trabajar como agente telefónico de servicio al cliente en Texas, porque el acento texano de verdad me era imposible, ya que logré superar este bloqueo con el acento texano tuve que practicar diario con este y otros dialectos, y lo sigo haciendo, ya que el inglés no es mi idioma fuerte y algunos dialectos se me complican más que otros, como los de Illinois, Baltimore, y otros.

Lo que quiero decir con esto es que no debemos desistir en nuestra profesión, practicar diario no es algo que hagamos por nuestra empresa, tampoco es algo que hacemos porque estemos obligados, la práctica diaria es algo que hacemos por nosotros mismos.

Recordemos que el conocimiento y las habilidades adquiridas son algo muy poderoso, me gusta decirle a mis alumnos de español avanzado que las joyas y el dinero son ese tipo de regalos que uno recibe y permanencen con quien los posee, pero nadie más, o sea, si tú los regalas te quedas sin ellos. Pero el conocimiento es uno de esas cosas que mientras más compartes, más grande se hace.

Referencias:

1.

https://www.taylorfrancis.com/chapters/edit/10.4324/9780203488430-2/visual-linguistic-processing-eye-fixations-reading-keith-rayner-simon-liversedge?context=ubx&refId=6c493f10-c6f5-4f3d-bfc3-d10a1708e083

The accuracy of automatic and human live captions in English

  • December 2023
  • Linguistica Antverpiensia New Series – Themes in Translation Studies 22:114–133
  • 22:114–133

DOI:10.52034/lans-tts.v22i.774

Authors:

Pablo Romero-Fresco

Nazaret Fresno

https://www.researchgate.net/publication/376600706_The_accuracy_of_automatic_and_human_live_captions_in_English

Weinschenk, S. (2012). 100 things every presenter needs to know about people. New Riders.

X