La voz humana se desvanece y la sincronización automática con IA en el trayecto del creador

En los últimos años, hemos observado un notable ascenso de la inteligencia artificial (IA) que ha comenzado a infiltrarse en diversos sectores que previamente podían parecer insospechados. Inicialmente, la IA revolucionó el desarrollo de software, pero ahora esta tecnología se expande a campos completamente distintos. Un fenómeno interesante es la «codificación de ambas», un enfoque innovador en la programación que se fundamenta en Solicitudes en lenguaje natural, permitiendo cambiar las reglas de desarrollo sin necesidad de escribir código de manera convencional. Además, herramientas como OpenAai y Adobe Firefly están transformando el mundo de la creación visual, facilitando la generación de imágenes y videos a partir de descripciones textuales, lo cual abre un abanico de posibilidades creativas.

La IA también se introduce en el ámbito de los profesionales del idioma. Recientemente, YouTube ha comenzado a ofrecer a algunos desarrolladores la posibilidad de sincronizar automáticamente sus videos mediante inteligencia artificial. Esta funcionalidad se está implementando de manera gradual y ya está disponible para todos los miembros del Programa de socios de YouTube, que permite a los creadores monetizar su contenido dentro de la plataforma. Gracias a esta herramienta, los videos pueden acceder más fácilmente a audiencias globales, convirtiéndose en una alternativa eficaz a los métodos tradicionales de sincronización y postproducción.

Una función activada por defecto. Uno de los cambios más destacados es que la sincronización automática está activada de manera predeterminada: si un creador sube un video en inglés, YouTube lo traduce automáticamente a múltiples idiomas, como español, francés, alemán, hindi, indonesio, italiano, japonés y portugués. En caso de que el video original esté en alguno de estos idiomas, se genera una versión en inglés. La compañía ha subrayado que su intención es «romper las barreras del idioma», promoviendo así una mayor accesibilidad a los contenidos.

En el caso de que los creadores prefieran no utilizar esta función, pueden desactivarla siguiendo ciertos pasos. Deben acceder a YouTube Studio desde su computadora y navegar a: configuración > Ajustes posteriores > Configuración extendida. Allí, pueden desmarcar la opción de «sincronización automática» y finalizar el proceso haciendo clic en el botón correspondiente. Además, YouTube Studio ofrece la opción de gestionar esta función en computadoras, lo que también permite a los creadores verificar la sincronización manualmente antes de publicarla, lo que les proporciona un mayor control sobre el resultado final.

YouTube reconoce que la tecnología todavía necesita mejorar. Es importante señalar que las traducciones generadas pueden carecer de precisión y la voz producida puede no reflejar adecuadamente la personalidad del autor. De hecho, la propia compañía admite que matices como la entonación, el tono emocional y ciertos detalles culturales pueden no ser interpretados correctamente. Aunque esta funcionalidad se sustenta en tecnologías avanzadas como Google DeepMind y Google Translate, todavía hay ciertos videos que no pueden ser doblados con eficacia. Elementos como el acento original, ruido de fondo, el uso de jerga e incluso nombres propios pueden influir en la calidad de la sincronización.

Un video con sincronización automática de YouTube

Para determinar si un video ha sido doblado mediante IA, basta con buscar la etiqueta «Auto-durado». También es posible cambiar la pista de audio desde el menú del reproductor utilizando el ícono de engranaje situado en la esquina inferior derecha. El idioma se ajusta automáticamente al que el usuario ha configurado como preferido, lo cual mejora la experiencia general del espectador. En este video de ejemplo podemos apreciar la funcionalidad en acción.

Un paso previo: sincronización real con actores profesionales. YouTube ya había hecho avances en esta dirección con la función «Agregar pista de audio«. Algunos creadores, como MrBeast, comenzaron a ofrecer versiones de sus videos en múltiples idiomas. La inclusión de actores de voz profesionales ha sido fundamental en esta estrategia, incluso ha colaborado con el doblador de Naruto para sus versiones en japonés. Este enfoque, que se centra en la expansión del contenido sin sacrificar la calidad interpretativa, ha permitido que muchos videos alcancen nuevas audiencias.

Pero MrBeast no fue el único. De acuerdo con los datos de YouTube, los videos que presentan versiones en múltiples idiomas han generado más del 15% del tiempo total de visualización de la audiencia que consumió dicho contenido en un idioma distinto al original. Durante enero de 2023, los usuarios alcanzaron un consumo diario superior a 2 millones de horas de contenido doblado, ¡y esto es solo en las fases iniciales de prueba!

La incorporación de esta función a todos los miembros del programa de socios contribuye al crecimiento del uso de voces generadas por inteligencia artificial dentro de la plataforma. Esto plantea interrogantes sobre cómo esta tecnología se integrará en el ecosistema de la sincronización profesional y cómo impactará el futuro de la creación de contenido.

Es probable que algunos creadores opten por esta alternativa automática en ciertos tipos de contenido, especialmente en piezas informativas o estructuradas. Sin embargo, en otros formatos donde la interpretación vocal entrega matices significativos, el papel de los profesionales en sincronización seguirá siendo fundamental. El desarrollo de esta tecnología avanza constantemente y el balance entre automatización y creatividad continúa en proceso.

Fotos | Lorenzi | Grabación de pantalla de YouTube

En | Dos estudiantes crearon una IA en entrevistas de trabajo para «hacer trampa»: los recompensaron con $ 5.3 millones