Microsoft ha anunciado una innovadora función en su plataforma de videollamadas Teams que permite a los usuarios comunicarse en diferentes idiomas mediante traducciones en tiempo real impulsadas por inteligencia artificial (IA). Esta herramienta no solo traduce el contenido de la conversación, sino que también simula la voz del orador en el idioma de destino, ofreciendo una experiencia más natural y fluida en las reuniones virtuales.
Índice de contenidos
Traducción en tiempo real con voz personalizada
La nueva función de Teams utiliza la tecnología de IA de Copilot para interpretar y traducir las palabras del orador. Durante una videollamada, los participantes pueden activar esta opción que reemplaza el audio original por una pista en el idioma deseado que mantiene una voz similar a la del hablante. Esto facilita la comunicación entre participantes que hablan distintos idiomas, eliminando barreras lingüísticas y promoviendo reuniones más inclusivas.
Antes de iniciar una reunión, Teams solicita a los participantes su consentimiento para activar esta función, garantizando la privacidad y el control del usuario. Una vez aceptado, los usuarios pueden elegir entre nueve idiomas disponibles: inglés, español, francés, alemán, italiano, mandarín, japonés, coreano y portugués de Brasil. Esta selección inicial se ampliará en el futuro para incluir más idiomas y dialectos.
Accesibilidad y reducción de costos
La opción de utilizar interpretes ya estaba disponible en Teams, pero requería la presencia de intérpretes profesionales, lo que implicaba costos adicionales y limitaciones logísticas. Nicole Herskowitz, vicepresidenta corporativa de productividad y colaboración de Copilot, señaló que muchas empresas no pueden permitirse contratar intérpretes para cada reunión. La integración de esta función de IA en Teams ofrece una alternativa de alta calidad, haciendo la interpretación más accesible y rentable para organizaciones de todos los tamaños.

Funcionamiento y privacidad
A diferencia de otras plataformas que utilizan IA para traducir contenido, la propuesta de Microsoft se destaca por su capacidad para simular la voz del orador en el idioma de destino sin crear una réplica visual del hablante ni recurrir a las siempre polémicas técnicas de «deepfake». Esto se logra superponiendo una pista de audio traducida que suena casi idéntica a la voz original, manteniendo la autenticidad y el tono de la conversación.
Microsoft ha enfatizado que, aunque la función de traducción es avanzada, puede no ser perfecta. Por ello, ofrece la opción de transcribir la llamada tanto en el idioma original como en la versión traducida, permitiendo a los usuarios revisar y corregir posibles errores. Además, la IA solo simulará la voz del usuario si este otorga su consentimiento previo. Si un participante decide no autorizar esta función, el sistema utilizará una voz predeterminada para la traducción.
Disponibilidad y futuro de la función
Se espera que esta innovadora herramienta esté disponible para los clientes de Microsoft 365 Copilot a partir de 2025. Aunque inicialmente soportará nueve idiomas, la compañía planea expandir el número de idiomas y dialectos disponibles, con el objetivo de ofrecer traducciones en tiempo real a una audiencia global.
Esta iniciativa de Microsoft representa un paso significativo hacia la eliminación de las barreras lingüísticas en la comunicación empresarial y personal, aprovechando el poder de la inteligencia artificial para crear experiencias de usuario más naturales e inclusivas en el ámbito digital.