Meta ha desarrollado SeamlessM4T, un nuevo modelo de inteligencia artificial que promete revolucionar la traducción automática. Capaz de traducir comunicaciones de voz a voz, texto a voz y viceversa en hasta 101 idiomas, SeamlessM4T se destaca por su alta precisión, superando a los sistemas actuales con una mejora de entre el 8% y el 23% en precisión, según la Bilingual Evaluation Understudy. El nombre SEAMLESSM4T proviene del inglés "SEAMLESS" (sin costuras), reflejando la capacidad del modelo de ofrecer traducciones fluidas. El "M4T" son las iniciales de "Multilingual, Multimodal, Multitasking Translation".
El modelo también mejora significativamente la filtración de ruido de fondo, con un rendimiento superior de entre el 42% y el 66% respecto a tecnologías existentes, y es capaz de adaptarse a diversas voces. SEAMLESSM4T puede traducir 36 idiomas en formato de voz y 96 en texto. En comparación, el modelo AudioPaLM de Google puede traducir 113 idiomas, pero solo al inglés, mientras que SeamlessM4T ofrece traducción en 36 idiomas diferentes.
El desarrollo de SeamlessM4T se basa en un proceso de minería de datos paralelos, que asocia sonidos en un idioma con subtítulos en otro. Utilizando 4,5 millones de horas de grabaciones multilingües, el modelo puede reconocer patrones de lenguaje con mayor facilidad, lo que es particularmente útil para traducir idiomas menos hablados.
Aunque Meta ha diseñado este modelo para ser de acceso público, su uso comercial está restringido. Sin embargo, algunos investigadores han criticado esta política, argumentando que limita la posibilidad de reproducir o mejorar las bases tecnológicas del modelo, restringiendo su utilidad en la comunidad científica.
Además, SeamlessM4T incorpora una herramienta llamada Etox, diseñada para mitigar la toxicidad en las traducciones. Este componente aborda problemas como el sesgo de género, y define la toxicidad como resultados que incluyen blasfemias o incitan al odio, violencia o abuso.
Aunque los avances son significativos, Meta advierte que los sistemas de traducción automática deben ser supervisados por humanos en contextos críticos como la medicina o el derecho para evitar errores graves. Un ejemplo de estos riesgos es un error en la traducción sobre información de la vacuna COVID-19 que cambió el significado de "no obligatorio" a "no necesario".