El segmento de la inteligencia artificial (IA) no ha parado de crecer en los últimos años de manera exponencial. Hace unos días se lanzaba una beta abierta de ChatGPT, una IA que nos devuelve información escrita ante una pregunta. Pues bien, Microsoft tiene una inteligencia artificial que ya habla un total de 147 idiomas y dialectos.
ChatGPT es posiblemente la herramienta de inteligencia artificial de acceso libre más potente del mundo. Esta herramienta mediante chat, ante una pregunta, te devuelve una respuesta. La idea es que cualquier lo use para preguntarle cosas y que el usuario evalué si la respuesta es buena o no, y pueda seguir aprendiendo.
La IA poliglota de Azure
Microsoft tiene muchas divisiones, entre ellas esta Azure, una división pensada para el segmento profesional. Sobre todo, Azure es conocida por sus sistemas de computación en la nube, pero hace más cosas. Entre otras, está trabajando en una inteligencia artificial que convierta texto en una vez realista.
Dentro de Microsoft Azure tenemos Neural Network Edition Text-to-Spech Service (Neural TTS). Cuenta con una función de síntesis de voz realmente potente denominada Azure Cognitive Services. Busca ofrecer a los desarrolladores una IA que pueda leer texto en voz alta y que suene realista, no como el Loquendo de turno. Se busca usar esta IA en la lectura de libros electrónicos, asistencia por voz, para poner audio en videos y muchas otras aplicaciones.
Recientemente se han agregado nuevas extensiones de idioma a este servicio, soportando un total de 147 idiomas y dialectos. Pero no solo eso, se han agregado un total de 46 nuevos sonidos prefabricados y se ha mejorado el apoyo emocional. Actualmente, esta IA cuenta con nada menos que 449 voces diferentes que cada cliente puede elegir.
Según se ha sabido, esta IA de Microsoft acaba de agregar el Euskera y el Armenio como nuevos idiomas. Adicionalmente, ha aprendido los dialectos Wu y Cantonés, que se hablan en china y están en una versión preliminar. Para cada uno de estos idiomas se puede elegir una voz masculina o femenina, según se quiera.
Se incluyen también 46 nuevas voces para inglés de Australia, castellano de España, coreano de Corea del Sur y japonés de Japón. Nos ofrecen diferentes «personalidades» y edades, para adaptarse mejor a diferentes escenarios comerciales.
¿Podemos soñar con videojuegos con voces en castellano?
Hace ya muchos años que los videojuegos no se doblan al castellano o son los menos los que se doblan. Normalmente, se opta por los subtítulos por ser algo muchísimo más económico. Gracias a esta solución de Microsoft Azure podríamos en el futuro volver a tener juegos en castellano. Al final, es tan simple como introducirle un texto, que lo lea en voz alta (vamos, que se generen archivos de audio) y «pegarlos» en el juego.
No es descartable que esto se lleva a otros ámbitos. Podríamos ver series y películas dobladas por esta (o una similar) IA con una cadencia de voz igual al actor original. El gran problema del doblaje es que los registros de voz difieren bastante entre el actor y el doblador. Los puristas son muy dados a criticar el doblaje por este aspecto, entre otros.