Cómo mejorar la cancelación de ruido con IA con NVIDIA RTX Voice

El nuevo software NVIDIA RTX Voice ya está disponible, y con él el fabricante promete reducir el ruido generado en programas de voz como Discord, OBS o Zoom utilizando Inteligencia Artificial. En este artículo vamos a explicarte qué es NVIDIA RTX Voice, cómo funciona, qué necesitas para poder utilizarlo y la lista de compatibilidad para que sepas con qué programas funciona.

Hoy en día los programas de voz son una constante tanto a nivel de ocio como de trabajo. ¿Quién no utiliza Discord o TeamSpeak para comunicarse con sus amigos mientras juega a juegos online? ¿Quién no ha utilizado Skype o Zoom para tener reuniones a distancia? Lo malo es que todos estos programas utilizan unos códec de audio que comprimen mucho la señal y muchas veces la calidad deja que desear, así que para solucionarlo llega RTX Voice de NVIDIA, una herramienta complementaria que promete reducir el ruido para una comunicación por voz mucho más clara y nítida.

Por lo que si no quieres tener que comprar un micrófono más caro del que tienes y quieres mejorar la calidad de sonido de tus conversaciones de voz o podcasts, entonces RTX Voice es una solución excelente para ello y lo único que requiere es una NVIIDA GeForce en tu PC.

¿Qué es NVIDIA RTX Voice y cómo funciona?

Como ya hemos mencionado, este es un nuevo software de NVIDIA que, como su nombre sugiere, aprovecha la potencia de las tarjetas gráficas RTX de la marca para añadir un componente adicional a los software de comunicación por voz para reducir el ruido utilizando Inteligencia Artificial. Básicamente, introduce un componente adicional entre el micrófono y el software que estemos utilizando para limpiar la señal de audio.

NVIDIA RTX Voice

Según lo define NVIDIA:

RTX Voice es un nuevo complemento que aprovecha las GPU NVIDIA RTX y sus capacidades de IA para eliminar el ruido de fondo que distrae en las transmisiones, chatz de voz y reuniones de videoconferencia remotas. Esto permite a los usuarios «entrar en vivo» o unirse a una reunión sin tener que preocuparse de ruidos de fondo indeseados, como la escritura en teclados mecánicos o entornos ruidosos ya que suprime el ruido de fondo y facilita la comprensión del audio entrante».

Se trata por tanto un algoritmo de IA que NVIDIA ha entrenado para que sea capaz de identificar las partes del audio correspondientes a la voz humana y descartar el resto de sonidos independientemente de cual sea su origen.

Aunque la mención de la IA inicialmente nos puede hacer pensar que solo puede aplicarse en las tarjetas gráficas RTX 20 y RTX 30, y por tanto todas aquellas con arquitecturas GeForce Turing y GeForce Ampere. Las últimas actualizaciones en los drivers de NVIDIA permite utilizar RTX Voice en algunos modelos GeForce GTX y por tanto aprovechar su capacidad, aunque la carga sobre dichas GPUs es mucho más alta.

En todo caso se trata de una herramienta excelente para hacer podcasting y videoblogs, tanto en directo como en diferido, sin necesitar de un micrófono de alta calidad y va a mejorar enormemente la calidad de sonido de todo lo que grabéis y/o retransmitáis. Eso si, no se trata de un sistema perfecto ya que interpreta cualquier tipo de sonido ajeno a la voz humana como ruido, así que si utilizáis RTX Voice para grabar un podcast con música de fondo os recomendamos revisarlo por si se ha eliminado dicha música de fondo.

Requisitos y cómo habilitar RTX Voice

Los requisitos para utilizar este complemento son muy básicos y sencillos: necesitarás tener una tarjeta gráfica NVIDIA RTX o Quadro RTX como ya supondrás por el nombre, sistema operativo Windows 10 y los controladores GeForce 410.18 o superiores. Actualmente RTX Voice no funciona en gráficas de generaciones anteriores ni tampoco si tienes unos drivers anteriores a los mencionados; de igual manera, NVIDIA por ahora no ha dado soporte para MacOS ni Linux y no entra en sus planes el hacerlo.

Instalación y configuración

Lo primero que debes hacer es descargar RTX Voice desde la página web de desarrollo de NVIDIA. Tras descargarlo, ejecuta el instalador y sigue las instrucciones que saldrán en pantalla (siguiente, siguiente…).

Instalar RTX Voice

Tras instalarlo, se abrirá una pantalla que nos pedirá que seleccionemos los dispositivos de audio que queremos utilizar. Aquí mismo podremos seleccionar si queremos activar la funcionalidad de cancelación de ruido tanto en el audio saliente como en el entrante, y qué nivel de intrusión en el mismo queremos configurar.

Configurar RTX Voice

Ojo con habilitarlo en el dispositivo de salida, porque si estás por ejemplo escuchando música interferirá hasta el punto de eliminar completamente la música intentando dejar solo la voz y… bueno, digamos que el resultado no es demasiado bueno, así que te recomendamos no habilitarlo salvo que vayas a utilizar el audio únicamente en conversaciones por voz.

Una vez configurado como quieras, puedes cerrar esa ventana con la X de la esquina superior derecha, y el software quedará habilitado y accesible desde los iconos de Windows 10, en la esquina inferior derecha de la barra de inicio, al lado del reloj.

NVIDIA RTX Voice

RTX Voice habrá modificado ciertos parámetros en tu configuración de audio del equipo, los cuales puedes verificar y modificar desde las opciones de sonido de Windows. Lo cual puede hacer por el hecho que la interfaz HDMI suele transportar el audio, para lo cual la GPU suele mirar en la RAM principal a través de su unidad DMA. Dicho de otra forma, la GPU tiene acceso al audio del sistema pese a ser el chip gráfico y hace uso del pipeline no-gráfico o de computación para manipularlo.

Configuración de sonido de Windows

Una vez hecho esto, puedes proceder a iniciar las aplicaciones de comunicación por voz que quieras, pero recuerda que tendrás que seleccionar el dispositivo de audio NVIDIA RTX Voice como predeterminado para que esto funcione.

Por último, debes tener en cuenta que una vez instalado este software se iniciará automáticamente con Windows siempre que enciendas el ordenador, y la manera de deshabilitarlo es desinstalar el programa desde Programas y Características en Windows, o desde la pestaña «Inicio» en el Administrador de Tareas de Windows, desde donde podrás quitar el inicio automático del software.

Aplicaciones compatibles

Por ahora, las aplicaciones que son compatibles con este software son las siguientes:

  • OBS Studio
  • XSplit Broadcaster
  • XSplit Gamecaster
  • Twitch Studio
  • Discord
  • Google Chrome
  • Battle.net Chat
  • WebEx*
  • Skype*
  • Zoom*
  • Slack*
  • Steam Chat**

*NVIDIA advierte que la salida de audio puede causar problemas en estas aplicaciones.
**Recomiendan no habilitar la cancelación de ruido para tener una mejor calidad de audio aquí.