AMD dice que su Radeon RX 7900 XTX es mejor que la RTX 4090 para DeepSeek

En general, NVIDIA siempre ha estado muy por delante de AMD en lo que a computación para Inteligencia Artificial se refiere, pero según dice AMD, las tornas han cambiado cuando se trata de la nueva IA de moda, DeepSeek: los de Lisa Su afirman que su actual tarjeta gráfica buque insignia, la Radeon RX 7900 XTX, supera a la RTX 4090 de NVIDIA en los primeros benchmarks.
Si la Inteligencia Artificial lleva unos meses en boca de todos, DeepSeek es el tema candente del momento, y prueba de ello es que los fabricantes de productos para IA se están afanando en medir qué tan bien o mal funcionan sus productos con ella. Y en AMD han debido de llevarse una grata sorpresa al comprobar que su gráfica tope de gama supera a la tope de gama de NVIDIA… de la anterior generación, porque estos datos han llegado un pelín tarde y la RTX 4090 ha dejado de ser la gráfica más potente de los de verde.
AMD mide su rendimiento con DeepSeek
AMD ha publicado algunas pruebas comparativas de su gráfica buque insignia, la RX 7900 XTX, frente a las NVIDIA RTX 4090 y 4080 SUPER de anterior generación utilizando el modelo de IA de DeepSeek. Según ha publicado David McAffee en X, la GPU basada en RDNA 3 superó a la RTX 4090 hasta en un 13%, mientras que la RTX 4080 SUPER se queda un poco más atrás como es normal, y la diferencia es de hasta el 34%.
David McAfee@McAfeeDavid_AMDDeepSeek performing very well on @AMDRadeon 7900 XTX. Learn how to run on Radeon GPUs and Ryzen AI APUs here: https://t.co/FVLDLJ18Ov https://t.co/5OKEkyJjh329 de enero, 2025 • 16:02
437
22
AMD ha probado las tres gráficas con varios LLM y diversos parámetros haciendo uso del algoritmo DeepSeek R1. La RX 7900 XTX obtuvo su mayor victoria frente a la RTX 4090 usando DeepSeek R1 Distill Qwen 7B, donde superó a la GPU de NVIDIA en un 13%. También fue un 11% más rápida usando Distill Llama 8B y un 2% mejor en Distill Qwen 14B. No es que la diferencia sea una barbaridad, pero es una pequeña victoria para AMD, que no ha dejado de ver que NVIDIA se distanciaba en todo esto de la IA sin que pudieran hacer nada.
Por supuesto, todos estos datos deben tomarse con pinzas porque no podemos estar seguros de cómo configuraron las GPU de NVIDIA para hacer la comparativa, y por supuesto fueron utilizadas por AMD así que vaya usted a saber (lo mismo ahora NVIDIA responde con sus propias pruebas y desmiente todos estos datos). Además, no todas las cargas de trabajo de Inteligencia Artificial aprovechan igual el rendimiento computacional de una GPU.
Por otro lado, no es habitual (de hecho, creemos que es la primera vez que lo hacen de forma «oficial») que se use una gráfica de AMD para pruebas con IA, aunque lo que sí demuestran estos datos es que, desde luego, son válidas para ello. La arquitectura RDNA 3 en la que se basa la RX 7900 XTX es capaz de realizar operaciones matriciales y admite BF16 e INT8 sin problemas. Por supuesto, ahora AMD ha añadido oficialmente la terminología «AI Accelerator» a RDNA 3 para denotar su destreza en el procesamiento de cargas de trabajo para IA: la RX 7900 XTX sin ir más lejos incorpora 192 núcleos de hardware para ello.
Hace poco, AMD publicó un tutorial sobre cómo se puede conseguir que DeepSeek R1 se ejecute en hardware de consumo (procesadores y gráficas comerciales, que cualquiera puede comprar) de AMD, incluyendo la gráfica que nos atañe en este artículo. DeepSeek R1 es un nuevo modelo de IA que ofrece un rendimiento comparable al de las IA de vanguardia, pero con una fracción de su coste computacional, motivo por el que se ha hecho famosa en seguida.
DeepSeek R1 usa una serie de optimizaciones basadas en hardware para que su modelo de IA funcione hasta 11 veces más rápido que el de la competencia, incluyendo el uso del lenguaje de programación PTX de NVIDIA. Así que ojo, pues como hemos dicho antes, quizá NVIDIA no tarde en salir a la palestra con sus propias pruebas para desmentir todo esto que está diciendo AMD.