Inmersión en profundidad en la arquitectura AMD RDNA 4: Un diseño monolítico de 64 CPU con mejoras integrales en computación, codificación-decodificación de medios, trazado de rayos e IA

AMD ofreció un vistazo sobre RDNA 4 en CES 2025 y confirmó la llegada de la Radeon RX 9070 XT y la RX 9070, pero ni siquiera ofreció un comentario de pasada sobre la nueva arquitectura durante la keynote real.
La compañía, sin embargo, mantuvo que pronto se ofrecería más información sobre RDNA 4 y las nuevas GPU Radeon, y aquí estamos.
Hoy, AMD presenta RDNA 4 y las nuevas GPU Radeon de la serie RX 9070. La serie RX 9070 estará disponible oficialmente en las tiendas a partir del 6 de marzo y los análisis de rendimiento aterrizarán un día antes.
AMD RDNA 4: Vuelta a un diseño monolítico
RDNA 4 se basa en los objetivos que AMD se había fijado con RDNA 3. Según AMD, RDNA 4 está diseñado para atender a las cargas de trabajo de juegos más pesadas con un enfoque en la mejora del rendimiento y la eficiencia de la trama.
También están las mejoras habituales en los conductos de trazado de rayos, junto con un enfoque renovado en las capacidades de IA y la codificación/decodificación de medios.
RDNA 3 vio la llegada de un diseño de chiplet para las GPU inspirado en los procesadores Ryzen. Aquí vimos la separación de los troqueles de caché de memoria (MCD) del troquel de cálculo gráfico (GCD).
Con RDNA 4, sin embargo, AMD vuelve al diseño monolítico tradicional. Los componentes son esencialmente los mismos, pero no hay interconexiones MCD-GCD ya que la memoria y el cómputo están ahora directamente interconectados por el Infinity Cache.
La GPU RDNA 4, la Radeon RX 9070 XT en este caso, incorpora cuatro motores de sombreado con ocho procesadores de grupo de trabajo (WGP) cada uno. Cada WGP se compone de un total de ocho unidades de cálculo (CU) para un total de 64 CU.
AMD afirma que las nuevas unidades de cálculo son ahora más capaces que nunca permitiendo un trazado de rayos mejorado, el doble de rendimiento máximo, soporte para las últimas capacidades de aceleración de matrices con un soporte de formatos numéricos más amplio.
Una novedad de la CU RDNA 4, y que ya hemos visto con los núcleos Tensor de la arquitectura Ampere de Nvidia, es la compatibilidad con la sparsity estructurada que permite realizar operaciones matriciales más rápidas, especialmente en los casos en los que muchos de los pesos son cero.
También vemos mejoras en el subsistema de memoria. La caché L2 obtiene un aumento de 6 MB en RDNA 3 a 8 MB en RDNA 4, mientras que la caché Infinity se actualiza a la 3ª generación, pero desciende a 64 MB desde los 96 MB de RDNA 3.
AMD sigue apostando por la memoria GDDR6 con la nueva generación. Tanto la RX 9070 XT como la RX 9070 ofrecen una interfaz de memoria GDDR6 de 384 bits y 16 GB con una velocidad de reloj de 20 Gbps para un ancho de banda efectivo de 640 GB/s. Esto es mucho menor que el ancho de banda de 960 GB/s que ofrecía la RDNA 3, pero AMD afirma que las especificaciones de la memoria de vídeo de la RDNA 4 se eligieron cuidadosamente para dar soporte a los títulos actuales y futuros.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck
Motor de medios mejorado y compatibilidad con la medición de flip de hardware
La codificación de vídeo fue uno de los principales escollos de RDNA 3, y AMD promete mejoras significativas en este sentido. La empresa promete importantes mejoras en la codificación H.264 y AV1 y menos artefactos de bloqueo para la misma cantidad de datos.
Las mejoras se extienden también a la descodificación de vídeo, con un menor consumo de energía y un mayor rendimiento al descodificar formatos como AV1 y VP9.
Radiance Display Engine consume ahora mucha menos energía en configuraciones FreeSync de monitor dual. También es nueva la compatibilidad con la cola de inversión de hardware en Windows Display Driver Model (WDDM) 3.0 para la reproducción de vídeo.
Esto libera recursos de la CPU al descargar la programación de fotogramas a la GPU. La tecnología de generación de fotogramas múltiples (MFG) de las GPU Nvidia Blackwell también se basa en la medición de flip por hardware.
Un vistazo a la unidad de cálculo RDNA 4
De entrada, la estructura de una CU RDNA 4 no es muy diferente de lo que hemos visto con RDNA 3. Sin embargo, hay mejoras de rendimiento y eficiencia en cada uno de los componentes de la CU.
Las operaciones WMMA (Wave Matrix Multiply Accumulate) se han mejorado para cumplir los requisitos del nuevo hardware. Las unidades escaladoras reciben mejoras para manejar operaciones Float32. El programador puede dividir y procesar una gran carga de trabajo computacional en barreras divididas y nombradas.
AMD dijo que RDNA 4 está construido para atender a las nuevas técnicas de renderizado que los desarrolladores utilizan en los juegos actuales. Aunque el escalado ha estado de moda, el trazado eficaz de trayectorias requiere la aceleración ML como parte del propio proceso de renderizado y no como una ocurrencia tardía.
Aceleradores de rayos en RDNA 4
RDNA 4 ofrece 64 aceleradores de rayos de 3ª generación en la RX 9070 XT. La estructura de un acelerador de rayos en RDNA 4 es similar a la de RDNA 3, pero incluye un motor de intersección adicional para multiplicar por dos el número de unidades de caja de rayos y triángulo de rayos.
También hay una transformación de rayos por hardware dedicada que alivia la necesidad de utilizar instrucciones de sombreado para realizar el trabajo, minimizando así la sobrecarga de la travesía de rayos. Una memoria de 128 KB en cada CU dual ayuda a mantener la pila de rayos para una operación eficiente de empuje y ordenación.
RDNA 4 introduce el concepto de cajas delimitadoras orientadas (OBB) que alinea las cajas delimitadoras BVH con la geometría, minimizando así las interacciones de rayos falsos positivos en lo que, de otro modo, no sería más que el espacio vacío de una caja. AMD afirma que este enfoque puede mejorar el rendimiento del trazado de rayos hasta en un 10%.
Otra novedad en esta ocasión es la compatibilidad con las solicitudes de memoria fuera de orden relajadas, que reduce eficazmente el tiempo de espera de las ondas que no han llegado antes a la caché de alto nivel. Esto no sólo mejora el trazado de rayos, sino también otras cargas de trabajo.
En RDNA 4, los sombreadores pueden asignar dinámicamente registros que permiten acomodar más ondas en vuelo con una latencia de memoria mejorada.
Trazado de rutas con RDNA 4
Las tarjetas AMD han tenido problemas con el trazado de rayos en general, por lo que el trazado de trayectorias parecía fuera de la ecuación incluso con las tarjetas RDNA 3 de gama alta. RDNA 4 pretende cambiar esa situación con la compatibilidad con el almacenamiento en caché de la radiancia neural junto con un nuevo modelo de supermuestreo neural y eliminación de ruido.
AMD no ha proporcionado cifras exactas de rendimiento para los títulos habilitados para el trazado de trayectorias, pero deberíamos hacernos una idea mientras revisamos estas tarjetas.
Capacidades de IA basadas en Radeon e Instinct
AMD dijo que RDNA 4 cuenta con pipelines matemáticos dedicados para la aceleración de ML centrados en el alto rendimiento con tipos de datos más estrechos. Una novedad de RDNA 4 es la compatibilidad con FP8 y BF8 para la inferencia de alto rendimiento y alta precisión.
Demostrando la generación de imágenes SDXL 1.5, AMD mostró cómo la Radeon RX 9070 XT basada en RDNA 4 ofrece el doble de rendimiento FP16 por CU en comparación con la RX 7900 XT basada en RDNA 3.
Aprovechando las nuevas capacidades de IA de RDNA 4 se encuentra FSR 4, que es un pipeline de extremo a extremo entrenado en las GPU de AMD. FSR 4 utiliza FP8 para un uso óptimo del ancho de banda, el rendimiento y la potencia.
AMD ha demostrado mejoras de hasta 3,7 veces los fps con FSR 4 cuando se combina con la interpolación de fotogramas y Radeon Anti-Lag, manteniendo al mismo tiempo una alta calidad de imagen.
Fuente(s)
Resumen de prensa de AMD