Notebookcheck Logo

Inmersión en profundidad en la arquitectura AMD RDNA 4: Un diseño monolítico de 64 CPU con mejoras integrales en computación, codificación-decodificación de medios, trazado de rayos e IA

AMD RDNA 4 está construido para atender a los juegos de gama alta, trazado de rayos, y las cargas de trabajo de ML. (Fuente de la imagen: AMD)
AMD RDNA 4 está construido para atender a los juegos de gama alta, trazado de rayos, y las cargas de trabajo de ML. (Fuente de la imagen: AMD)
AMD se detuvo en varios aspectos clave de RDNA 4 que se lanzará oficialmente hoy. RDNA 4, presente en las nuevas GPU Radeon RX 9070 XT y RX 9070, permite disfrutar de experiencias de juego y creación de contenidos de nueva generación gracias a la compatibilidad con las nuevas funciones de trazado de rayos y trazado de trayectorias, el escalado basado en ML con FSR 4 y las nuevas funciones de codificación y descodificación de vídeo.

AMD ofreció un vistazo sobre RDNA 4 en CES 2025 y confirmó la llegada de la Radeon RX 9070 XT y la RX 9070, pero ni siquiera ofreció un comentario de pasada sobre la nueva arquitectura durante la keynote real.

La compañía, sin embargo, mantuvo que pronto se ofrecería más información sobre RDNA 4 y las nuevas GPU Radeon, y aquí estamos.

Hoy, AMD presenta RDNA 4 y las nuevas GPU Radeon de la serie RX 9070. La serie RX 9070 estará disponible oficialmente en las tiendas a partir del 6 de marzo y los análisis de rendimiento aterrizarán un día antes.

AMD RDNA 4: Vuelta a un diseño monolítico

RDNA 4 se basa en los objetivos que AMD se había fijado con RDNA 3. Según AMD, RDNA 4 está diseñado para atender a las cargas de trabajo de juegos más pesadas con un enfoque en la mejora del rendimiento y la eficiencia de la trama.

También están las mejoras habituales en los conductos de trazado de rayos, junto con un enfoque renovado en las capacidades de IA y la codificación/decodificación de medios.

Aumento del rendimiento de las unidades de cálculo de RDNA 2 a RDNA 4. (Fuente de la imagen: AMD)
Aumento del rendimiento de las unidades de cálculo de RDNA 2 a RDNA 4. (Fuente de la imagen: AMD)

RDNA 3 vio la llegada de un diseño de chiplet para las GPU inspirado en los procesadores Ryzen. Aquí vimos la separación de los troqueles de caché de memoria (MCD) del troquel de cálculo gráfico (GCD).

Con RDNA 4, sin embargo, AMD vuelve al diseño monolítico tradicional. Los componentes son esencialmente los mismos, pero no hay interconexiones MCD-GCD ya que la memoria y el cómputo están ahora directamente interconectados por el Infinity Cache.

La GPU RDNA 4, la Radeon RX 9070 XT en este caso, incorpora cuatro motores de sombreado con ocho procesadores de grupo de trabajo (WGP) cada uno. Cada WGP se compone de un total de ocho unidades de cálculo (CU) para un total de 64 CU.

AMD afirma que las nuevas unidades de cálculo son ahora más capaces que nunca permitiendo un trazado de rayos mejorado, el doble de rendimiento máximo, soporte para las últimas capacidades de aceleración de matrices con un soporte de formatos numéricos más amplio.

Una novedad de la CU RDNA 4, y que ya hemos visto con los núcleos Tensor de la arquitectura Ampere de Nvidia, es la compatibilidad con la sparsity estructurada que permite realizar operaciones matriciales más rápidas, especialmente en los casos en los que muchos de los pesos son cero.

También vemos mejoras en el subsistema de memoria. La caché L2 obtiene un aumento de 6 MB en RDNA 3 a 8 MB en RDNA 4, mientras que la caché Infinity se actualiza a la 3ª generación, pero desciende a 64 MB desde los 96 MB de RDNA 3.

AMD sigue apostando por la memoria GDDR6 con la nueva generación. Tanto la RX 9070 XT como la RX 9070 ofrecen una interfaz de memoria GDDR6 de 384 bits y 16 GB con una velocidad de reloj de 20 Gbps para un ancho de banda efectivo de 640 GB/s. Esto es mucho menor que el ancho de banda de 960 GB/s que ofrecía la RDNA 3, pero AMD afirma que las especificaciones de la memoria de vídeo de la RDNA 4 se eligieron cuidadosamente para dar soporte a los títulos actuales y futuros.

Arquitectura RDNA 4. (Fuente de la imagen: AMD)
Arquitectura RDNA 4. (Fuente de la imagen: AMD)
Arquitectura RDNA 3 para comparación. (Fuente de la imagen: AMD)
Arquitectura RDNA 3 para comparación. (Fuente de la imagen: AMD)

Motor de medios mejorado y compatibilidad con la medición de flip de hardware

La codificación de vídeo fue uno de los principales escollos de RDNA 3, y AMD promete mejoras significativas en este sentido. La empresa promete importantes mejoras en la codificación H.264 y AV1 y menos artefactos de bloqueo para la misma cantidad de datos.

Las mejoras se extienden también a la descodificación de vídeo, con un menor consumo de energía y un mayor rendimiento al descodificar formatos como AV1 y VP9.

Radiance Display Engine consume ahora mucha menos energía en configuraciones FreeSync de monitor dual. También es nueva la compatibilidad con la cola de inversión de hardware en Windows Display Driver Model (WDDM) 3.0 para la reproducción de vídeo.

Esto libera recursos de la CPU al descargar la programación de fotogramas a la GPU. La tecnología de generación de fotogramas múltiples (MFG) de las GPU Nvidia Blackwell también se basa en la medición de flip por hardware.

RDNA 4: Mejoras en el motor multimedia. (Fuente de la imagen: AMD)
RDNA 4: Mejoras en el motor multimedia. (Fuente de la imagen: AMD)
El motor de visualización Radiance ahora es compatible con la medición de flip por hardware. (Fuente de la imagen: AMD)
El motor de visualización Radiance ahora es compatible con la medición de flip por hardware. (Fuente de la imagen: AMD)

Un vistazo a la unidad de cálculo RDNA 4

De entrada, la estructura de una CU RDNA 4 no es muy diferente de lo que hemos visto con RDNA 3. Sin embargo, hay mejoras de rendimiento y eficiencia en cada uno de los componentes de la CU.

Las operaciones WMMA (Wave Matrix Multiply Accumulate) se han mejorado para cumplir los requisitos del nuevo hardware. Las unidades escaladoras reciben mejoras para manejar operaciones Float32. El programador puede dividir y procesar una gran carga de trabajo computacional en barreras divididas y nombradas.

AMD dijo que RDNA 4 está construido para atender a las nuevas técnicas de renderizado que los desarrolladores utilizan en los juegos actuales. Aunque el escalado ha estado de moda, el trazado eficaz de trayectorias requiere la aceleración ML como parte del propio proceso de renderizado y no como una ocurrencia tardía.

RDNA 4: Motor de computación. (Fuente de la imagen: AMD)
RDNA 4: Motor de computación. (Fuente de la imagen: AMD)
ML forma ahora parte del núcleo del proceso de renderizado. (Fuente de la imagen: AMD)
ML forma ahora parte del núcleo del proceso de renderizado. (Fuente de la imagen: AMD)

Aceleradores de rayos en RDNA 4

RDNA 4 ofrece 64 aceleradores de rayos de 3ª generación en la RX 9070 XT. La estructura de un acelerador de rayos en RDNA 4 es similar a la de RDNA 3, pero incluye un motor de intersección adicional para multiplicar por dos el número de unidades de caja de rayos y triángulo de rayos.

También hay una transformación de rayos por hardware dedicada que alivia la necesidad de utilizar instrucciones de sombreado para realizar el trabajo, minimizando así la sobrecarga de la travesía de rayos. Una memoria de 128 KB en cada CU dual ayuda a mantener la pila de rayos para una operación eficiente de empuje y ordenación.

RDNA 4 introduce el concepto de cajas delimitadoras orientadas (OBB) que alinea las cajas delimitadoras BVH con la geometría, minimizando así las interacciones de rayos falsos positivos en lo que, de otro modo, no sería más que el espacio vacío de una caja. AMD afirma que este enfoque puede mejorar el rendimiento del trazado de rayos hasta en un 10%.

Otra novedad en esta ocasión es la compatibilidad con las solicitudes de memoria fuera de orden relajadas, que reduce eficazmente el tiempo de espera de las ondas que no han llegado antes a la caché de alto nivel. Esto no sólo mejora el trazado de rayos, sino también otras cargas de trabajo.

En RDNA 4, los sombreadores pueden asignar dinámicamente registros que permiten acomodar más ondas en vuelo con una latencia de memoria mejorada.

Estructura de un acelerador de rayos RDNA 4. (Fuente de la imagen: AMD)
Estructura de un acelerador de rayos RDNA 4. (Fuente de la imagen: AMD)
RDNA 4 introduce los OBB. (Fuente de la imagen: AMD)
RDNA 4 introduce los OBB. (Fuente de la imagen: AMD)
RDNA 4 permite una ordenación más relajada de los flujos de solicitud de ondas. (Fuente de la imagen: AMD)
RDNA 4 permite una ordenación más relajada de los flujos de solicitud de ondas. (Fuente de la imagen: AMD)
Los aceleradores de rayos RDNA 4 ofrecen el doble de rendimiento en el recorrido de rayos que los RDNA 3. (Fuente de la imagen: AMD)
Los aceleradores de rayos RDNA 4 ofrecen el doble de rendimiento en el recorrido de rayos que los RDNA 3. (Fuente de la imagen: AMD)
Asignación dinámica de registros de sombreado RDNA 4. (Fuente de la imagen: AMD)
Asignación dinámica de registros de sombreado RDNA 4. (Fuente de la imagen: AMD)
 

Trazado de rutas con RDNA 4

Las tarjetas AMD han tenido problemas con el trazado de rayos en general, por lo que el trazado de trayectorias parecía fuera de la ecuación incluso con las tarjetas RDNA 3 de gama alta. RDNA 4 pretende cambiar esa situación con la compatibilidad con el almacenamiento en caché de la radiancia neural junto con un nuevo modelo de supermuestreo neural y eliminación de ruido.

AMD no ha proporcionado cifras exactas de rendimiento para los títulos habilitados para el trazado de trayectorias, pero deberíamos hacernos una idea mientras revisamos estas tarjetas.

RDNA 4 aporta una mayor compatibilidad con el trazado de trayectorias en los juegos. (Fuente de la imagen: AMD)
RDNA 4 aporta una mayor compatibilidad con el trazado de trayectorias en los juegos. (Fuente de la imagen: AMD)
Paso 1: El trazado de trayectorias comienza con 1 muestra por píxel. (Fuente de la imagen: AMD)
Paso 1: El trazado de trayectorias comienza con 1 muestra por píxel. (Fuente de la imagen: AMD)
Paso 2: Muestreo de cuadrícula y caché neuronal de radiancia para aproximar la luz de la escena. (Fuente de la imagen: AMD)
Paso 2: Muestreo de cuadrícula y caché neuronal de radiancia para aproximar la luz de la escena. (Fuente de la imagen: AMD)
Paso 3: Restirar la iluminación directa y global. (Fuente de la imagen: AMD)
Paso 3: Restirar la iluminación directa y global. (Fuente de la imagen: AMD)
Paso 4: Supermuestreo y eliminación de ruido neuronales. (Fuente de la imagen: AMD)
Paso 4: Supermuestreo y eliminación de ruido neuronales. (Fuente de la imagen: AMD)
 

Capacidades de IA basadas en Radeon e Instinct

AMD dijo que RDNA 4 cuenta con pipelines matemáticos dedicados para la aceleración de ML centrados en el alto rendimiento con tipos de datos más estrechos. Una novedad de RDNA 4 es la compatibilidad con FP8 y BF8 para la inferencia de alto rendimiento y alta precisión.

Demostrando la generación de imágenes SDXL 1.5, AMD mostró cómo la Radeon RX 9070 XT basada en RDNA 4 ofrece el doble de rendimiento FP16 por CU en comparación con la RX 7900 XT basada en RDNA 3.

Aprovechando las nuevas capacidades de IA de RDNA 4 se encuentra FSR 4, que es un pipeline de extremo a extremo entrenado en las GPU de AMD. FSR 4 utiliza FP8 para un uso óptimo del ancho de banda, el rendimiento y la potencia.

AMD ha demostrado mejoras de hasta 3,7 veces los fps con FSR 4 cuando se combina con la interpolación de fotogramas y Radeon Anti-Lag, manteniendo al mismo tiempo una alta calidad de imagen.

RDNA 4 ofrece pipelines matemáticos dedicados para ML. (Fuente de la imagen: AMD)
RDNA 4 ofrece pipelines matemáticos dedicados para ML. (Fuente de la imagen: AMD)
2x de rendimiento FP16 por CU en comparación con RDNA 3. (Fuente de la imagen: AMD)
2x de rendimiento FP16 por CU en comparación con RDNA 3. (Fuente de la imagen: AMD)
FSR 4 hace uso de la capacidad FP8 de RDNA 4. (Fuente de la imagen: AMD)
FSR 4 hace uso de la capacidad FP8 de RDNA 4. (Fuente de la imagen: AMD)
Aumento significativo de fps con FSR 4 e interpolación de fotogramas a 4K. (Fuente de la imagen: AMD)
Aumento significativo de fps con FSR 4 e interpolación de fotogramas a 4K. (Fuente de la imagen: AMD)

Fuente(s)

Resumen de prensa de AMD

Please share our article, every link counts!
Mail Logo
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2025 02 > Inmersión en profundidad en la arquitectura AMD RDNA 4: Un diseño monolítico de 64 CPU con mejoras integrales en computación, codificación-decodificación de medios, trazado de rayos e IA
Vaidyanathan Subramaniam, 2025-02-28 (Update: 2025-02-28)