AMD anuncia la GPU Instinct MI100 basada en CDNA con 120 CUs para HPC, promete hasta 2,1 veces más rendimiento por dólar en comparación con el A100 de NVIDIA
AMD ha anunciado el Instinct MI100 basado en la nueva arquitectura CDNA dirigida a cargas de trabajo de aprendizaje automático (ML) y computación de alto rendimiento (HPC). El MI100 está programado para ofrecer 10 teraflops de rendimiento FP64 que sube hasta 11,5 TFLOPS cuando se empareja con los procesadores EPYC de segunda generación de AMD.
Durante la presentación, AMD también confirmó que los procesadores EPYC de 3ª generación basados en el Zen 3 con nombre en código de Milán están siendo muestreados para seleccionar a los fabricantes de equipos originales y están programados para su lanzamiento en el primer trimestre de 2021.
AMD dijo que está desarrollando diferentes arquitecturas adaptadas a aplicaciones específicas con cierta superposición. Mientras que el RDNA se ocupará de los juegos, el CDNA está más enfocado hacia las aplicaciones de computación y HPC. El Instinct MI100 ofrece una tecnología de núcleo de matriz que permite operaciones de matriz de precisión simples y mixtas como FP32, FP16, bFloat16, Int8 e Int4.
La segunda generación de Infinity Fabric en el MI100 cuenta con 32 GB de memoria HBM2 a 1,2 GHz, que proporciona 1,23 TB/s de ancho de banda
La siguiente tabla ilustra las especificaciones del AMD Instinct MI100
Diseño | Altura completa, ranura doble, 10.5 pulgadas de largo |
Computa las unidades.. | 120 |
Procesadores de corriente | 7,680 |
FP64 TFLOPs (Pico) | 11.5 |
FP32 TFLOPs (Pico) | 23.1 |
FP32 Matriz TFLOPs (Pico) | 46.1 |
FP16/FP16 Matriz TFLOPs (Pico) | 184.6 |
Int4/Int8 TOPS (Pico) | 184.6 |
bFLOAT16 TFLOPs (Pico) | 92.3 |
Memoria ECC del HBM2 | 32 GB |
Interfaz de la memoria | 4.096-bit |
Reloj de memoria | 1.2 GHz |
Ancho de banda de la memoria | 1.23 TB/s |
Apoyo al PCIe | Gen4 |
Enlaces de Tejido Infinito/Ancho de Banda | 3 / 276 GB/s |
TDP | 300 W |
Enfriamiento | Enfriado pasivamente |
Mientras que el MI100 está diseñado para trabajar bien con los procesadores de EPYC, AMD confirmó que la nueva GPU también soporta los procesadores de Intel. En general, se puede esperar un rendimiento de hasta 7x FP16 del MI100 en comparación con la anterior generación de GPU HPC de AMD.
El Instinct MI100 proporciona hasta 64 GB/s de ancho de banda de Infinity Fabric entre la CPU y la GPU sin necesidad de utilizar ningún interruptor PCIe. Hay un total de tres enlaces de Infinity Fabric que ofrecen hasta 276 GB/s de rendimiento. Esencialmente, una colmena de cuatro GPU del MI100 puede producir hasta 1,1 TB/s de ancho de banda total. Según AMD, estas características dan al MI100 importantes ventajas sobre el NVIDIA A100 en las cargas FP16/FP32, a la vez que ofrecen un mayor rendimiento por dólar (ver diapositivas más abajo).
El Instinct MI100 soporta el nuevo ecosistema ROCm 4.0, que AMD fija como una solución completa de exascala para las cargas de trabajo de ML y HPC. ROCm 4.0 ahora usa un compilador de código abierto y soporta OpenMP 5.0 y HIP. Además, PyTorch y TensorFlow están ahora optimizados para ROCm 4.0.
El AMD Instinct MI100 puede esperarse este fin de año en los principales sistemas OEM y ODM de Dell, Gigabyte, HP y SuperMicro.
Aquí están algunas de las diapositivas de la rueda de prensa de AMD
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck
Fuente(s)
Comunicado de prensa de AMD