AMD anuncia MI100, el acelerador HPC más rápido del mundo para investigación científica

AMD anunció hoy el nuevo acelerador AMD Instinct MI100: la GPU HPC más rápida del mundo y la primera GPU de servidor x86 que supera la barrera de rendimiento de los 10 teraflops (FP64). Con el respaldo de las nuevas plataformas informáticas aceleradas de Dell, Gigabyte, HPE y Supermicro, el MI100, combinado con las CPU AMD EPYC y la plataforma de software abierto ROCm 4.0, está diseñado para impulsar nuevos descubrimientos antes de la era de la exaescala.

Construida sobre la nueva arquitectura AMD CDNA, la GPU AMD Instinct MI100 habilita una nueva clase de sistemas acelerados para HPC e IA cuando se combina con procesadores AMD EPYC de segunda generación. El MI100 ofrece hasta 11,5 TFLOPS de rendimiento máximo de FP64 para HPC y hasta 46,1 TFLOPS de rendimiento máximo de matriz FP32 para cargas de trabajo de inteligencia artificial y aprendizaje automático. Con la nueva tecnología AMD Matrix Core, el MI100 también ofrece un aumento de casi 7 veces en el rendimiento de punto flotante máximo teórico FP16 para cargas de trabajo de entrenamiento de IA en comparación con los aceleradores de generaciones anteriores de AMD.

“Hoy AMD da un gran paso adelante en el viaje hacia la computación a exaescala al presentar AMD Instinct MI100, la GPU HPC más rápida del mundo”, dijo Brad McCredie, vicepresidente corporativo de procesamiento acelerado y GPU de centro de datos de AMD. “Dirigido directamente a las cargas de trabajo que importan en la informática científica, nuestro último acelerador, cuando se combina con la plataforma de software abierto AMD ROCm, está diseñado para proporcionar a los científicos e investigadores una base superior para su trabajo en HPC”.

Plataforma de software abierta para la era de exaescala

El software para desarrolladores AMD ROCm proporciona la base para la computación a exaescala. Como un conjunto de herramientas de código abierto que consta de compiladores, API de programación y bibliotecas, los desarrolladores de software a exaescala utilizan ROCm para crear aplicaciones de alto rendimiento. ROCm 4.0 se ha optimizado para ofrecer rendimiento a escala para sistemas basados ​​en MI100. ROCm 4.0 ha actualizado el compilador para que sea de código abierto y esté unificado para admitir tanto OpenMP 5.0 como HIP. Los marcos de PyTorch y Tensorflow, que se han optimizado con ROCm 4.0, ahora pueden lograr un mayor rendimiento con MI100. ROCm 4.0 es la oferta más reciente para desarrolladores de aplicaciones HPC, ML e AI que les permite crear software portátil de rendimiento.

“Hemos recibido acceso temprano al acelerador MI100 y los resultados preliminares son muy alentadores. Por lo general, hemos visto aumentos de rendimiento significativos, hasta 2-3 veces en comparación con otras GPU”, dijo Bronson Messer, director de ciencia de Oak Ridge. Instalación de Computación de Liderazgo. “Lo que también es importante reconocer es el impacto que el software tiene en el rendimiento. El hecho de que la plataforma de software abierto ROCm y la herramienta de desarrollo de HIP sean de código abierto y funcionen en una variedad de plataformas, es algo con lo que hemos estado absolutamente casi obsesionados desde que lanzó el primer sistema híbrido de CPU / GPU “.

Las capacidades y características clave del acelerador AMD Instinct MI100 incluyen:

Arquitectura AMD CDNA totalmente nueva: diseñada para alimentar las GPU de AMD para la era de la exaescala y en el corazón del acelerador MI100, la arquitectura CDNA de AMD ofrece un rendimiento y una eficiencia energética excepcionales.

Rendimiento líder de FP64 y FP32 para cargas de trabajo de HPC: ofrece un rendimiento máximo de FP64 de 11,5 TFLOPS líder en la industria y un rendimiento máximo de FP32 de 23,1 TFLOPS, lo que permite a los científicos e investigadores de todo el mundo acelerar los descubrimientos en industrias que incluyen ciencias de la vida, energía, finanzas, académicos, gobierno, defensa y más.

Tecnología Matrix Core totalmente nueva para HPC e IA: rendimiento sobrealimentado para una gama completa de operaciones matriciales de precisión simples y mixtas, como FP32, FP16, bFloat16, Int8 e Int4, diseñadas para impulsar la convergencia de HPC e IA.

Tecnología AMD Infinity Fabric de 2.a generación: Instinct MI100 proporciona ~ 2 veces el ancho de banda pico de E / S peer-to-peer (P2P) sobre PCIe 4.0 con hasta 340 GB / s de ancho de banda agregado por tarjeta con tres AMD Infinity Fabric Links. un servidor, las GPU MI100 se pueden configurar con hasta dos colmenas de GPU cuádruples completamente conectadas, cada una de las cuales proporciona hasta 552 GB / s de ancho de banda de E / S P2P para compartir datos rápidamente.

Memoria HBM2 ultrarrápida: cuenta con una memoria HBM2 de alto ancho de banda de 32 GB a una frecuencia de reloj de 1,2 GHz y ofrece un ancho de banda de memoria ultra alto de 1,23 TB / s para admitir grandes conjuntos de datos y ayudar a eliminar los cuellos de botella al mover datos dentro y fuera de memoria.5

Compatibilidad con el PCIe Gen 4.0 más reciente de la industria: diseñado con el soporte de tecnología PCIe Gen 4.0 más reciente que proporciona hasta 64 GB / s de ancho de banda de datos de transporte teórico máximo desde la CPU a la GPU.

Soluciones de servidor disponibles

Se espera que los aceleradores AMD Instinct MI100 para fin de año en sistemas de los principales socios OEM y ODM en los mercados empresariales, incluidos:

Dell
“Los servidores Dell EMC PowerEdge admitirán el nuevo AMD Instinct MI100, que permitirá obtener información más rápida de Esto ayudaría a nuestros clientes a lograr resultados de IA y HPC más sólidos y eficientes rápidamente “, dijo Ravi Pendekanti, vicepresidente senior de servidores PowerEdge de Dell Technologies. “AMD ha sido un socio valioso en nuestro apoyo para el avance de la innovación en el centro de datos. Las capacidades de alto rendimiento de los aceleradores AMD Instinct son un complemento natural para nuestra cartera de servidores PowerEdge AI y HPC”.

Gigabyte
“Nos complace volver a trabajar con AMD como socio estratégico que ofrece a los clientes hardware de servidor para computación de alto rendimiento”, dijo Alan Chen, vicepresidente asistente en NCBU, GIGABYTE. “Los aceleradores AMD Instinct MI100 representan el siguiente nivel de computación de alto rendimiento en el centro de datos, brindando mayor conectividad y ancho de banda de datos para investigación energética, dinámica molecular y capacitación en aprendizaje profundo. Como nuevo acelerador en la cartera de GIGABYTE, nuestros clientes pueden buscar para beneficiarse de un rendimiento mejorado en una amplia gama de cargas de trabajo HPC científicas e industriales “.

Hewlett Packard Enterprise (HPE)
“Los clientes utilizan los sistemas HPE Apollo para obtener capacidades y rendimiento especialmente diseñados para abordar una gama de cargas de trabajo complejas con uso intensivo de datos en la informática de alto rendimiento (HPC), el aprendizaje profundo y el análisis”, dijo Bill Mannel, vicepresidente y gerente general de HPC. en HPE. “Con la introducción del nuevo sistema HPE Apollo 6500 Gen10 Plus, seguimos avanzando en nuestra cartera para mejorar el rendimiento de la carga de trabajo al admitir el nuevo acelerador AMD Instinct MI100, que permite una mayor conectividad y procesamiento de datos, junto con el procesador AMD EPYC de segunda generación y. Esperamos continuar nuestra colaboración con AMD para expandir nuestras ofertas con sus últimas CPU y aceleradores “.

Supermicro
“Estamos entusiasmados de que AMD haya producido el acelerador de GPU HPC más rápido del mundo. La combinación de la potencia informática obtenida con la nueva arquitectura CDNA de AMD, junto con la alta memoria y el ancho de banda de GPU peer-to-peer que ofrece MI100, nuestros clientes obtenga acceso a excelentes soluciones que cumplirán con sus requisitos informáticos acelerados. Agregue la pila de software AMD ROCm abierta y obtendrán un entorno abierto, flexible y portátil para satisfacer su demanda de soporte de aplicaciones excepcional para cargas de trabajo empresariales críticas “, dijo Vik Malyala, vicepresidente senior de ingeniería de aplicaciones de campo y desarrollo comercial de Supermicro. “El AMD Instinct MI100 será una gran adición para nuestros servidores multi-GPU y nuestro conjunto de sistemas de alto rendimiento”.

Una respuesta a «AMD anuncia MI100, el acelerador HPC más rápido del mundo para investigación científica»

  1. los Matrix Core son el equivalente a los Tensor Cores de NVIDIA. estos deben meter algunos en RDNA 3 para acelerar varios tipos de operaciones

    por ejemplo, el escalado con IA que van a sacar se ejecutaria actualmente sobre las unidades de computo estandares, asi que tiene un coste sobre todas las operaciones de render. el asunto es hacer que la relacion coste ganancia sea positiva, se gane mas de lo que se pierda.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *