La historia de la industria de la computación es de constante progreso. Los procesadores se vuelven más rápidos, el almacenamiento se vuelve más barato y la memoria se vuelve más densa. Vemos las repercusiones de este avance en todos los aspectos de la sociedad, y eso se extiende también a la cima, donde los gobiernos nacionales continúan invirtiendo en supercomputadoras más grandes y mejores. Una parte de la necesidad tecnológica y una parte de la carrera tecnológica, la era de las supercomputadoras a gran escala está a punto de comenzar, ya que las órdenes para el primer equipo compatible con exaFLOP ahora están saliendo. Es lógico que esta mañana el Departamento de Energía de los Estados Unidos esté anunciando el contrato para su supercomputadora más rápida hasta ahora, el sistema Frontier, que será construido por Cray y AMD.

Está previsto que Frontier se entregue en 2021, y cuando se active, se convertirá en el segundo y más poderoso de los dos sistemas exascales planificados 2021 del DOE de EE. UU., Con un rendimiento que se espera que alcance 1.5 exaFLOPS. El ambicioso sistema no vendrá barato, sin embargo; con una etiqueta de precio de más de 500 millones de dólares solo para el sistema, y ​​otros 100 millones de dólares para investigación y desarrollo, Frontier se encuentra entre los supercomputadores más caros jamás ordenados por el Departamento de Energía de EE. UU.

La nueva supercomputadora se está construyendo como parte del programa CORAL-2 del DOE de los EE. UU. Para supercomputadoras, con Frontier programado para reemplazar la actual supercomputadora Summit del Laboratorio Nacional de Oak Ridge. Summit es el actual campeón actual en el mundo de las supercomputadoras, con 200 petaFLOPS de rendimiento y, en consecuencia, el US DOE y Oak Ridge pretenden mejorar significativamente su rendimiento para la nueva computadora. Dicho esto, Frontier debería poder ofrecer más de 7 veces el rendimiento de Summit, y se espera que sea la supercomputadora más rápida del mundo una vez que se active.

Al igual que Summit (y Titan antes que él), Frontier es un sistema científico abierto, lo que significa que está disponible para que los investigadores académicos realicen simulaciones y experimentos. En consecuencia, el laboratorio espera que la supercomputadora se utilice para una amplia gama de proyectos en numerosas disciplinas, que incluyen no solo las tareas tradicionales de modelado y simulación, sino también más técnicas basadas en datos para inteligencia artificial y análisis de datos. De hecho, este último es un poco de terreno nuevo para el laboratorio y los posibles usuarios del sistema; Tal como hemos visto en el espacio empresarial en los últimos años, la inteligencia artificial basada en redes neuronales se está convirtiendo en una técnica cada vez más popular para resolver problemas y extraer análisis de grandes conjuntos de datos, y ahora los investigadores están estudiando cómo refinar esas técnicas a partir de sistemas de generación actual y aplicarlos a proyectos a nivel de escala.

Frontier. Con Cray y AMD

Oficialmente, el contratista principal de Frontier será Cray. Pero mirando las especificaciones, podría ser excusado por pensar que era AMD. Por su parte, Cray se asocia con el fabricante de chips para el sistema, y ​​como resultado, AMD proporciona la mayor parte del hardware central para la nueva supercomputadora. Diseñado como un sistema de aceleración de CPU + de próxima generación, con una combinación de CPU y GPU que realizan el trabajo pesado de cómputo, AMD suministrará las CPU y las GPU para Frontier. Y como el principal proveedor de procesadores, AMD también asumirá gran parte de la responsabilidad del desarrollo de la pila de software, ya que la compañía está trabajando con Cray para desarrollar una versión mejorada de su entorno ROCm para extraer el mejor rendimiento del enorme cluster de CPUs y GPUs.

En lo que respecta a la CPU, AMD suministrará una CPU EPYC de próxima generación personalizada. AMD ha confirmado que va a utilizar una generación futura de sus núcleos de CPU Zen, y dado el tiempo del proyecto, es casi seguro que estamos viendo un diseño Zen 3 o Zen 4 aquí. La CPU de AMD personalizada aún está por verse, pero su anuncio ha revelado que las CPU de Frontier incluirán nuevas instrucciones para la optimización de la AI y las cargas de trabajo de supercomputación.

Mientras tanto, en el lado de la GPU, AMD y Cray mantienen sus cartas un poco más cerca. En lugar de nombrar a cualquier arquitectura o generación arquitectónica, AMD solo dice que las GPU están “basadas en la familia Radeon Instinct” y “aún no se han anunciado”. La hoja de ruta pública actual de AMD sale a “Next Gen” en 2020, y con Ciclos de desarrollo de GPU con un promedio de 2 años, esta puede ser la arquitectura que vemos. Pero con las necesidades particulares de una supercomputadora, AMD puede tener algo un poco más personalizado.

Lo que la compañía está confirmando por ahora es que no están frenando las características. La GPU centrada en HPC se está diseñando con Frontier en mente e incorporará soporte de computación de precisión mixta. Alimentar a la bestia será la memoria HBM, y AMD aprovechará una versión de Infinity Fabric para conectar las CPU y las GPU..

De hecho, si bien AMD se ha reservado sobre los detalles de la tecnología, parece que esta versión de IF será la versión más avanzada hasta el momento. AMD está notando específicamente que es un tejido coherente “increíblemente”, y lo llama el primer diseño de CPU + GPU totalmente optimizado para supercomputación. Las GPU y las CPU de AMD se organizarán en una proporción de 4 a 1, con 4 GPU para cada CPU EPYC. Vale la pena señalar que la diapositiva de AMD muestra una malla con cada GPU conectada a la CPU y otras dos GPU, pero todavía no estoy leyendo mucho sobre esto, ya que AMD no ha revelado ningún otro detalle sobre la configuración de IF.

Con AMD subiendo al nivel de blade, unir todos estos nodos será tarea de Cray. Para Frontier, el proveedor de supercomputadoras está lanzando su nueva interconexión Slingshot, una interconexión igualmente ambiciosa que admitirá funciones de enrutamiento adaptativo, gestión de congestión y calidad de servicio. Slingshot es capaz de 200 Gb / seg por puerto, con blades individuales que incorporan un puerto para cada GPU en el blade para que otros nodos puedan leer y escribir datos directamente en la memoria de una GPU. Como resultado, Frontier tendrá una cantidad significativa de ancho de banda de interconexión, que es casi necesario para permitir que el sistema pueda escalar a niveles exaFLOP.

En general, Frontier se organizará en más de 100 gabinetes Cray Shasta . Y si bien Cray no ha anunciado una cifra específica de consumo de energía para Frontier, con cada gabinete con capacidad para 300 kW, esto pondría el sistema completo a más de 30 MW. Para poner las cosas en contexto, esto es más del doble del consumo de energía de la Cumbre de 13MW. Entonces, mientras que Frontier es un sistema significativamente más rápido que la supercomputadora que reemplaza, Cray, AMD y el Departamento de Educación de los EE. UU. Sienten que la reducción de la escala de Dennard a medida que se incrementa la eficiencia energética es cada vez más difícil. En total, en un comentario que se hizo en la conferencia de prensa, parece que Oak Ridge instalará un total de 40MW de capacidad para Frontier, que es una cantidad significativa de energía, por decir lo menos.

Junto con la promoción de los objetivos de liderazgo de la supercomputación de los EE. UU., Asegurar el contrato de Frontier también representa grandes logros para Cray y AMD. Cray ahora está involucrado en ambos sistemas de exescalado de 2021, reforzando su propio lugar en el mundo de la supercomputación. Mientras tanto, para AMD, que está gastando esta generación actual desde el exterior mirando hacia adentro, ahora se han asegurado una importante y prestigiosa victoria para sus divisiones de CPU y GPU.

De hecho, es interesante observar que de los dos sistemas exescalares 2021 que se están ordenando, ambos provienen de proveedores de procesadores de servicio completo que suministran CPU y GPU. Los sistemas de generación actual como Summit utilizan proveedores mixtos, por ejemplo, IBM + NVIDIA, por lo que el cambio a proveedores integrados es un gran cambio para estos sistemas de CPU + acelerador. Claramente, hay beneficios tecnológicos y de adquisición al usar un solo proveedor para todos los procesadores, lo que beneficia tanto a AMD como a Intel. Aunque vale la pena señalar que el programa CORAL-2 requiere que el DOE compre sistemas basados ​​en dos arquitecturas diferentes, por lo que si el futuro son sistemas integrados, AMD e Intel son las opciones lógicas.

En cualquier caso, con el contrato establecido para Frontier, el trabajo está a medio hacer. AMD y Cray deberán continuar desarrollando su hardware y software para el sistema, sin mencionar el bloqueo de las especificaciones específicas para la supercomputadora terminada. Por lo tanto, espere seguir escuchando noticias sobre el lanzamiento de Frontier en los próximos dos años, hasta su instalación en 2021


3 commentarios

Physx · 21 mayo, 2019 a las 2:22 pm

SI y cuando te cobren la luz que vas a hacer

MATR1X · 7 mayo, 2019 a las 1:45 pm

Si se le puede poner Windows me interesa…donde la compro?

    otlo gato má · 12 mayo, 2019 a las 4:17 pm

    Yo también quiero una. Solo para miiiii!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *