Análisis comparativo de los chips de las nuevas consolas (en progreso)

Con la muestra hace unos dias de un microfotografía del chip del SoC de la consola Playstation 5, y luego algunas anotaciones de sus partes, he tratado de hacer un analisis comparativo de los chips, sus componentes y estructuras, y representar mi interpretacion.

He hecho lo posible, pues algunos esquemas anotados son generales, no especifican algunos bloques. Además están los cambios de estructuras, disposición y forma de los bloques (fundamentalmente en la parte de geometria, rops, caches y rasterizadores de las GPUs).

He empleado las imagenes de los tres SoC, ademas de SOC Renoir (GPU Vega), de RDNA RX 5500 XT, un esquema de RDNA 2, el whitepaper de RDNA. Tratando de encontart las similitudes en las unidades. Aunque a veces las marcaciones son conflictivas.

Así que se debe tener en cuenta que tengo errores.

Ojo! ninguna de las imagenes está a escala con relacion a las demás. La he tratado de ampliar y asimilar en tamaño para facilitar la visión y comparación.

Puede pinchar en las imagenes para verlas a mayor tamaño. Laa originales guardadas, no estas publicas, son de mayor calidad y resolucion, pero aqui es de ahorrar.

Esta imagen de arriba es una publicada en la web. La siguiente es la de mi analisis propio.

SoC completo

El SoC del PS5 tiene 1 grupos adicional de 4 ROPs en cada mitad del circuito, como medida contra fallos de fabricación. Es decir, si alguna (hasta 2) de estas unidades salen defectuosa, hay “repuestos”

Una cosa que me ha parecido, mirando y comparando, es que las unidades de geometria y comandos son mas parecidas en forma y estructura a las de RDNA 1, y menos a las de RDNA 2. Luego pongo una imagen de esta area de un chip RDNA1, para comparar.

Una cosa confusa es que, segun parece, tiene 12 grupos de ROPs como máximo (incluyendo 4 entrelazados en area con unas TMUS, esas CU tienen más espacio para hacerlo), cuando creo que deberia tener 8 grupos, para 64 ROPs en total. Esto la hace menos potente que la PS5 en capacidad raster? 64 la PS5 vs 48 la XBOSX. Es que no hay forma que logre ver 4 ROPs adicionales.

Si fueran los grupos de 8 ROPS y quitando 2 de “repuesto”, tendria los 64 ROPs. Pero en otros esquemas marcados de otros GPUs dicen que esas unidades son de 4 ROPs, asi que es confuso…

El SoC del XBOXSS es el que más cuesta en cierta medida definir sus unidades, pues parece haber un exceso de ellas.

De hecho, este SoC parece tener varias unidades de repuesto, en caches, ROPs y otras, pues tiene mas espcacio y relacion componentes/area total. Esto permite que más chips puedan emplearse en casos de fallos de fabricación de estas partes.

También estas duplicaciones son las que me hacen dificil reconocer algunos bloques.

Finalmente, vemos que ninguno de los tres SoC posee Infinity Cache.

Nucleos del CPU

Los núcleos CPU son Zen2. Las XBOX Series X|S son iguales entre si, y a su vez, iguales a un nucleo Zen 2 completo.

Los núcleos de la PS5 estan recortados en su unidad de calculo vectorial SIMD. Se han eliminados las unidades FMAD (inecesarias esta operaciones?) y AES (se tiene HW especifico separado). Incluso el ancho de los registros, pasando de AVX256 a AVX128. ¿El codigo AVX256 lo tratarían entonces como Zen/Zen+, en dos operaciones de 128? ¿O se limitarian las bibliotecas de desarrollo para solo usar AVX128?

CPU L3 Cache

Las caches en todos lo casos son iguales, y son iguales a la caché de los APU R5-4600 y superiores, o de los Ryzen moviles 4500U y sueriores.

GPU

Vamos a los Compute Units del GPU.

Lamentablemente no he podido encontrar una imagen del chip de alguna de las GPUs con arquitectura RDNA2, NAVI 2x, las RX6000. La unica imagen que hay en todas partes es un esquema. A partir de este esquema saco la imagen de lo que seria la estructura de un Work Group Processor de RDNA 2 en estas GPUs.

Si lo comparamos con un WGP de RDNA 1.

Vemos que el cambio fundamental en estructura ha sido en la posición de los registros vectoriales.

El WGP de las XBOXSX y PS5 es muy parecido, solo una ligera diferecnia en en uno de los bloques de las compute units.

El WGP de la XBOXSS tiene las Unidades de Mapeo/Filtrado de Textura (TMU, TFU), y los Aceleradores de Rayos (RA) de una forma mas compacta.

Las unidades TMU/TFU/RA de las XBOXSX y PS5 tiene esa forma para ser intercaladas con las del WGP que queda a su lado.

Estas diferencias entre las dos XBOX, esta dada por la S tener una relación entre el area total del chip y de sus bloques componentes mayor que permite disponer de más espacio. Por esto la S parece tener mas unidades de “repuesto”, lo que permite producir más chips utiles.

Veamos dos grandes ampliaciones de los WGP de las PS5 y XBOXSX

Las unidades “Ray Accelerator” no son discernibles, pues la operacion se realiza en las TMU modificadas. Es decir, cada TMU hace recorridos de BVH e interseccion rayo-cubo (para el BVH) y rayo-triangulo (para la geometria)

Una pregunta que salta es ¿donde queda la parte de aceleracion de ML en el SoC de la XBOX Series X? En cada CU? Si es asi en que parte, no se ve espacio. O en la parte central, justo a los procesadores de comandos y geometria.

Para completar, una comparacion de las unidades de computo desde Polaris (GCN4) hasta RDNA2/CDNA

ROPs, Raster, Parameters, etc

en progreso…

Geometry, HWS, ACEs, etc

en progreso…

Multimedia

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *