El Mac Mini 2020 desatado: poniendo a prueba Apple Silicon M1

La semana pasada, Apple fue noticia en la industria al anunciar nuevos productos Mac basados ​​en el nuevo chip Apple Silicon M1 SoC de la compañía, lo que marca el primer paso de una hoja de ruta planificada de 2 años para la transición de las CPU x86 basadas en Intel a las propias de la compañía. microprocesadores diseñados que se ejecutan en el conjunto de instrucciones Arm.

Durante el lanzamiento, preparamos un extenso artículo basado en el chip Apple A14 ya relacionado de la compañía, que se encuentra en los teléfonos iPhone 12 de nueva generación. Esto incluye una profunda inmersión en microarquitectura bastante extensa en los nuevos núcleos Firestorm de Apple que alimentan tanto al A14 como al nuevo Apple Silicon M1, recomendaría una lectura si aún no ha tenido la oportunidad.

Desde hace unos días, hemos podido tener en nuestras manos uno de los primeros dispositivos Apple Silicon M1: la nueva edición Mac mini 2020. Si bien en nuestro artículo de análisis de la semana pasada basamos nuestros números en el A14, esta vez hemos medido el rendimiento real en el nuevo diseño real de mayor potencia. No hemos tenido mucho tiempo, pero le brindaremos los puntos de datos clave relevantes para el nuevo Apple Silicon M1.

Apple Silicon M1: ¿núcleos Firestorm a 3,2 GHz y ~20-24 W TDP?

Durante el evento de lanzamiento, una cosa que en la moda de Apple generalmente faltaba en la presentación eran detalles reales sobre las frecuencias de reloj del diseño, así como su TDP, que puede mantener al máximo rendimiento.

Podemos confirmar que en cargas de trabajo de un solo subproceso, los núcleos Firestorm de Apple ahora registran 3.2GHz, un aumento del 6.66% sobre la frecuencia de 3GHz del Apple A14. Siempre que haya un margen térmico, este reloj también se aplica a cargas de todos los núcleos, además de 4 núcleos de rendimiento de 3,2 GHz que también ven 4 núcleos de eficiencia Thunder a 2064 MHz, también bastante más altos que 1823 MHz en el A14.

Junto con los cuatro núcleos Firestorm de rendimiento, el M1 también incluye cuatro núcleos Icestorm que están destinados a una baja potencia inactiva y una mayor eficiencia energética para el funcionamiento con batería. Tanto los 4 núcleos de rendimiento como los 4 núcleos de eficiencia pueden estar activos en tándem, lo que significa que este es un SoC de 8 núcleos, aunque el rendimiento en todos los núcleos no es idéntico.

La pregunta más importante durante el evento del anuncio fue el consumo de energía de estos diseños. Apple había presentado varios gráficos que incluían el rendimiento y los ejes de potencia, sin embargo, carecíamos de datos de comparación para llegar a una conclusión adecuada.

Como teníamos acceso a la Mac mini en lugar de a una Macbook, eso significaba que la medición de energía era bastante simple en el dispositivo, ya que solo podíamos conectar un medidor a la entrada de CA del dispositivo. Cabe señalar con un gran descargo de responsabilidad que debido a que estamos midiendo la potencia de la pared de CA aquí, las cifras de potencia no son directamente comparables a las de los dispositivos que funcionan con baterías, ya que la fuente de alimentación del Mac mini incurrirá en una pérdida de eficiencia mayor que la de otros los SoC móviles, así como las cifras de TDP publicadas por proveedores contemporáneos como Intel o AMD.

Es especialmente importante tener en cuenta que la cifra de lo que generalmente recordamos como TDP en procesadores es en realidad solo un subconjunto de las cifras presentadas aquí, ya que más allá del SoC también estamos midiendo DRAM y sobrecarga de regulación de voltaje, algo que no incluido en las cifras de TDP ni en la lectura de energía de un paquete típico en una computadora portátil.

Comenzando con una Mac mini inactiva en su estado predeterminado mientras está inactiva cuando está encendida, mientras está conectada a través de HDMI a un monitor 2560p144, Wi-Fi 6 y un mouse y teclado, estamos viendo una potencia total del dispositivo en 4.2W. Dado que estamos midiendo la potencia de CA en el dispositivo, que puede ser bastante ineficiente con cargas bajas, esto tiene mucho sentido y representa una cifra excelente.

Esta cifra inactiva también sirve como base para las siguientes mediciones en las que calculamos la “potencia activa”, es decir, nuestra metodología habitual de tomar la potencia total medida y restar la potencia inactiva.

Durante las cargas de trabajo promedio de un solo subproceso en los núcleos Firestorm de 3.2GHz, como la compilación del código GCC, vemos que la potencia del dispositivo aumenta a 10.5W con una potencia activa de alrededor de 6.3W. La cifra de potencia activa está muy en línea con lo que esperaríamos de un núcleo Firestorm de mayor frecuencia, y es extremadamente prometedora para Apple y el M1.

En cargas de trabajo que son más pesadas en DRAM y, por lo tanto, incurren en una penalización de energía mayor en la DRAM de 128 bits y 16 GB de clase LPDDR4X en la Mac mini, estamos viendo que la potencia activa aumenta a 10.5W. Ya con estas cifras, el nuevo M1 es impresionante y presenta menos de un tercio de la potencia de una CPU móvil Intel de gama alta.

En escenarios de subprocesos múltiples, la energía depende en gran medida de la carga de trabajo. En cargas de trabajo con gran cantidad de memoria donde la utilización de la CPU no es tan alta, estamos viendo una potencia activa de 18 W, que sube a alrededor de 22 W en cargas de trabajo promedio y alcanza un máximo de alrededor de 27 W en cargas de trabajo pesadas de cómputo. Estas cifras son generalmente lo que le gustaría comparar con los “TDP” de otras plataformas, aunque nuevamente para obtener una comparación de manzanas con manzanas, necesitaría restar más algunos de los gastos generales medidos en la Mac mini aquí: la mejor estimación sería un rango de 20 a 24 W.

Finalmente, por parte de la GPU, estamos viendo una cifra de consumo de energía menor de 17.3W en GFXBench Aztec High. Esto contendría una mayor cantidad de energía DRAM, por lo que el consumo de energía de la GPU de Apple es definitivamente extremadamente bajo y mucho menor que la potencia máxima que pueden consumir las CPU.

Diferencias de memoria

Además de los núcleos adicionales por parte de las CPU y la GPU, un factor de rendimiento principal del M1 que se diferencia del A14 es el hecho de que se ejecuta en un bus de memoria de 128 bits en lugar del bus móvil de 64 bits. A través de 8 canales de memoria de 16 bits y memoria de clase LPDDR4X-4266, esto significa que el M1 alcanza un máximo de ancho de banda de memoria de 68,25 GB / s.

En términos de latencia de memoria, estamos viendo una reducción (bastante esperada) en comparación con el A14, que mide 96ns a 128 MB de profundidad de prueba aleatoria completa, en comparación con 102ns en el A14.

Cabe destacar además el caché L2 de 12 MB de los núcleos de rendimiento, aunque aquí parece que Apple continúa haciendo algunas particiones en cuanto a cuánto puede usar un solo núcleo, ya que todavía estamos viendo un aumento de latencia después de 8 MB.

El M1 también contiene una gran caché SLC a la que deberían poder acceder todos los bloques de IP del chip. No estamos exactamente seguros, pero los resultados de la prueba se comportan de manera muy parecida a la del A14 y, por lo tanto, asumimos que se trata de un trozo de caché similar de 16 MB en el SoC, ya que algunos patrones de acceso se extienden más allá de los del A14, lo cual tiene sentido dado el L2 más grande.

Un aspecto que nunca hemos tenido la oportunidad de probar es exactamente qué tan buenos son los núcleos de Apple en términos de ancho de banda de memoria. Dentro del M1, los resultados son revolucionarios: una sola Firestorm logra lecturas de memoria de hasta alrededor de 58GB / s, con escrituras de memoria llegando a 33-36GB / s. Lo más importante es que las copias de memoria llegan a 60 a 62 GB / s, dependiendo de si está usando instrucciones escalares o vectoriales. El hecho de que un solo núcleo Firestorm casi pueda saturar los controladores de memoria es asombroso y es algo que nunca antes habíamos visto en un diseño.

Debido a que un núcleo puede hacer uso de casi todo el ancho de banda de la memoria, tener acceso a varios núcleos al mismo tiempo en realidad no aumenta el ancho de banda del sistema, pero en realidad debido a la congestión reduce el ancho de banda agregado efectivo logrado. He notado esto especialmente cuando utilizo los núcleos de rendimiento junto con los núcleos de eficiencia en las copias de memoria: 4 núcleos grandes alcanzan un máximo de 59 GB / s de copias de memoria, pero tan pronto como se agrega un núcleo de eficiencia, esto se reduce a 49 GB / s, yendo hasta 46 GB / s cuando todos los núcleos están activos, lo que indica un cuello de botella en el sistema en alguna parte.

Más allá del aumento de la velocidad del reloj, el aumento de L2, este aumento de memoria también es muy probable que ayude al M1 a diferenciar su rendimiento más allá del A14, y ofrecer una competencia a través de los titulares x86.

Puntos de referencia: con lo que esté disponible

Como hemos tenido muy poco tiempo con la Mac mini, y el hecho de que este no solo es un sistema macOS, sino un nuevo sistema macOS basado en Arm64, nuestras opciones de referencia habituales que solemos usar no están realmente disponibles para nosotros. Hemos cumplido con una variedad de pruebas disponibles en el momento del lanzamiento para darnos una idea aproximada del rendimiento:

Un punto de referencia en particular que ve la primera luz del día en macOS, así como en Apple Silicon, es Cinebench. En esta vista por primera vez del popular punto de referencia basado en Cinema4D, vemos el Apple M1 cara a cara con las CPU x86 de mejor rendimiento en el mercado, superando ampliamente las iteraciones pasadas de Apple de silicio Intel. El M1 aquí pierde frente a las CPU Zen3 y Tiger Lake, que aún parecen tener una ventaja, aunque no estamos seguros de las características de microarquitectura del nuevo punto de referencia.

Lo que es notable es el rendimiento de la ejecución de Rosetta2 del punto de referencia cuando está en modo x86, que no solo es capaz de mantenerse al día con las iteraciones anteriores de Mac, sino que también las supera.

En las ejecuciones R23 de subprocesos múltiples, el M1 domina absolutamente las Mac anteriores con CPU similares de bajo consumo. Cabe señalar que estamos tratando de recopilar más datos sobre otros sistemas a medida que tenemos acceso a ellos y expandir el gráfico en futuras actualizaciones del artículo después de la publicación.

En los puntos de referencia de los navegadores, sabemos que las CPU de Apple dominan en gran medida el panorama, pero había dudas sobre si esto se debía a las propias CPU del iPhone o más bien a los navegadores y motores de navegador. Ahora que se ejecuta en macOS y Safari de escritorio, pudiendo comparar datos con otros sistemas Intel Mac, podemos llegar a la conclusión de que la ventaja de rendimiento se debe a los diseños de CPU de Apple.

El rendimiento de la navegación web parece ser una prioridad extremadamente alta para la CPU de Apple, y esto tiene sentido ya que es la carga de trabajo asesina para los SoC móviles y la carga de trabajo que más se usa en la vida cotidiana.

En Geekbench 5, el M1 lo hace de nuevo extremadamente bien, ya que en realidad lidera nuestras cifras de rendimiento. Incluso cuando se ejecuta en modo de compatibilidad x86, el M1 es capaz de igualar el rendimiento superior de un solo subproceso de las CPU de gama alta de la última generación y superar ampliamente el de las iteraciones anteriores de Mac mini y Macbooks anteriores.

El rendimiento de subprocesos múltiples depende del número de núcleos y la eficiencia energética de un diseño. El M1 aquí demuele un Macbook Pro 2017 de 15 pulgadas con un Intel i7-7820HQ con 4 núcleos y 8 subprocesos, publicando más del doble de la puntuación. Agregaremos más puntos de datos a medida que los recopilemos.

Rendimiento de la GPU M1: Rey integrado, rival discreto

Si bien la mayor parte del enfoque del cambio a los chips de Apple está en los núcleos de la CPU, y por una buena razón, cambiar la arquitectura de la CPU subyacente si sus computadoras no es un asunto trivial, los aspectos de la GPU del M1 no deben ignorarse. Al igual que sus núcleos de CPU, Apple ha estado desarrollando su propia tecnología de GPU durante varios años, y con el cambio a Apple Silicon, esos diseños de GPU llegarán a Mac por primera vez. Y desde el punto de vista del rendimiento, podría decirse que es incluso más importante que la CPU de Apple.

Apple, por supuesto, tiene durante mucho tiempo la reputación de exigir un mejor rendimiento de la GPU que el OEM de PC promedio. Mientras que muchos de los socios de Intel estaban felices de enviar sistemas con gráficos Intel UHD y otras soluciones básicas incluso en algunas de sus computadoras portátiles de 15 pulgadas, Apple optó por enviar una GPU discreta en su MacBook Pro de 15 pulgadas. Y cuando no pudieron colocar una dGPU en el modelo de 13 pulgadas, en su lugar utilizaron las configuraciones de GPU Iris premium de Intel con GPU más grandes y una caché eDRAM en chip, convirtiéndose en uno de los únicos clientes habituales de esos chips más potentes.

Así que ha quedado claro desde hace algún tiempo que Apple siempre ha querido un mejor rendimiento de la GPU que el que ofrece Intel de forma predeterminada. Al cambiar a su propio silicio, Apple finalmente puede poner su dinero donde está su boca, por así decirlo, al construir un SoC para computadora portátil con todo el rendimiento de GPU que siempre quisieron.

Mientras tanto, a diferencia del lado de la CPU de esta transición a Apple Silicon, la naturaleza de alto nivel de la programación de gráficos significa que Apple no depende tanto de los desarrolladores para preparar inmediatamente aplicaciones universales para aprovechar la GPU de Apple. Sin duda, el código de CPU nativo seguirá produciendo mejores resultados, ya que una carga de trabajo que está puramente limitada por GPU es casi desconocida, pero el hecho de que el código Metal existente (e incluso OpenGL) se pueda ejecutar sobre la GPU de Apple hoy en día significa que beneficia inmediatamente a todos los juegos y otras cargas de trabajo vinculadas a la GPU.

En cuanto a la GPU del M1 SoC, como era de esperar, se parece mucho a la GPU del A14. Apple habrá necesitado modificar un poco su diseño para tener en cuenta las sensibilidades de Mac (por ejemplo, varias texturas de GPU y formatos de superficie), pero en general, la diferencia se abstrae en el nivel de API. En general, dado que M1 es A14 pero más grande, Apple ha ampliado su diseño de GPU de 4 núcleos de ese SoC a 8 núcleos para el M1. Desafortunadamente, tenemos menos conocimiento de las velocidades de reloj de la GPU que de las velocidades de reloj de la CPU, por lo que no está claro si Apple las ha aumentado en absoluto; pero me sorprendería un poco que los relojes de la GPU no hayan subido al menos una pequeña cantidad. En general, el diseño de la GPU de 4 núcleos de A14 ya era bastante potente para los estándares de los teléfonos inteligentes, por lo que un diseño de 8 núcleos lo es aún más. La GPU integrada de M1 no solo está diseñada para superar a las GPU integradas de AMD e Intel,pero también está diseñado para perseguir GPU discretas.

Una suposición informada sobre las especificaciones de la GPU de Apple

Finalmente, debe tenerse en cuenta que Apple está enviando dos configuraciones de GPU diferentes para el M1. El Mac Mini y el MacBook Pro tienen chips con los 8 núcleos de GPU habilitados. Mientras tanto, para el Macbook Air, depende del SKU: el modelo de nivel de entrada tiene una configuración de 7 núcleos, mientras que el modelo de nivel superior tiene 8 núcleos. Esto significa que el Air de nivel de entrada obtiene la GPU más débil en papel, detrás de un M1 completo en aproximadamente un 12%, pero será interesante ver cómo el núcleo de apagado influye en la regulación térmica en esa computadora portátil enfriada pasivamente.

Para comenzar nuestro análisis del rendimiento de la GPU, comencemos con GFXBench 5.0. Este también es uno de nuestros puntos de referencia habituales para las revisiones de portátiles, por lo que nos brinda una buena oportunidad para comparar el Mac Mini basado en M1 con una variedad de otras combinaciones de CPU / GPU dentro y fuera del ecosistema Mac. En general, esta no es una prueba del todo justa, ya que la Mac Mini es una computadora de escritorio pequeña en lugar de una computadora portátil, pero como M1 es un chip centrado en una computadora portátil, esto al menos nos da una idea de cómo se desempeña M1 cuando llega a dar lo mejor de sí. pie adelante.

En general, la GPU del M1 comienza muy bien aquí. Tanto en la configuración Normal como en la Alta, está muy por delante de cualquier otra GPU integrada, e incluso de una Radeon RX 560X discreta. Solo una vez que llegamos a la GTX 1650 de NVIDIA y mejor, la M1 finalmente se queda sin gasolina.

La diferencia en comparación con el Intel Mac Mini 2018 es especialmente de día y de noche. La GPU de gráficos Intel UHD (Gen 9.5) en ese sistema está ampliamente superada hasta el punto de ser casi absurdo, brindando una ganancia de rendimiento de más de 6 veces. E incluso otras configuraciones como el MBP de 13 pulgadas con gráficos Iris o una PC con un Ryzen 4700U (gráficos Vega 7) se superan fácilmente. En resumen, el M1 del nuevo Mac Mini ofrece niveles de rendimiento de GPU discretos.

Como acotación al margen, también me tomé la libertad de ejecutar la versión x86 del punto de referencia a través de Rosetta, con el fin de echar un vistazo a la penalización del rendimiento. En GFXBench Aztec Ruins, al menos, no hay ninguno. El rendimiento de la GPU es casi idéntico tanto con el binario nativo como con la traducción binaria.

Echando un último vistazo rápido al campo más amplio con un punto de referencia sintético completamente tonto, tenemos 3DMark Ice Storm Unlimited. Gracias a la capacidad de Apple Silicon Macs para ejecutar aplicaciones de iPhone / iPad, podemos ejecutar este punto de referencia en una Mac por primera vez ejecutando la versión de iOS. Este es un punto de referencia muy antiguo, creado para la era OpenGL ES 2.0, pero es interesante que le vaya incluso mejor que GFXBench. La Mac Mini funciona lo suficientemente bien como para deslizarse más allá de una computadora portátil equipada con GTX 1650 aquí, y aunque esto no será algo habitual, demuestra lo potente que puede ser la M1.

Otro punto de referencia de GPU que se ha actualizado para el lanzamiento de las nuevas Mac de Apple es BaseMark GPU. Este no es un punto de referencia regular para nosotros, por lo que no tenemos puntajes para otras computadoras portátiles que no sean Mac a la mano, pero nos da otro vistazo a cómo se compara M1 con otras ofertas de GPU Mac. La Mac Mini 2020 todavía deja a la Mac Mini basada en Intel 2018 en el polvo y, para el caso, es al menos un 50% más rápida que la MacBook Pro 2017 con una Radeon Pro 560 también. Los MacBook Pros más nuevos funcionarán mejor, por supuesto, pero tenga en cuenta que esta es una GPU integrada con todo el chip consumiendo menos energía que solo la CPU de un MacBook Pro, sin importar la GPU discreta.

Finalmente, poniendo la teoría en práctica, tenemos Rise of the Tomb Raider. Lanzado en 2016, este juego tiene un puerto Mac adecuado y un punto de referencia incorporado, lo que nos permite ver el M1 en un escenario de juego y compararlo con algunas otras computadoras portátiles con Windows. Es cierto que este juego es un poco más antiguo, pero sus requisitos de rendimiento son una buena combinación para el tipo de rendimiento que el M1 está diseñado para ofrecer. Finalmente, debe tenerse en cuenta que este es un juego x86, no ha sido transferido a Arm, por lo que el lado de la CPU del juego se ejecuta a través de Rosetta.

En nuestra configuración de 768p Value, la Mac Mini está entregando más de 60 fps aquí. Una vez más, está muy por delante del Mac Mini 2018 basado en Intel, así como de todas las demás GPU integradas en esta pila. Incluso el MBP de 15 pulgadas y su Radeon Pro 560 todavía están por detrás del Mac Mini en más de un 25%, y se necesita una computadora portátil Ryzen con una Radeon 560X para finalmente igualar con la Mac Mini.

Mientras tanto, al subir las cosas hasta 1080p con la configuración Enthusiast, se descubre que la Mac Mini basada en M1 todavía ofrece apenas 40 fps, y ahora está más del 20% por delante del sistema Ryzen + 560X antes mencionado. Esto deja a la Mini muy por detrás de la GTX 1650 aquí, con Rosetta y las ineficiencias generales de la API probablemente desempeñando un papel, pero demuestra lo que se necesita para vencer a la GPU integrada de Apple. A 39.6 fps, el Mac Mini se puede reproducir bastante a 1080p con una buena configuración de calidad de imagen, y sería bastante fácil reducir un poco la resolución o la calidad de imagen para volver a superar los 60 fps. Todo en una GPU integrada.

Actualización 11-17, 7pm : Desde la publicación de este artículo, hemos podido acceder a las herramientas necesarias para medir el consumo de energía del SoC de Apple a nivel de paquete y núcleo. Así que volví y capturé datos de energía para GFXBench Aztec Ruins at High y Rise of the Tomb Raider en la configuración Enthusiast.

Las dos cargas de trabajo son significativamente diferentes en lo que están haciendo bajo el capó. Aztec es una prueba sintética que se ejecuta fuera de la pantalla para ser lo más pura posible de una prueba de GPU. Como resultado, registra el mayor consumo de energía de la GPU, 10 vatios, pero también apenas rasca los núcleos de la CPU prácticamente sin tocar (y para el caso, otros elementos como el controlador de pantalla). Mientras tanto, Rise of the Tomb Raider es una carga de trabajo de un juego real, y podemos ver que está ejercitando todo el SoC. El consumo de energía de la GPU ronda los 7 vatios, y aunque el consumo de energía de la CPU es mucho más variable, también alcanza un máximo un poco más alto.

Pero independientemente del punto de referencia utilizado, el resultado final es el mismo: el M1 SoC ofrece todo este rendimiento a niveles de consumo de energía de ultrabook. Ofrecer un rendimiento de GPU discreto de gama baja en 10 vatios (o menos) es una parte importante de por qué M1 es tan potente: significa que Apple puede dar a sus dispositivos pequeños mucha más potencia de GPU de la que ellos (o los fabricantes de equipos originales de PC) podrían de otra manera.

En última instancia, estos puntos de referencia son una prueba muy sólida de que la GPU integrada del M1 va a estar a la altura de la reputación de Apple de GPU de alto rendimiento. La primera GPU construida por Apple para Mac es significativamente más rápida que cualquier GPU integrada que hayamos podido conseguir y sin duda establecerá un nuevo listón alto para el rendimiento de la GPU en una computadora portátil. Basado en las propias tomas de dado de Apple, está claro que gastaron una parte considerable del dado del M1 en la GPU y el hardware asociado, y la recompensa es una GPU que puede rivalizar incluso con las GPU discretas de gama baja. Dado que el M1 es simplemente la línea de base de lo que vendrá, Apple necesitará GPU aún más potentes para las computadoras portátiles de gama alta y sus computadoras de escritorio restantes, será muy interesante ver lo que Apple y su ecosistema de desarrolladores pueden hacer cuando la GPU de línea de base El rendimiento incluso para el Mac más barato es así de alto.

SPEC2006 y 2017: Estándar de la industria – Desempeño ST

El rendimiento de un solo hilo del nuevo M1 es sin duda uno de sus aspectos clave, donde los nuevos núcleos Firestorm definitivamente superan su clase de potencia. Habíamos insinuado en nuestro artículo de análisis A14 de vista previa que el M1 bien podría estar terminando no solo como la CPU móvil de bajo consumo de alto rendimiento, sino que en realidad terminaría como el rendimiento absoluto de mejor rendimiento entre todas las CPU del mercado. El A14 no alcanzó esa designación, pero el M1 es una implementación aún más rápida de los nuevos núcleos Firestorm.

Cabe señalar que estamos comparando el M1 con las mejores plataformas de escritorio y portátiles del mercado en este momento, y solo buscamos el mejor rendimiento de un solo subproceso.

En SPECint2006, ahora estamos viendo que el M1 cierra la brecha con el Zen3 de AMD, y ahora lo supera en varias cargas de trabajo, lo que aumenta la brecha con el nuevo diseño de Tiger Lake de Intel, así como con su CPU de escritorio de alto rendimiento, en la que ahora supera el M1. la mayoría de cargas de trabajo.

Desde nuestros resultados de A14, hemos podido rastrear la configuración del compilador de Apple que aumenta el 456.hmmer en una cantidad tan dramática – Apple establece por defecto “-mllvm -enable-loop-distribution = true” en su cadena de herramientas de compilación más reciente mientras debe estar habilitado en compiladores LLVM de terceros. Un 5950X con la bandera habilitada aumenta su puntuación a 91,64, pero también observa algunas regresiones en otras pruebas. No hemos tenido tiempo de volver a probar otras plataformas.

El aumento de rendimiento del M1 en 462.libquantum se debe al aumento de la caché L2, así como al ancho de banda de memoria duplicado del sistema, algo de lo que esta carga de trabajo está muy hambrienta.

En las cargas de trabajo de fp2006, estamos viendo que el M1 presenta grandes aumentos de rendimiento en relación con el A14, lo que significa que ahora puede reclamar el mejor rendimiento de todas las CPU que se comparan aquí.

En el puntaje general, el M1 aumenta los puntajes en un 9.5% y un 17% sobre el A14. En la puntuación entera, el M1 toma la delantera aquí, aunque si tuviéramos que tener en cuenta la discrepancia de 456.hmmer, todavía favorecería al 5950X basado en Zen3. Sin embargo, en la puntuación de punto flotante, el Apple M1 ahora lleva una gran ventaja, lo que lo convierte en el núcleo de CPU con mejor rendimiento.

Hemos tenido muchas discusiones sobre si 2006 es relevante o no en el panorama actual. Tenemos razones prácticas para no ejecutar aún SPEC2017 en dispositivos móviles, pero dado que el nuevo Apple Silicon M1 se ejecuta en macOS, estas preocupaciones no son válidas, lo que nos permite ejecutar también la suite de referencia más moderna.

Cabe señalar que actualmente no tenemos un compilador Fortran funcional en los sistemas macOS de Apple Silicon, por lo que tenemos que omitir varias cargas de trabajo en la suite de 2017, por lo que faltan en los gráficos. Nos estamos concentrando en las cargas de trabajo restantes de C / C ++.

La situación no cambia demasiado con la nueva suite SPECint2017. El núcleo Firestorm de Apple aquí sigue siendo extremadamente impresionante, en el peor de los casos, igualando la nueva CPU Tiger Lake de Intel en rendimiento de un solo subproceso, y en el mejor de los casos, manteniendo el ritmo y, a veces, superando a la nueva CPU Zen3 de AMD en los nuevos chips Ryzen 5000.

El rendimiento de Apple es extremadamente equilibrado en todos los ámbitos, pero lo que se destaca es el excelente rendimiento de 502.gcc_r, donde da un salto considerable por delante de la competencia, lo que significa que el nuevo núcleo de Apple funciona extremadamente bien en código muy complejo y compilación de código.

En SPECfp2017, estamos viendo algo bastante drástico en términos de puntuaciones. El M1 aquí, en el peor de los casos, está a la altura de un pelo detrás del Zen3 de AMD, y en el mejor de los casos, presenta el mejor rendimiento absoluto de cualquier CPU del mercado. Son puntuaciones increíbles.

En los nuevos gráficos int y fp generales de SPEC2017, el Apple Silicon M1 queda por detrás del Zen3 de AMD en el rendimiento de enteros, sin embargo, toma una ventaja indiscutible en la suite de punto flotante.

En comparación con los diseños contemporáneos de Intel, el Apple M1 es capaz de mostrar un salto de rendimiento por delante de lo mejor que la compañía tiene para ofrecer, con nuevamente una fuerza considerable en la puntuación FP.

Si bien el Zen3 de AMD todavía tiene los líderes en varias cargas de trabajo, debemos recordarnos que esto tiene un gran costo en consumo de energía en el rango de + 49W, mientras que el Apple M1 aquí usa 7-8W de potencia activa total del dispositivo.

SPEC2017 – Rendimiento de varios núcleos

Si bien sabíamos que el Apple M1 funcionaría extremadamente bien en el rendimiento de un solo subproceso, las fortalezas del diseño también están en su eficiencia energética, que debería traducirse directamente en un rendimiento multiproceso excepcionalmente bueno en diseños de energía limitada. Notamos que aunque Apple realmente no publica ninguna cifra de TDP, estimamos que el M1 aquí en el Mac mini se comporta como un chip TDP de 20-24W.

Incluimos el sistema Tiger Lake más nuevo de Intel con un i7-1185G7 a 28W, un AMD Ryzen 7 4800U a 15W y un Ryzen 9 4900HS a 35W como puntos de comparación. Cabe señalar que el consumo de energía real de estos dispositivos debe exceder el de sus TDP anunciados, ya que no tiene en cuenta DRAM o VRM.

En la tarifa SPECint2017, el Apple M1 lucha con los conjuntos de chips de AMD, y los resultados varían según la carga de trabajo, a veces ganando, a veces perdiendo.

En los resultados de la tasa de fp2017, vemos resultados similares, con el Apple M1 luchando con el chip de computadora portátil de gama alta de AMD, capaz de superar la parte más baja de TDP y claramente mantenerse por delante del diseño de Intel.

En las puntuaciones generales de varios núcleos, el Apple M1 es extremadamente impresionante. En cargas de trabajo enteras, todavía parece que los diseños más recientes basados ​​en Renoir de AMD superan al M1 en rendimiento, pero solo en las cargas de trabajo enteras y con un TDP y un consumo de energía notablemente más altos.

La ventaja de Apple contra el SoC Tiger Lake de Intel a 28W aquí es indiscutible, y muestra la razón por la que Apple decidió abandonar su socio de silicio a largo plazo durante 15 años. El M1 no solo supera lo mejor que Intel tiene para ofrecer en este segmento de mercado, sino que lo hace con menos potencia.

También incluí puntuaciones de subprocesos múltiples del M1 al ignorar los 4 núcleos de eficiencia del sistema. Aquí, aunque es un diseño de “8 núcleos”, la naturaleza heterogénea de las CPU significa que el rendimiento está desequilibrado hacia los núcleos grandes. Eso no significa que los núcleos de eficiencia sean absolutamente débiles: su uso aún aumenta el rendimiento total en un 20-33%, dependiendo de la carga de trabajo, lo que favorece las tareas de procesamiento pesado.

En general, Apple no solo ofrece una alternativa de silicio viable a AMD e Intel, sino que en realidad algo que los supera en rendimiento absoluto y eficiencia energética. Naturalmente, en sistemas de mayor nivel de potencia y mayor cantidad de núcleos, el M1 no puede mantenerse al día con los diseños de AMD e Intel, pero eso es algo que Apple probablemente querrá abordar con diseños posteriores en esa categoría durante los próximos 2 años.

Rosetta2: rendimiento de traducción x86-64

Los nuevos Apple Silicon Macs que se basan en un nuevo ISA significa que el hardware no es capaz de ejecutar el software existente basado en x86 que se ha desarrollado durante los últimos 15 años. Al menos, no sin ayuda.

El nuevo Rosetta2 de Apple es un nuevo sistema de traducción binario adelantado que puede traducir el antiguo software x86-64 a AArch64 y luego ejecutar ese código en las nuevas CPU Apple Silicon.

Entonces, ¿qué tiene que hacer para ejecutar aplicaciones Rosetta2 y x86? La respuesta es prácticamente nada. Siempre que una aplicación determinada tenga una ruta de código x86-64 con como máximo instrucciones SSE4.2, Rosetta2 y el nuevo macOS Big Sur se encargarán de todo en segundo plano, sin que usted note ninguna diferencia con una aplicación nativa más allá de su rendimiento. .

En realidad, el manejo transparente de las cosas por parte de Apple es quizás demasiado transparente, ya que actualmente no hay forma de saber si una aplicación en la App Store realmente es compatible con el nuevo Apple Silicon o no. Con suerte, esto es algo que veremos mejorado en futuras actualizaciones, sirviendo también como un incentivo para que los desarrolladores migren sus aplicaciones al código nativo. Por supuesto, ahora es posible para los desarrolladores apuntar a aplicaciones x86-64 y AArch64 a través de “binarios universales”, esencialmente solo variantes unidas de los respectivos binarios de arquitectura.

No tuvimos tiempo para investigar qué software funciona bien y qué no, estoy seguro de que otras publicaciones harán un trabajo mucho mejor y una variedad de cargas de trabajo, pero quería publicar algunos números más concretos como a cómo se escala el rendimiento en diferentes tiempos de cargas de trabajo mediante la ejecución de SPEC tanto en formato nativo como en formato binario x86-64 a través de Rosetta2:

En SPECint2006, hay una amplia gama de escalado de rendimiento en función de las cargas de trabajo, algunas funcionan bastante bien, mientras que otras no tanto.

Las cargas de trabajo que funcionan mejor con Rosetta2 principalmente parecen ser aquellas que tienen una huella de memoria más importante e interactúan más con la memoria, escalando el rendimiento incluso por encima del 90% en comparación con los binarios nativos AArch64.

Las cargas de trabajo que tienen el peor rendimiento son la ejecución y el cálculo de cargas de trabajo pesadas, con el peor escalado absoluto en la prueba 456.hmmer residente de L1, seguida de 464.h264ref.

En las cargas de trabajo de fp2006, las cosas van relativamente bien, excepto 470.lbm, que tiene un ciclo de instrucción ajustado.

En las pruebas int2017, lo que se destaca es el horrible rendimiento de 502.gcc_r, que solo muestra un rendimiento del 49,87% de la carga de trabajo nativa, probablemente debido a la alta complejidad del código y a los patrones de código poco comunes en general.

Finalmente, en fp2017, parece que nuevamente estamos promediando en la escala de rendimiento del 70-80%, según el código de la carga de trabajo.

En general, todos estos resultados deben considerarse sobresalientes solo dada la hazaña que Apple está logrando aquí en términos de tecnología de traducción de código. Este no es un emulador mediocre, sino una capa de compatibilidad completa que, cuando se combina con el rendimiento sobresaliente del Apple M1, permite un rendimiento muy real y utilizable del repertorio de aplicaciones de software existente en el ecosistema macOS existente de Apple.

Conclusión y primeras impresiones

La pieza de hoy fue menos una revisión sobre la nueva Mac mini, ya que estaba probando el nuevo chip M1 de Apple. Hemos tenido muy poco tiempo con el dispositivo, pero con suerte logramos mostrar los aspectos clave del nuevo chip, y es impresionante.

Durante años, hemos visto cómo la microarquitectura de CPU personalizada de Apple en los SoC de teléfonos de la serie A publica saltos de rendimiento impresionantes y repetidos generación tras generación, y los nuevos dispositivos Apple Silicon de hoy son esencialmente la culminación de la trayectoria inevitable en la que Apple ha estado.

En términos de potencia, el Apple M1 dentro del nuevo Mac mini llena un presupuesto térmico de alrededor de 20-24W desde el lado del SoC. Este sigue siendo claramente un diseño de bajo consumo de energía, y Apple lo aprovecha para implementarlo en máquinas como la Macbook Air, ahora sin ventilador. Todavía no hemos tenido la oportunidad de probar ese dispositivo, pero esperamos el mismo rendimiento máximo, aunque con una aceleración más fuerte una vez que el SoC satura la disipación de calor de ese diseño.

En el nuevo Macbook Pro, esperamos que el M1 muestre un rendimiento similar, si no idéntico, al que hemos visto en el nuevo Mac mini. Francamente, sospecho que Apple podría haber reducido el tamaño del Mini, aunque ahora no conocemos exactamente el diseño interno de la pieza, ya que no se nos permitió desmontarlo.

El rendimiento del nuevo M1 en este diseño de “máximo rendimiento” con un pequeño ventilador es extraordinariamente bueno. El M1 supera indiscutiblemente el rendimiento central de todo lo que Intel tiene para ofrecer, y lo lucha con el nuevo Zen3 de AMD, ganando algo y perdiendo algo. Y en el espacio móvil en particular, no parece haber un equivalente en el rendimiento de ST o MT, al menos dentro de los mismos presupuestos de energía.

Lo que es realmente importante para el público en general y el éxito de Apple es el hecho de que el rendimiento del M1 no se siente diferente al de si estuviera utilizando una CPU Intel o AMD de muy alta gama. Apple lograr esto internamente con su propio diseño es un cambio de paradigma, y ​​en el futuro les permitirá lograr un cierto nivel de integración vertical software-hardware que no se ha visto antes y que nadie más ha logrado. .

El lado del software ya se ve bien desde el primer día gracias a Rosetta2 de Apple. Si bien el software no ofrece lo mejor que puede ofrecer el hardware, con el tiempo, a medida que los desarrolladores migren sus aplicaciones al soporte nativo de Apple Silicon, el ecosistema florecerá. Y mientras tanto, el M1 es lo suficientemente rápido como para absorber el impacto de rendimiento de Rosetta2 y aún ofrecer un rendimiento sólido para todas las aplicaciones x86, excepto las más críticas para la CPU.

Para los desarrolladores, las Apple Silicon Macs también representan las primeras máquinas Arm completas en el mercado que tienen pocos o ningún compromiso. Este es un gran impulso no solo para Apple, sino también para el ecosistema Arm más grande y el creciente negocio de computación en la nube de Arm.

En general, Apple la sacó del parque con el M1.

Una respuesta a «El Mac Mini 2020 desatado: poniendo a prueba Apple Silicon M1»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *