Revisión de AMD Ryzen 3 3300X y 3100

Cuando AMD anunció los nuevos procesadores Ryzen 3 construidos en Zen 2, tenía la impresión de que se trataba esencialmente de las piezas rechazadas de la exitosa línea Ryzen 3000 de AMD. En el interior hay un solo chiplet con solo cuatro núcleos activos de ocho, empujando hasta 4.3 GHz; pero el truco fue el bajo precio de $ 120 por la versión de alta frecuencia, o $ 99 por un poco más lento. AMD ha vendido CPU de cuatro núcleos a $99 por un tiempo, pero este es el nuevo núcleo y el nuevo proceso de fabricación, entonces, ¿sería diferente? Los pusimos frente a un quad core de $350 de hace tres años. Parecía una idea loca en ese momento.

CPU AMD Ryzen 3000: los chiplets se vuelven convencionales

Después de los exitosos lanzamientos de las familias de hardware Zen 2 Ryzen 9, Ryzen 7 y Ryzen 5, AMD se ha mantenido bastante al norte de $ 200. En cada punto de precio, la compañía ofreció una opción convincente contra la competencia, como hemos señalado en nuestras revisiones de hardware como el 3950X , 3900X y 3700X . Otros, como el Ryzen 5 3600, son algunos de los más vendidos en la lista de Amazon. Como notamos en nuestra guía reciente de compradores de CPU , de los 10 primeros lugares en la lista de los más vendidos de Amazon para CPU, AMD tiene 8 de ellos, y los primeros 5.

Eso está muy bien para el extremo superior del mercado, sin embargo, en la categoría de menos de $ 200, aquí es donde suele estar el volumen. Intel ha estado descuidando este mercado en los últimos tiempos , debido a la demanda anormalmente alta de silicio Xeon que obliga a la fabricación a pasar más tiempo en hardware de 28 núcleos que en hardware de cuatro núcleos. Esto deja la puerta abierta para AMD, por lo que siempre iba a ser interesante lo que la compañía hizo aquí. Durante mucho tiempo, AMD no hizo nada, empujando a los usuarios a su hardware Ryzen 2000 o APU Ryzen 3000, principalmente porque se vendían muy bien (el Ryzen 2600/1600 AF ofrece 6 núcleos por tan solo $ 85).

Con el reciente lanzamiento de las últimas APU de la generación Ryzen Mobile de AMD , basadas en Zen 2 y Vega, no estábamos seguros de si AMD llenaría esta brecha de menos de $ 200 con versiones de escritorio de esas APU u ofrecería piezas Ryzen 5 3000 de menor capacidad. Después de un lanzamiento muy exitoso de Ryzen Mobile 4000, que condujo a algunas revisiones estelares , quedó claro que el silicio móvil estaba imponiendo una fuerte prima en el mercado, por lo que conseguimos que las CPU basadas en Matisse lleguen al segmento de menos de $ 200. Con eso, el día 21 Abril st , AMD anunció sus nuevos Ryzen 3 3300X y Ryzen 3 3100 procesadores .

Llenar el fondo con puntos de precio de $99 y $120 es muy agresivo. Aquí está el hardware Zen 2 de última generación de AMD, en un nodo de fabricación de alto rendimiento TSMC de 7 nm, incluido con un troquel IO de 14 nm de GlobalFoundries, empaquetado junto con frecuencias de hasta 4.3 GHz. En el momento del anuncio, notamos que AMD competirá mucho consigo mismo por el rendimiento y el precio. De repente, $85 Ryzen 5 1600AF solo parece apetitoso si desea seis núcleos Zen 1: cuatro núcleos Zen 2 a frecuencias más altas y IPC más altos por $99 en papel es probablemente la mejor opción.

Ambos procesadores admiten oficialmente DDR4-3200, y AMD reitera que DDR4-3600 / 3733 es un buen punto dulce para aquellos que compran memoria más rápida. Ambos chips también tienen 24 carriles PCIe 4.0 del conjunto de chips: 16 para PCIe, 4 para una unidad M.2 y 4 para el conjunto de chips. Para los conjuntos de chips X570, estos deberían ejecutarse en modo PCIe 4.0; para los conjuntos de chips B550 y otros, estos carriles de conjuntos de chips se ejecutarán en modo PCIe 3.0 (ver más abajo).

AMD nos probó tanto el Ryzen 3 3300X como el Ryzen 3 3100 para su revisión. Estos solo llegaron recientemente, por lo que todavía estamos en el proceso de comparar los chips en algunos puntos de referencia.

Elefante en la habitación: placas base B550

Uno de los puntos clave para una construcción más barata es a menudo una placa base más barata. AMD e Intel suministran al mercado conjuntos de chips de gama media y baja, que los fabricantes de placas base utilizan para construir algo más apetecible en el rango de $ 60 a $ 120. Técnicamente, AMD también está lanzando el chipset B550 hoy, ofreciendo PCIe 4.0 desde la CPU y PCIe 3.0 desde el chipset, sin embargo, las noticias sobre estas placas base han sido bastante escasas. No hemos recibido uno para probar con estos procesadores, lo que hace que una revisión de X570 + Ryzen 3 sea algo no real.

AMD nos ha proporcionado una lista completa de compatibilidad de la placa base para todos los procesadores AM4 alineados con todas las placas base AM4. Debido a limitaciones técnicas en cuanto al tamaño del BIOS (es decir, los proveedores de placas base que usan chips BIOS demasiado pequeños), solo se verifican varias familias de hardware en diferentes placas base. Es probable que la mayoría de las placas base acepten procesadores fuera de estas designaciones, especialmente si el proveedor ha usado un chip BIOS más grande, sin embargo, AMD está implementando estas pautas para que sea más fácil de seguir. Entonces, aunque AM4 se anuncia como una plataforma que puede admitir ‘A-Series to 16-cores’, y lo hace, pero solo en varias placas, muy pocas placas (si es que hay alguna) admitirán toda la gama de hardware.

En cuanto a B550, el chipset se parece mucho a B450 pero con algunas actualizaciones. En lugar de la compatibilidad con PCIe 2.0 del conjunto de chips, obtenemos PCIe 3.0, con un enlace ascendente PCIe 3.0 al procesador. Las placas base B550 también se diseñarán para admitir PCIe 4.0 desde la CPU, lo que significa que al menos la primera (y quizás la segunda) ranura PCIe estará habilitada para PCIe 4.0, y también debe haber una ranura M.2.

Estas son las placas base más baratas, por lo que no esperamos ningún milagro aquí. B550 está diseñado para admitir solo las CPU Matisse de la serie 3000, por lo que AMD sugiere que las APU actuales en el mercado (3200G / 3400G) no son realmente adecuadas para esta placa si funcionan.

AMD afirma que hay más de 60 placas base B550 en desarrollo. Algunos de ellos se ven muy llamativos, lo que me hace preguntarme si no habrá modelos B550 de $ 300 en los estantes. Ese es un pensamiento aterrador.

Una palabra sobre competencia

Con Intel permaneciendo en la microarquitectura Skylake para otra generación en Comet Lake, y la competitividad de Ryzen 3000 hasta ahora, estaba ansioso por ver si AMD es capaz de superar a Intel en el nivel de cuatro núcleos. Intel finalmente dejó de darnos núcleos cuádruples en el Core i7 superior después de Kaby Lake (Core de séptima generación), con el Core i7-7700 a 65 W y el i7-7700K a 91 W. Estas fueron $ 350 partes en 2017, ofreciendo una frecuencia base de 4.2 GHz y turbo de 4.5 GHz para el 7700K. Esa es una ventaja de frecuencia sobre el 3300X, pero el 3300X tiene un mejor IPC.

• AMD Ryzen 3 3300X: Zen 2, 4C / 8T, 3.9-4.3 GHz, 65 W, DDR4-3200, 24x PCIe 4.0, $ 120
• Intel Core i7-7700K: Kaby Lake, 4C / 8T, 4.2-4.5 GHz, 91 W, DDR4-2400, 16x PCIe 3.0, $ 350

¿Puede la CPU de $ 120 de AMD en 2020 tener el mismo rendimiento que la CPU insignia de Intel 2017 a solo un tercio del costo?

Suena loco, ¿no?

Hay una diferencia entre el 3300X y el 3100

Sin profundizar más, uno podría suponer que hay poco para separar el Ryzen 3 3300X y el Ryzen 3 3100, aparte de unos pocos cientos de MHz y algunos costos. Para nuestra sorpresa, es más profundo que eso. Debido a cualquier binning existente, AMD está utilizando dos configuraciones de núcleo diferentes para estos chips, a pesar de que ambos son de cuatro núcleos.

Ambos procesadores Ryzen 3 tienen un solo chiplet de ocho núcleos, del cual solo cuatro núcleos están activos.

En el Ryzen 3 3300X, todos esos cuatro núcleos provienen del mismo CCX de cuatro núcleos, lo que proporciona una plataforma de latencia unificada. Viene en una configuración ‘4 + 0’, con un CCX completamente activo y el otro deshabilitado.

En el Ryzen 3 3100, los cuatro núcleos provienen de dos CCX diferentes, lo que agrega complejidad adicional a la estructura de latencia. Si un núcleo en un CCX quiere comunicarse con el otro CCX, tiene que enviar una solicitud a través de Infinity Fabric, lo que agrega latencia. Esto se llama la configuración ‘2 + 2’.

Ambos diseños están construidos con 16 MB de caché L3, y con el 3300X que está todo en un CCX, pero dividido para el 3100.

La penalización de rendimiento que esto conlleva es difícil de predecir. Debido al menor conteo de núcleos que el otro hardware Ryzen, el efecto de esta división en el Ryzen 3 3100 será más pronunciado que otros. Por nuestra parte, realizamos nuestras pruebas de latencia de núcleo a núcleo.

Para el Ryzen 3 3300X, como puede ver, tenemos una topología de latencia unificada.

Mientras que para el Ryzen 3 3100, ya que es más lento y tiene un diseño CCX dual, esto se traduce en una adición de más de 5 nanosegundos para ir dentro de un CCX, pero en más de 50 nanosegundos entre CCX. Aparte de la diferencia de frecuencia, este será un factor determinante en nuestra revisión.

Para completar, aquí está el Core i7-7700K, que es casi un 33% más rápido en transferencias de núcleo a núcleo contra núcleo a núcleo dentro de un CCX.

Consumo de energía y rampas de frecuencia

En el cuadro, ambos procesadores se enumeran con 65 W TDP. Con su hardware basado en Zen, AMD ha sido relativamente bueno para mantenerse cerca de ese valor oficial en la caja, incluso durante el turbo. En la última generación, AMD introdujo una característica llamada PPT, o Package Power Tracking.

1 Para procesadores de 105 W, PPT es> 142 W
2 Para procesadores de 65 W, PPT es> 88 W
3 Para procesadores de 45 W, PPT es> 60W

Esto permite que el procesador aumente sus límites de potencia, suponiendo que no está violando los límites térmicos o los límites de corriente y, en consecuencia, aumenta la frecuencia. Como resultado, mientras vemos 65 W en la caja, es probable que el consumo de energía del mundo real durante la mayoría de las tareas esté más cerca de 88 W, a menos que se crucen las líneas actuales o térmicas.

Como un nuevo elemento para nuestras pruebas, estamos registrando la potencia en una serie de puntos de referencia en nuestra suite, en lugar de simplemente una simple prueba de potencia máxima.

AMD Ryzen 3 3300X

Para el chip más rápido, vimos una potencia máxima en nuestras dos pruebas de alrededor de 80 W.

Con yCruncher, que es algo así como una carga periódica, el consumo de energía se redujo con el tiempo a cerca de 75 W.

3DPM es más obvio con sus pasos inactivos entre cargas, siendo 10 segundos y luego 10 segundos de espera. El poder casi alcanzó su punto máximo aquí.

En ambos gráficos, la potencia del paquete cuando está inactivo es de alrededor de 16-17 W. Revisé los datos y noté que, de esta potencia, solo 0,3 W se dedicaron realmente a los núcleos, y el resto se dirigió hacia el gran dado de E / S. , los controladores de memoria y el Infinity Fabric. Eso sigue siendo bastante sustancial para una carga inactiva.

A bajas cargas, la potencia por núcleo era de alrededor de 14 W, mientras que a plena carga era ligeramente menor dependiendo de la prueba. Esto está un poco alejado de los 20 W por núcleo que obtenemos de los procesadores Zen 2 de gama alta, pero estos solo van a 4.3 GHz, no a 4.7 GHz +. Esto está en línea con lo que esperamos.

En nuestra prueba de rampa de frecuencia, el Ryzen 3300X pasó de un estado inactivo a una potencia máxima en 17 milisegundos, o aproximadamente un cuadro a 60 Hz.

Una de las nuevas características con Ryzen 3000 es la compatibilidad con CPPC2, que AMD afirma que reduce la rampa de inactividad a turbo de 30 milisegundos a 2 milisegundos. Estamos viendo algo en el medio de eso, a pesar de tener todas las actualizaciones aplicadas. Dicho esto, el salto hasta la frecuencia máxima (medimos 4350 MHz, +50 MHz sobre el turbo en la caja) es efectivamente inmediato con un sesgo cero en un rango de frecuencias.

AMD Ryzen 3 3100

Dado que el número TDP en el costado de la caja también dice 65 W, cualquier usuario razonable supondría que la potencia de este chip sería igual, ¿verdad? Los lectores habituales sabrán que este no es siempre el caso.

En nuestra prueba yCruncher, debido a que la frecuencia del turbo es menor que el 3300X, significa que el voltaje puede ser menor y, por lo tanto, la potencia es menor. Nuestra historia de pruebas de Zen 2 ha demostrado que estos núcleos se vuelven muy eficientes a frecuencias más bajas, hasta el punto en que nuestro procesador ni siquiera rompe ese umbral de 65 W durante yCruncher.

Del mismo modo, los picos de 3DPM también son más bajos, apenas llegan a 55 W durante una carga de trabajo AVX2.

En el lado de la rampa de frecuencia, vemos otra instancia de una transición de 16-17 ms.

Resumen

Para la potencia máxima de todas nuestras pruebas, vimos que el Ryzen 3 3300X alcanzó un máximo de 80 W, y el Ryzen 3 3100 llegó a 62 W. Cuando lo comparamos con el Core i7-7700K, a 91 W TDP / El pico de 95 W, combinado con la mayoría de los resultados en las próximas páginas, AMD en comparación es más eficiente.

Banco de prueba y configuración

Según nuestra política de prueba de procesador, tomamos una placa base de categoría premium adecuada para el zócalo y equipamos el sistema con una cantidad adecuada de memoria que se ejecuta a la frecuencia máxima admitida por el fabricante. Esto también se ejecuta típicamente en subtemporaciones JEDEC cuando sea posible. Se observa que algunos usuarios no están interesados ​​en esta política, afirmando que a veces la frecuencia máxima admitida es bastante baja, o que hay disponible una memoria más rápida a un precio similar, o que las velocidades JEDEC pueden ser prohibitivas para el rendimiento. Si bien estos comentarios tienen sentido, en última instancia, muy pocos usuarios aplican perfiles de memoria (ya sea XMP u otros) ya que requieren interacción con el BIOS,y la mayoría de los usuarios recurrirán a las velocidades compatibles con JEDEC; esto incluye a los usuarios domésticos y a la industria que quieran ahorrar un centavo o dos del costo o mantenerse dentro de los márgenes establecidos por el fabricante. Siempre que sea posible, ampliaremos las pruebas para incluir módulos de memoria más rápidos al mismo tiempo que la revisión o en una fecha posterior.

Configuración de prueba
CPU: AMD Ryzen 3 3300X, AMD Ryzen 3 3100
Tarjeta madre: GIGABYTE X570 I Aorus Pro (1.12e)
Enfriador de CPU: AMD Wraith
DRAM: G.Skill FlareX 2×8 GB DDR4-3200 C14
GPU: Sapphire RX 460 2GB (Pruebas de CPU), MSI GTX 1080 Gaming 8G (Pruebas de juegos)
PSU: Corsair AX860i
SSD: Crucial MX500 2TB
OS: Windows 10 1909

Rendimiento de la CPU: ¡nuevas pruebas!

Como parte de nuestra marcha continua hacia una mejor visión completa del rendimiento de estos procesadores, tenemos algunas pruebas nuevas para usted que hemos estado cocinando en el laboratorio. Algunos de estos nuevos puntos de referencia proporcionan puntos de conversación obvios, otros son solo un poco divertidos. La mayoría de ellos son tan nuevos que hasta ahora solo los hemos ejecutado en algunos procesadores. ¡Será interesante escuchar sus comentarios!

NAMD ApoA1

A lo largo de los años, una solicitud frecuente ha sido alguna forma de simulación de dinámica molecular. La dinámica molecular forma la base de una gran cantidad de biología y química computacionales al modelar moléculas específicas, lo que permite a los investigadores encontrar configuraciones de baja energía o posibles sitios de unión activa, especialmente cuando se observan proteínas más grandes. Estamos usando el software NAMD aquí, o la dinámica molecular a nanoescala, a menudo citada por su eficiencia paralela. Desafortunadamente, la versión que estamos usando está limitada a 64 hilos en Windows, pero aún podemos usarla para analizar nuestros procesadores. Estamos simulando la proteína ApoA1 durante 10 minutos e informando los ‘nanosegundos por día’ que nuestro procesador puede simular. La dinámica molecular es tan compleja que sí, puede pasar un día simplemente calculando un nanosegundo de movimiento molecular.

Procesador de CPU Crysis

Uno de los memes más utilizados en los juegos de computadora es ‘Can It Run Crysis?’. El juego original de 2007, construido en el motor Cryengine de Crytek, fue anunciado como un título computacionalmente complejo para el hardware en ese momento y varios años después, lo que sugiere que un usuario necesitaba hardware de gráficos del futuro para ejecutarlo. Avance rápido durante una década, y el juego se ejecuta con bastante facilidad en las GPU modernas, pero también podemos aplicar el mismo concepto al procesamiento puro de la CPU: ¿puede la CPU renderizar Crysis? Desde que 64 procesadores principales ingresaron al mercado, uno puede soñar. Creamos un punto de referencia para ver si el hardware puede.

Para esta prueba, estamos ejecutando el propio benchmark de GPU de Crysis, pero en modo de procesamiento de CPU. Esta es una prueba de 2000 cuadros, que ejecutamos en Alta Calidad y una serie de resoluciones desde 800×600 hasta 1920×1080.

Fortaleza enana

Otra solicitud de larga data para nuestra suite de referencia ha sido Dwarf Fortress, un popular videojuego independiente de gestión / roguelike, lanzado por primera vez en 2006. Emulando las interfaces ASCII de antaño, este título es una bestia bastante compleja, que puede generar entornos sujetos a milenios de gobierno, rostros famosos, campesinos y personajes y acontecimientos históricos clave. Cuanto más te adentres en el juego, dependiendo del tamaño del mundo, más lento se vuelve.

DFMark es un punto de referencia creado por vorsgren en Bay12Forums que ofrece dos modos diferentes creados en DFHack: generación mundial y embarque. Estas pruebas se pueden configurar, pero varían entre 3 minutos y varias horas. Apenas he arañado la superficie aquí, pero después de analizar la prueba, terminamos con tres tamaños de generación mundial diferentes.

Curiosamente, al hardware de Intel le gusta Dwarf Fortress.

También tenemos otros puntos de referencia, como AI Benchmark (ETH), LINPACK y V-Ray, sin embargo, todavía requieren un poco de ajustes para que funcione.

Rendimiento de la CPU: pruebas del sistema

Nuestra sección de Prueba del sistema se enfoca significativamente en las pruebas del mundo real, la experiencia del usuario, con un ligero guiño al rendimiento. En esta sección cubrimos el tiempo de carga de la aplicación, el procesamiento de imágenes, la física científica simple, la emulación, la simulación neural, la computación optimizada y el desarrollo de modelos 3D, con una combinación de software disponible y personalizado. Para algunas de estas pruebas, las suites más grandes, como PCMark, las cubren (publicamos esos valores en la sección de nuestra oficina), aunque las perspectivas múltiples siempre son beneficiosas. En todas nuestras pruebas, explicaremos en profundidad qué se está probando y cómo lo estamos probando.

Carga de la aplicación: GIMP 2.10.4

Uno de los aspectos más importantes sobre la experiencia del usuario y el flujo de trabajo es qué tan rápido responde un sistema. Una buena prueba de esto es ver cuánto tiempo lleva cargar una aplicación. La mayoría de las aplicaciones en estos días, cuando están en un SSD, se cargan de manera bastante instantánea, sin embargo, algunas herramientas de oficina requieren la precarga de activos antes de estar disponibles. La mayoría de los sistemas operativos también emplean el almacenamiento en caché, por lo que cuando cierto software se carga repetidamente (navegador web, herramientas de oficina), se puede inicializar mucho más rápido.

En nuestra última suite, probamos cuánto tiempo llevó cargar un PDF grande en Adobe Acrobat. Desafortunadamente, esta prueba fue una pesadilla para programar y no se transfirió fácilmente a Win10 RS3. Mientras tanto, descubrimos una aplicación que puede automatizar esta prueba, y la comparamos con GIMP, una popular herramienta gratuita de edición de fotos en línea de código abierto y la principal alternativa a Adobe Photoshop. Lo configuramos para cargar una plantilla de diseño grande de 50 MB y realizar la carga 10 veces con 10 segundos entre cada una. Debido al almacenamiento en caché, los primeros 3-5 resultados suelen ser más lentos que el resto, y el tiempo de almacenamiento en caché puede ser inconsistente, tomamos el promedio de los últimos cinco resultados para mostrar el procesamiento de la CPU en la carga en caché.

Movimiento de partículas 3D v2.1: movimiento browniano

Nuestra prueba 3DPM es un punto de referencia personalizado diseñado para simular seis algoritmos diferentes de movimiento de partículas de puntos en un espacio 3D. Los algoritmos se desarrollaron como parte de mi doctorado y, si bien finalmente funcionan mejor en una GPU, proporcionan una buena idea sobre cómo las secuencias de instrucciones son interpretadas por diferentes microarquitecturas.

Una parte clave de los algoritmos es la generación de números aleatorios: utilizamos una generación relativamente rápida que termina implementando cadenas de dependencia en el código. La actualización sobre la primera versión ingenua de este código se resolvió por el intercambio falso en las cachés, un importante cuello de botella. También estamos mirando las versiones AVX2 y AVX512 de este punto de referencia para futuras revisiones.

Para esta prueba, ejecutamos un conjunto de partículas en stock sobre los seis algoritmos durante 20 segundos cada uno, con pausas de 10 segundos, e informamos la tasa total de movimiento de partículas, en millones de operaciones (movimientos) por segundo. Tenemos una versión que no es AVX y una versión AVX, y esta última implementa AVX512 y AVX2 siempre que sea posible.

Dolphin 5.0: emulación de consola

Una de las pruebas solicitadas populares en nuestra suite tiene que ver con la emulación de consola. Ser capaz de recoger un juego de un sistema anterior y ejecutarlo como se espera depende de la sobrecarga del emulador: se necesita un sistema x86 significativamente más potente para poder emular con precisión una consola anterior que no sea x86, especialmente si el código para eso La consola se hizo para abusar de ciertos errores físicos en el hardware.

Para nuestra prueba, usamos el popular software de emulación Dolphin y ejecutamos un proyecto de cómputo para determinar qué tan cerca de un sistema de consola estándar pueden emular nuestros procesadores. En esta prueba, una Nintendo Wii tomaría alrededor de 1050 segundos.

DigiCortex 1.20: Simulación del cerebro de Sea Slug

Este punto de referencia se diseñó originalmente para la simulación y visualización de la actividad neuronal y de sinapsis, como se encuentra comúnmente en el cerebro. El software viene con una variedad de modos de referencia, y tomamos la pequeña referencia que ejecuta una simulación de sinapsis de neurona 32K / 1.8B, equivalente a un Sea Slug.

Informamos los resultados como la capacidad de simular los datos como una fracción del tiempo real, por lo que cualquier cosa por encima de ‘uno’ es adecuada para el trabajo en tiempo real. De los dos modos, un modo ‘sin disparo’ que es DRAM pesado y un modo ‘disparo’ que tiene trabajo de CPU, elegimos el último. A pesar de esto, el punto de referencia todavía se ve afectado por la velocidad de DRAM en gran medida.

y-Cruncher v0.7.6: Computación optimizada para microarquitectura

Hace tiempo que conozco y-Cruncher, como herramienta para ayudar a calcular varias constantes matemáticas, pero no fue hasta que comencé a hablar con su desarrollador, Alex Yee, investigador de NWU y ahora desarrollador de optimización de software, que se dio cuenta de que había optimizado el software como loco para obtener el mejor rendimiento. ¡Naturalmente, cualquier simulación que pueda llevar más de 20 días puede beneficiarse de un aumento del rendimiento del 1%! Alex comenzó y-cruncher como un proyecto de escuela secundaria, pero ahora está en un estado en el que Alex lo mantiene actualizado para aprovechar los últimos conjuntos de instrucciones antes de que estén disponibles en hardware.

Para nuestra prueba, ejecutamos y-cruncher v0.7.6 a través de todas las diferentes variantes optimizadas del binario, de un solo hilo y de múltiples hilos, incluidos los binarios optimizados AVX-512. La prueba consiste en calcular 250m de dígitos de Pi, y utilizamos las versiones de subprocesamiento único y multiproceso.

Agisoft Photoscan 1.3.3: Conversión de imagen 2D a modelo 3D

Uno de los ISV con los que hemos trabajado durante varios años es Agisoft, que desarrolla un software llamado PhotoScan que transforma varias imágenes 2D en un modelo 3D. Esta es una herramienta importante en el desarrollo y archivo de modelos, y se basa en una serie de algoritmos de subprocesos múltiples y múltiples subprocesos para ir de un lado del cálculo al otro.

En nuestra prueba, tomamos v1.3.3 del software con un conjunto de datos de buen tamaño de fotos de 84 x 18 megapíxeles y lo empujamos a través de una variante razonablemente rápida de los algoritmos, pero aún es más estricto que nuestra prueba de 2017. Informamos el tiempo total para completar el proceso.

Rendimiento de la CPU: pruebas de renderizado

La representación suele ser un objetivo clave para las cargas de trabajo del procesador, que se presta a un entorno profesional. También viene en diferentes formatos, desde renderizado 3D hasta rasterización, como juegos o por trazado de rayos, e invoca la capacidad del software para gestionar mallas, texturas, colisiones, alias, física (en animaciones) y descartar trabajos innecesarios. . La mayoría de los procesadores ofrecen rutas de código de CPU, mientras que algunos usan GPU y entornos selectos usan FPGA o ASIC dedicados. Sin embargo, para grandes estudios, las CPU siguen siendo el hardware elegido.

Todos nuestros resultados de referencia también se pueden encontrar en nuestro motor de referencia, Bench .

Corona 1.3

Un procesador avanzado basado en rendimiento para software como 3ds Max y Cinema 4D, el punto de referencia Corona representa una escena generada como estándar en su versión de software 1.3. Normalmente, la implementación de la GUI del punto de referencia muestra la escena que se está construyendo y permite al usuario cargar el resultado como un “momento para completar”.

Nos pusimos en contacto con el desarrollador que nos dio una versión de línea de comando del punto de referencia que hace una salida directa de resultados. En lugar de informar el tiempo, informamos el número promedio de rayos por segundo en seis carreras, ya que la escala de rendimiento de un resultado por unidad de tiempo es generalmente visualmente más fácil de entender.

LuxMark v3.1: LuxRender a través de diferentes rutas de código

Como se indicó en la parte superior, hay muchas formas diferentes de procesar los datos de representación: CPU, GPU, Acelerador y otros. Además de eso, hay muchos marcos y API en los que programar, dependiendo de cómo se utilizará el software. LuxMark, un punto de referencia desarrollado utilizando el motor LuxRender, ofrece varias escenas y API diferentes.

En nuestra prueba, ejecutamos la simple escena ‘Ball’ en las rutas de código C ++ y OpenCL, pero en modo CPU. Esta escena comienza con un renderizado aproximado y mejora lentamente la calidad durante dos minutos, dando un resultado final en lo que esencialmente es un promedio de ‘kilorays por segundo’.

POV-Ray 3.7.1: Trazado de rayos

El motor de trazado de rayos Persistence of Vision es otra herramienta de evaluación comparativa bien conocida, que estuvo en un estado de hibernación relativa hasta que AMD lanzó sus procesadores Zen, a los que de repente Intel y AMD enviaron código a la rama principal del proyecto de código abierto. Para nuestra prueba, utilizamos el punto de referencia incorporado para todos los núcleos, llamado desde la línea de comandos.

Rendimiento de la CPU: pruebas de codificación

Con el aumento de la transmisión, vlogs y contenido de video en su conjunto, las pruebas de codificación y transcodificación son cada vez más importantes. No solo hay más usuarios domésticos y jugadores que necesitan convertir archivos de video en algo más manejable, con fines de transmisión o archivo, sino que los servidores que administran la salida también manejan alrededor de datos y archivos de registro con compresión y descompresión. Nuestras tareas de codificación se centran en estos escenarios importantes, con aportes de la comunidad para la mejor implementación de las pruebas del mundo real.

Handbrake 1.1.0: Streaming y transcodificación de video de archivo

Una herramienta de código abierto popular, Handbrake es el software de conversión de video de cualquier cosa a cualquier cosa que varias personas usan como punto de referencia. El peligro siempre está en los números de versión y la optimización, por ejemplo, las últimas versiones del software pueden aprovechar AVX-512 y OpenCL para acelerar ciertos tipos de transcodificación y algoritmos. La versión que usamos aquí es un juego puro de CPU, con variaciones comunes de transcodificación.

Hemos dividido Handbrake en varias pruebas, utilizando una grabación de cámara web nativa Logitech C920 1080p60 (esencialmente una grabación por secuencias), y las convertimos en dos tipos de formatos de transmisión y uno para el archivo. Las configuraciones de salida utilizadas son:

7-zip v1805: motor de compresion de código abierto

Fuera de nuestras pruebas de herramientas de compresión / descompresión, 7-zip es la más solicitada y viene con un punto de referencia incorporado. Para nuestro conjunto de pruebas, hemos extraído la última versión del software y ejecutamos el punto de referencia desde la línea de comandos, informando la compresión, descompresión y una puntuación combinada.

En este punto de referencia, se observa que los últimos procesadores de troquel múltiple tienen un rendimiento muy bimodal entre la compresión y la descompresión, funcionan bien en uno y mal en el otro. También hay discusiones sobre cómo el Programador de Windows está implementando cada hilo. A medida que obtengamos más resultados, será interesante ver cómo se desarrolla esto.

WinRAR 5.60b3: herramienta de archivo

Mi herramienta de compresión preferida es a menudo WinRAR, ya que fue una de las primeras herramientas que varios de mi generación utilizaron hace más de dos décadas. La interfaz no ha cambiado mucho, aunque la integración con los comandos de clic derecho de Windows siempre es una ventaja. No tiene una prueba incorporada, por lo que ejecutamos una compresión sobre un directorio establecido que contiene más de treinta archivos de video de 60 segundos y 2000 pequeños archivos basados ​​en la web a una velocidad de compresión normal.

WinRAR es de subproceso variable pero también susceptible de almacenamiento en caché, por lo que en nuestra prueba lo ejecutamos 10 veces y tomamos el promedio de los últimos cinco, dejando la prueba únicamente para el rendimiento de cómputo de CPU sin procesar.

Cifrado AES: seguridad de archivos

Varias plataformas, particularmente dispositivos móviles, ahora ofrecen encriptación por defecto con sistemas de archivos para proteger los contenidos. Los dispositivos basados ​​en Windows también tienen estas opciones, a menudo aplicadas por BitLocker o software de terceros. En nuestra prueba de cifrado AES, utilizamos el TrueCrypt descontinuado para su punto de referencia incorporado, que prueba varios algoritmos de cifrado directamente en la memoria.

Los datos que tomamos para esta prueba son el rendimiento combinado de cifrado / descifrado AES, medido en gigabytes por segundo. El software utiliza comandos AES para procesadores que ofrecen selección de hardware, sin embargo, no AVX-512.

Rendimiento de la CPU: pruebas web y heredadas

Si bien se centra más en los sistemas de factor de forma pequeño y de gama baja, los puntos de referencia basados ​​en la web son notoriamente difíciles de estandarizar. Los navegadores web modernos se actualizan con frecuencia, sin ningún recurso para deshabilitar esas actualizaciones, y como tal, es difícil mantener una plataforma común. La naturaleza acelerada del desarrollo del navegador significa que los números de versión (y el rendimiento) pueden cambiar de una semana a otra. A pesar de esto, las pruebas web a menudo son una buena medida de la experiencia del usuario: gran parte de lo que la mayoría del trabajo de oficina es en la actualidad gira en torno a aplicaciones web, particularmente aplicaciones de correo electrónico y de oficina, pero también interfaces y entornos de desarrollo. Nuestras pruebas web incluyen algunas de las pruebas estándar de la industria, así como algunas pruebas populares pero antiguas.

También hemos incluido nuestros puntos de referencia heredados en esta sección, que representan una pila de código antiguo para puntos de referencia populares.

Speedometer 2: JavaScript

Nuestra prueba web más reciente es el Velocímetro 2, que es una prueba acumulada sobre una serie de marcos JavaScript para hacer tres cosas simples: crear una lista, habilitar cada elemento de la lista y eliminar la lista. Todos los marcos implementan las mismas señales visuales, pero obviamente las aplican desde diferentes ángulos de codificación.

Nuestra prueba revisa la lista de marcos y produce un puntaje final indicativo de ‘rpm’, una de las métricas internas de referencia. Reportamos este puntaje final.

Google Octane 2.0: Computación web central

Una prueba web popular durante varios años, pero que ya no se actualiza, es Octane, desarrollada por Google. La versión 2.0 de la prueba realiza la mejor parte de dos docenas de tareas relacionadas con el cómputo, como expresiones regulares, criptografía, trazado de rayos, emulación y cálculos físicos de Navier-Stokes.

La prueba otorga a cada subprueba una puntuación y produce una media geométrica del conjunto como resultado final. Ejecutamos el punto de referencia completo cuatro veces y promediamos los resultados finales.

Mozilla Kraken 1.1: Computación web central

Incluso más viejo que Octane es Kraken, esta vez desarrollado por Mozilla. Esta es una prueba anterior que realiza una mecánica computacional similar, como el procesamiento de audio o el filtrado de imágenes. Kraken parece producir un resultado muy variable dependiendo de la versión del navegador, ya que es una prueba que está muy optimizada.

El punto de referencia principal se ejecuta en cada una de las subpruebas diez veces y produce un tiempo promedio de finalización para cada ciclo, dado en milisegundos. Ejecutamos el punto de referencia completo cuatro veces y tomamos un promedio del tiempo empleado.

3DPM v1: Variante de código ingenuo de 3DPM v2.1

La primera prueba heredada en la suite es la primera versión de nuestro punto de referencia 3DPM. Esta es la última versión ingenua del código, como si fuera escrito por un científico sin conocimiento de cómo funciona el hardware, los compiladores o la optimización de la computadora (que de hecho, fue al principio). Esto representa un gran cuerpo de simulación científica en la naturaleza, donde obtener la respuesta es más importante que ser rápido (obtener un resultado en 4 días es aceptable si es correcto, en lugar de enviar a alguien por un año para aprender a codificar y obteniendo el resultado en 5 minutos).

En esta versión, la única optimización real estaba en los indicadores del compilador (-O2, -fp: rápido), compilándolo en modo de lanzamiento y habilitando OpenMP en los bucles de cómputo principales. Los bucles no se configuraron para el tamaño de la función, y una de las ralentizaciones de las teclas es el intercambio falso en el caché. También tiene largas cadenas de dependencia basadas en la generación de números aleatorios, lo que conduce a un rendimiento relativamente pobre en microarquitecturas informáticas específicas.

x264 HD 3.0: Prueba de transcodificación anterior

Esta prueba de transcodificación es muy antigua y fue utilizada por Anand en el día de los procesadores Pentium 4 y Athlon II. Aquí, un video estandarizado de 720p se transcodifica con una conversión de dos pasos, con el punto de referencia que muestra los cuadros por segundo de cada paso. Este punto de referencia es de un solo subproceso, y entre algunas microarquitecturas parece que realmente llegamos a un muro de instrucciones por reloj.

GeekBench4: sintéticos

Una herramienta común para las pruebas multiplataforma entre dispositivos móviles, PC y Mac, GeekBench 4 es un ejercicio definitivo en pruebas sintéticas en una variedad de algoritmos que buscan un rendimiento máximo. Las pruebas incluyen cifrado, compresión, transformación rápida de Fourier, operaciones de memoria, física de n-cuerpos, operaciones matriciales, manipulación de histogramas y análisis HTML.

Incluyo esta prueba debido a la demanda popular, aunque los resultados parecen ser demasiado sintéticos, y muchos usuarios a menudo ponen mucho peso detrás de la prueba debido al hecho de que se compila en diferentes plataformas (aunque con diferentes compiladores).

Registramos los puntajes principales de la subprueba (Cripto, Entero, Punto flotante, Memoria) en nuestra base de datos de referencia, pero para la revisión publicamos los resultados generales de subprocesos múltiples y múltiples.

Videojuegos

* Actualmente estamos en el medio de revisar nuestros puntos de referencia de juegos de CPU, pero la nueva suite no estaba lista a tiempo para esta revisión. Planeamos agregar algunos juegos nuevos (Borderland 3, Gears Tactics) y también actualizar nuestra GPU para juegos a una RTX 2080 Ti.

Juegos: World of Tanks enCore

Aunque es diferente a la mayoría de los otros juegos MMO o multijugador masivo en línea, World of Tanks se desarrolla a mediados del siglo XX y permite a los jugadores tomar el control de una variedad de vehículos blindados militares. World of Tanks (WoT) es desarrollado y publicado por Wargaming con sede en Bielorrusia, y la banda sonora del juego está compuesta principalmente por el compositor bielorruso Sergey Khmelevsky. El juego ofrece múltiples puntos de entrada, incluido un elemento gratuito, así como también permite a los jugadores pagar una tarifa para abrir más funciones. Una de las cosas más interesantes de este MMO basado en tanques es que alcanzó el estado de eSports cuando debutó en los World Cyber ​​Games en 2012.

World of Tanks enCore es una aplicación de demostración para un motor gráfico nuevo e inédito escrito por el equipo de desarrollo de Wargaming. Con el tiempo, el nuevo motor central se implementará en el juego completo mejorando las imágenes del juego con elementos clave como agua mejorada, flora, sombras, iluminación y otros objetos como edificios. La aplicación de demostración de World of Tanks enCore no solo ofrece información sobre los inminentes cambios en el motor del juego, sino que permite a los usuarios verificar el rendimiento del sistema para ver si el nuevo motor funciona de manera óptima en su sistema.

Juegos: Final Fantasy XV

Al llegar a PC anteriormente, Final Fantasy XV: Windows Edition recibió una revisión gráfica a medida que fue trasladado desde la consola, fruto de su exitosa asociación con NVIDIA, sin apenas indicios de los problemas durante la producción y desarrollo original de Final Fantasy XV.

En preparación para el lanzamiento, Square Enix optó por lanzar un punto de referencia independiente que han actualizado desde entonces. El uso del punto de referencia independiente de Final Fantasy XV nos brinda una secuencia estandarizada larga para grabar, aunque debe tenerse en cuenta que su uso intensivo de la tecnología NVIDIA significa que la configuración Máxima tiene problemas: muestra elementos fuera de la pantalla. Para evitar esto, usamos el preajuste estándar que no tiene estos problemas.

Square Enix ha parcheado el punto de referencia con ajustes gráficos personalizados y correcciones de errores para ser mucho más preciso en el perfil del rendimiento en el juego y las opciones gráficas. Para nuestras pruebas, ejecutamos el punto de referencia estándar con una superposición de FRAP, tomando una grabación de 6 minutos de la prueba.

Juegos: Ashes Classic (DX12)

Visto como el niño sagrado de DirectX12, Ashes of the Singularity (AoTS, o simplemente Ashes) ha sido el primer título en explorar activamente tantas funciones de DirectX12 como sea posible. Stardock, el desarrollador detrás del motor Nitrous que impulsa el juego, se ha asegurado de que el título de la estrategia en tiempo real aproveche múltiples núcleos y múltiples tarjetas gráficas, en tantas configuraciones como sea posible.

Como título de estrategia en tiempo real, Ashes tiene que ver con la capacidad de respuesta durante los dos tiros abiertos, pero también en las batallas concentradas. Con DirectX12 a la cabeza, la capacidad de implementar más llamadas de sorteo por segundo permite que el motor trabaje con una profundidad de unidad sustancial y efectos que otros títulos de RTS tuvieron que depender de llamadas de sorteo combinadas para lograr, haciendo que algunas estructuras de unidades combinadas finalmente sean muy rígidas.

Stardock comprende claramente la importancia de un punto de referencia en el juego, asegurando que dicha herramienta esté disponible y sea capaz desde el primer día, especialmente con todas las características adicionales de DX12 utilizadas y poder caracterizar cómo afectaron el título para el desarrollador fue importante. El punto de referencia en el juego realiza un entorno de batalla de semillas fijo de cuatro minutos con una variedad de disparos, y genera una gran cantidad de datos para analizar.

Para nuestro punto de referencia, ejecutamos Ashes Classic: una versión anterior del juego antes de la actualización de Escalation. La razón de esto es que es más fácil de automatizar, sin una pantalla de presentación, pero aún tiene una fuerte fidelidad visual para probar.

Ashes tiene opciones desplegables para MSAA, Calidad de luz, Calidad de objeto, Muestras de sombreado, Calidad de sombra, Texturas y opciones separadas para el terreno. Hay varios regalos, desde muy bajo hasta extremo: ejecutamos nuestros puntos de referencia en la configuración anterior y tomamos la salida de tiempo de cuadro para nuestros números promedio y percentiles.

Gaming: Strange Brigade (DX12, Vulkan)

Strange Brigade se basa en el Egipto de 1903 y sigue una historia que es muy similar a la de la franquicia de películas Mummy. Este juego de disparos en tercera persona en particular está desarrollado por Rebellion Developments, que es más conocido por juegos como las series Sniper Elite y Alien vs Predator. El juego sigue la búsqueda de Seteki, la Reina Bruja, que ha surgido una vez más y la única ‘tropa’ que finalmente puede detenerla. La jugabilidad está centrada en la cooperación con una amplia variedad de niveles diferentes y muchos acertijos que los agentes del Servicio Secreto colonial británico deben resolver para poner fin a su reinado de brutalidad y brutalidad.

El juego es compatible con las API DirectX 12 y Vulkan y alberga su propio punto de referencia incorporado que ofrece varias opciones de personalización que incluyen texturas, suavizado, reflejos, distancia de dibujo e incluso permite a los usuarios habilitar o deshabilitar el desenfoque de movimiento, la oclusión ambiental y teselación entre otros. AMD se jactó anteriormente de que Strange Brigade es parte de su implementación de API Vulkan que ofrece escalabilidad para configuraciones de tarjetas de gráficos múltiples de AMD.

Juegos: Far Cry 5

El último título de la serie Far Cry de Ubisoft nos lleva directamente a los brazos inoportunos de un culto militante armado en Montana, uno de los muchos medios de la nada en los Estados Unidos. Con un adversario carismático y enigmático, hermosos paisajes del sabor del noroeste de los Estados Unidos y mucha violencia, es el clásico de Far Cry. Gráficamente intensivo en un entorno de mundo abierto, el juego se mezcla en acción y exploración.

Far Cry 5 admite funciones centradas en Vega con Rapid Packed Math y Shader Intrinsics. Far Cry 5 también es compatible con HDR (HDR10, scRGB y FreeSync 2). Usamos el punto de referencia en el juego para nuestros datos e informamos las tasas de cuadros promedio / mínimo.

El ariete del tiempo

A no diría mucho, pero al menos alguna discusión ha estado impregnando las ondas desde el lanzamiento del escritorio Ryzen 3000 sobre lo que AMD iba a hacer en su espacio de menos de $ 200. No tenía un producto de última generación en una parte muy activa del mercado que faltaba en la cartera, pero inicialmente AMD estaba contento de que sus CPU y APU de la generación anterior cumplieran ese papel.

Había dos escuelas de pensamiento. La primera es que AMD lanzaría CPU de menor conteo de núcleos, a pesar de tener un diseño de chiplet supuestamente de alto rendimiento que iba directamente a su cartera de productos de servidor de mayor margen. La construcción de un diseño de chiplet de bajo conteo de núcleos también incurre en el costo adicional de unir un chiplet y una matriz de E / S en el empaque, disminuyendo aún más los márgenes. Parecía poco probable en ese momento.

La segunda escuela de pensamiento sería que AMD poblaría esta parte del mercado con versiones de escritorio de las APU móviles Ryzen 4000. Estas partes monolíticas tenían gráficos integrados, y muy probablemente escalarían fácilmente de 45 W a 65 W para el escritorio. Al igual que las APU anteriores, solo habría 8 carriles PCIe para gráficos externos, pero para esta generación también solo PCIe 3.0 debido a la alimentación de las APU móviles.

Personalmente asumí el segundo, y que AMD ignoraría las CPU e iría directamente a las APU. Tal vez no estaba preparado para el aparente éxito de los chips móviles de AMD en el espacio de la computadora portátil. Hemos revisado el ASUS Zephyrus G14 , un verdadero portátil AMD insignia, y el Acer Swift 3 , que ofrece un rendimiento y una calidad alucinantes por el precio. AMD está promocionando más de 100 victorias de diseño en Ryzen Mobile en 2020, si la pandemia global lo permite, y los OEM están subiendo al carro al parecer.

Como hemos mostrado en la revisión, esto significa que tenemos algunas CPU. El Ryzen 3 3300X y Ryzen 3 3100 son elementos extraños para la familia Ryzen, especialmente el 3100 con su incómoda CCX y configuración central, pero ambas partes ofrecen mucho rendimiento por su precio. Con $ 120 y $ 99 respectivamente, utilizando la última microarquitectura Zen 2 de AMD y el eficiente proceso TSMC de 7 nm, AMD está definiendo una nueva línea base en el rendimiento del presupuesto.

Esto se personifica mucho al comparar el AMD Ryzen 3 3300X con el procesador de consumo insignia de Intel de 2017.

Hace tres años y cuatro meses en el CES, Intel lanzó con gran fanfarria su familia de procesadores Kaby Lake, con el Core i7-7700K encima de la pila. Este chip de cuatro núcleos basado en Skylake ofreció cambios de frecuencia de la generación anterior y un mejor rendimiento de juego en un paquete de 91 W. Su frecuencia base de 4.2 GHz, frecuencia turbo de 4.5 GHz, soporte de memoria DDR4-2400 y 16 carriles PCIe 3.0 fueron el tema principal. Todo esto podría ser tuyo por $ 350.

Luego avanza poco tiempo hasta hoy, y el Ryzen 3 3300X. Este también es un procesador de cuatro núcleos, construido con núcleos Zen 2 a una frecuencia más baja: solo 3.8 GHz de base y turbo de 4.3 GHz. Hay memoria más rápida en DDR4-3200, más y más rápido 24 carriles PCIe 4.0, y está clasificado solo a 65 W. Por casi un tercio del precio, a $ 120.

Estoy bastante seguro de que los precios de las CPU Kaby Lake usadas están a punto de colapsar. Sin embargo, tendrán que caer mucho, mucho.

Es en este momento que debo señalar que Intel obviamente tiene nuevos núcleos cuádruples en oferta. Las partes del Core i3 de la 9a generación son de cuatro núcleos sin hyperthreading, pero aún ejecutan una variante de la microarquitectura Skylake, aunque a una frecuencia más alta. El Core i3-9100, por ejemplo, es una pieza 4C / 4T con una base de 3.6 GHz y turbo de 4.2 GHz, y un TDP de 65W, por $120. Sin embargo, todavía solo tiene PCIe 3.0 y DDR4-2400, por lo que probablemente funcionará peor que el i7-7700K. Incluso con esto, la capacidad de Intel de proporcionar suficiente stock de estas piezas de gama baja, dependiendo de su ubicación, es cuestionable como se mencionó anteriormente. Caso en cuestión: la empresa nunca llegó a probar ninguna de las partes de i3 de 9.a generación para su revisión.

Intel ha anunciado los procesadores Comet Lake de décima generación, que saldrán a finales de este mes, y las piezas Core i3 ofrecerán hyperthreading. El Core i3-10100 es una pieza 4C / 8T con una base de 3.6 GHz y un turbo de 4.3 GHz, con un TDP de 65 W por $120. Todavía solo tiene PCIe 3.0, pero admite DDR4-2666, en comparación con AMD que admite PCIe 4.0 y DDR4-3200. Cuando estén disponibles en el comercio minorista, debemos compararlo con el 3300X para ver quién gana.

Dicho todo esto, AMD todavía tiene dos problemas que resolver con las nuevas partes Ryzen 3. La potencia inactiva parece alta a 18 W, y las placas base B550 deben existir para que estos procesadores Ryzen 3 sean más atractivos para la construcción del sistema. Lo último debería aparecer pronto, y tendremos cobertura adicional allí.

Al final del día, si eres el tipo de persona que disfruta esperar un par de años para obtener juegos con un 95% de descuento en Steam, el 3300X es tu procesador. Esos títulos AAA están llamando.

Una respuesta a «Revisión de AMD Ryzen 3 3300X y 3100»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *