Revisión de la Nvidia GeForce GTX 1660ti

Cuando se trata de elegir la mejor tarjeta gráfica de entre los muchos contendientes, admito que prefiero más funciones en lugar de ver cómo se cortan las cosas: es posible que no obtenga un uso inmediato de las cosas adicionales, pero al menos está ahí. Sin embargo, predecir el futuro es un asunto difícil, y los jugadores han hablado. El trazado de rayos en tiempo real puede sonar genial, pero si se compara con el rendimiento, estamos bien sin él. Y así, medio año después de revelar su arquitectura Turing, Nvidia está implementando las opciones principales, menos el trazado de rayos y el aprendizaje profundo. Es todo lo que los jugadores querían de Turing, sin nada de la hinchada extra. Saluda al GTX 1660 Ti.

Cuando NVIDIA puso en marcha sus planes para sus tarjetas de video de consumo Turing, la compañía apostó en grande, y en más de una forma. En el primer sentido, NVIDIA dedicó bloques lógicos enteros a gráficos y funciones de cómputo completamente nuevos (trazado de rayos y cómputo de núcleo tensor), y tendrían que vender a los desarrolladores y consumidores el valor de estas características, algo que no es tarea fácil. Sin embargo, en el segundo sentido, NVIDIA también apostó fuerte por el tamaño del troquel de GPU: estas nuevas funciones ocuparían mucho espacio en el proceso FinFET de 12nm que estarían usando.

El resultado final es que todos los chips de Turing que hemos visto hasta ahora, desde TU102 a TU106, son monstruos en tamaño; incluso TU106 es de 445mm 2 , no importa el TU102 insignia. Y mientras que las consecuencias económicas totales que acompañan a esa decisión son las de NVIDIA, durante el primer año más o menos de la vida de Turing, todo ese espacio que está aumentando los costos de NVIDIA no contribuirá a mejorar el rendimiento de NVIDIA en los juegos tradicionales ; Es una característica de valor agregado. Todo lo cual es factible para NVIDIA en el mercado de gama alta, donde no se cuestionan y esencialmente puede dictar los precios de las tarjetas de video, pero es otra cuestión completamente una vez que comienza a acercarse a la gama media, donde la competencia de AMD está viva y bien.

En consecuencia, al prepararse para sus tarjetas más baratas de $ 300 Turing, NVIDIA tuvo que tomar una decisión: ¿conservan los núcleos RT y tensor para ofrecer estas funciones en toda la línea, a un costo literal para los consumidores y NVIDIA? ¿Eliminan estas características para hacer un chip más ágil y competitivo? Como resultado, NVIDIA ha optado por este último, produciendo una nueva GPU Turing que es más ágil y más agresiva que cualquier otra cosa anterior, pero también muy diferente de sus predecesoras por esta razón.

Esa GPU es TU116, y es parte de lo que, sin duda, se convertirá en una nueva subfamilia de GPU de Turing para NVIDIA cuando la compañía comience a lanzar Turing en la mitad inferior del mercado de tarjetas de video. La nueva tarjeta de video de NVIDIA, la GeForce GTX 1660 Ti, es la nueva tarjeta de video de NVIDIA. Lanzado hoy a $279, está destinado a reemplazar el GTX 1060 6GB de NVIDIA en el mercado y es el nuevo retador de NVIDIA para el mercado principal de tarjetas de video.

La incorporación más reciente a la familia Turing termina siendo una gran desviación de los modelos anteriores, ya que los núcleos RT y Tensor que han estado en el corazón de la historia de GeForce RTX se han ido. En su lugar obtienes … bueno, en realidad, no obtienes nada. En cambio, Nvidia termina con una GPU más pequeña y más asequible. También recupera la marca GTX, que probablemente sea lo mejor, ya que el trazado de rayos en el hardware por debajo del nivel RTX 2060 no tiene mucho sentido en este momento. Pero sí obtiene el resto de las actualizaciones de la arquitectura de Turing , incluida la compatibilidad con el sombreado de tasa variable, las operaciones simultáneas de INT y FP, las matemáticas rápidas de FP16 y las mejoras en la jerarquía de caché.

Iremos a las ramificaciones completas de lo que NVIDIA ha sacado (y no ha sacado) de TU116 en la página siguiente, pero en un nivel alto todavía es una GPU de Turing, guarde la funcionalidad RTX (RT y núcleos de tensor) . Esto significa que tiene la misma arquitectura central en sus SM, y es directamente comparable a las del RTX 2060. O para voltear las cosas en la otra dirección, en comparación con las tarjetas de video más antiguas basadas en Pascal y Maxwell, viene con todas Los beneficios de rendimiento y eficiencia de Turing para las cargas de trabajo de gráficos tradicionales.

Comparado con el RTX 2060, el GTX 1660 Ti es bastante similar. Para esta tarjeta TU116 totalmente habilitada, NVIDIA ha vuelto a marcar el número de SM un poco, pasando de 30 a 24, y las velocidades de reloj de la memoria también han caído, de 14 Gbps a 12 Gbps. Pero más allá de eso, las dos tarjetas tienen especificaciones más cercanas de lo que podemos esperar por una diferencia de precio de $70, especialmente porque NVIDIA ha mantenido los 6GB de GDDR6 en un bus de memoria de 192 bits. En una peculiaridad adicional, la GTX 1660 Ti en realidad tiene una velocidad de aceleración media ligeramente más alta que la RTX 2060, con una velocidad de reloj de 1770 MHz que le da una ventaja de 5% aquí.

El resultado final es que, en el papel, la GTX 1660 Ti tiene un poco más de potencia de empuje de píxeles ROP que su hermana más grande gracias a la ventaja del 5% de aumento de reloj. Sin embargo, la caída en el recuento de SM definitivamente alcanza el rendimiento de la computación y la textura, donde la GTX 1660 Ti entregará alrededor del 85% del rendimiento de la computación y el sombreado de la RTX 2060. O para encuadrar las cosas en referencia a la GTX 1060 6GB que reemplaza, en la nueva tarjeta ofrece aproximadamente un 24% más de rendimiento de cómputo / sombreado (antes de tener en cuenta la arquitectura), un aumento mucho menor del 4% en el rendimiento de ROP, y una muy considerable % de aumento en el ancho de banda de la memoria.

Hablando del ancho de banda de la memoria, el uso continuado de NVIDIA de un bus de memoria de 192 bits en este segmento continúa siendo una opción un tanto desconcertante ya que conduce a cantidades de memoria tan extrañas. Admito que me hubiera gustado haber visto 8GB aquí, pero ese también fue el caso de RTX 2060. La otra cara es que al menos no están intentando enviar una tarjeta con solo un bus de memoria de 128 bits, como fue el caso de la GTX 960. Esto coloca a la GTX 1660 Ti en un lugar interesante en términos de ancho de banda de memoria, ya que es beneficiándose del salto a GDDR6; Si pensabas que la GTX 1060 podría usar un poco más de ancho de banda de memoria, la GTX 1660 Ti la tiene a la deriva. Esto también ha permitido a NVIDIA optar por una VRAM GDDR6 de 12Gbps más económica, lo que marca la primera vez que vemos esto en cualquier tarjeta de video.

Finalmente, observando el consumo de energía, vemos que NVIDIA mantendrá la línea en 120W, que es el mismo TDP que el GTX 1060 de 6GB. Esto es notable porque todas las otras tarjetas de Turing hasta la fecha han tenido TDP más altas que las tarjetas que reemplazan, lo que lleva a un caso amplio de inflación generacional de TDP. Por supuesto, veremos cómo es el consumo de energía real en nuestras pruebas, pero NVIDIA está configurando al GTX 1660 Ti para que sea notablemente más eficiente que las tarjetas de la serie RTX 20.

Espera, ¿es una tarjeta GTX?

Junto con la nueva familia de GPU TU11x, para este lanzamiento, NVIDIA también está creando una nueva familia de tarjetas de video: la serie GeForce GTX 16. Con la GTX 1660 Ti y sus hermanos obligados que carecen de soporte para la familia de características RTX de NVIDIA, la compañía ha decidido aclarar la denominación de sus productos de una manera que NVIDIA puede. El resultado final es que además de mantener el prefijo GTX en lugar de RTX, ya que estas partes obviamente carecen de la funcionalidad RTX, la compañía también les está dando un número de serie más bajo. En general, es probablemente lo mejor que NVIDIA no incluyó estas tarjetas con la serie 20, al menos tenemos otra situación GeForce 4.

Pero por otro lado, el número “16” tampoco tiene un gran significado; aparte de no ser “20”, el número es algo arbitrario. De acuerdo con NVIDIA, esencialmente lo eligieron porque querían un número cercano a 20 para indicar que la nueva GPU tiene una funcionalidad y un rendimiento muy cercanos al TU10x, y por lo tanto “16” en lugar de “11” o similar. Por supuesto, no estoy seguro de llamarlo GTX 1660 Ti está haciendo ningún favor a nadie cuando la siguiente carta es la RTX 2060 (sans Ti), pero no hay una progresión numérica algo clara aquí, y al menos por el momento , uno no basado en la capacidad de memoria.

También hay otras mejoras. Las GPU de Turing se fabrican utilizando el proceso FinFET de 12 nm de TSMC, y hasta ahora todas las GPU utilizan memoria GDDR6. La GTX 1660 Ti reduce la velocidad de la memoria a 12Gbps (en comparación con los 14Gbps de las distintas tarjetas RTX), lo que me hace preguntarme cuánta memoria queda en el espacio de overclocking. Más sobre esto en un momento.

Sin embargo, la GTX 1660 Ti no es realmente todo lo que los jugadores querían, ya que se dirige a un público general. Creo que lo que la gente quería era un rendimiento sustancialmente mayor en cada punto de precio, con más núcleos, VRAM y rendimiento. La GTX 1660 Ti parece alcanzar esa marca, al mantenerse relativamente cerca del precio saliente de la GTX 1060 6GB al tiempo que aumenta la mayoría de las especificaciones. Cuenta con un 20% más de núcleos CUDA, y son más capaces, como he notado, un aumento del 50% en el ancho de banda de la memoria gracias al GDDR6, y velocidades de reloj ligeramente más altas que deberían dar como resultado un rendimiento teórico un 25% mejor (y debería ser más que gracias a los cambios de arquitectura). Así que el mercado de gama media parece prometedor, pero si desea un reemplazo similar para un GTX 1080 Ti, no lo conseguimos.

En lo que respecta a las tarjetas GeForce GTX 1660 Ti, Nvidia no ofrece un diseño de referencia en esta ronda, no hay una Edición para Fundadores. Eso es típico de las tarjetas de nivel inferior tanto de AMD como de Nvidia, aunque viene con un retén. Sabemos que hay muchos modelos GTX 1660 Ti en los trabajos de los socios de AIB (Tablero de complementos), que abarcan la gama habitual de relojes de referencia para los modelos de reloj súper. Asus fue el primer socio de AIB que nos consiguió una muestra de GTX 1660 Ti, justo a tiempo para el lanzamiento, que es lo que estamos viendo hoy.

Asus envió su tarjeta de halo: el ROG Strix GTX 1660 Ti O6G. Tiene un precio de $ 329, a tiro de piedra del RTX 2060, pero también es el enfoque del fregadero de la cocina. Obtiene ventiladores triples, iluminación RGB direccionable, BIOS dual y un overclock de fábrica a 1890MHz para el reloj de refuerzo (reloj base de 1530MHz). Está honestamente diseñado para una GPU TDP de 120 vatios, con un conector PEG de 8 pines y un enfriador masivo, lo que significa menores temperaturas y niveles de ruido. Puede cambiar entre dos modos de rendimiento con solo oprimir un interruptor, y también hay un botón de “silencio” que desactivará inmediatamente toda la iluminación RGB si lo desea.

Tuve un tiempo limitado para probar el lanzamiento del GTX 1660 Ti, desafortunadamente, por lo que estos resultados iniciales están en los relojes de fábrica. El overclocking es posible, por supuesto, y es algo que analizaré con mayor profundidad durante la próxima semana. También es posible configurar la tarjeta en los relojes de referencia de Nvidia, pero es probable que las diferencias de VBIOS signifiquen que seguirá funcionando un poco más rápido, además de que la refrigeración debería ayudarlo a alcanzar los relojes de mayor impulso. Así que esta prueba le dará a la GPU más reciente de Nvidia una pequeña ventaja sobre las otras tarjetas de ‘referencia’ que he probado, pero las RX 590, 580 y 570 son todas modelos de overclock de fábrica, y espero que muchos modelos ofrezcan casi la El mismo nivel de rendimiento que esta tarjeta Asus Strix, solo a un precio más bajo.

TU116: Cuando Turing es Turing … Y cuando no lo es

Profundizando un poco más en los asuntos, tenemos la nueva GPU TU116 en el corazón de la GTX 1660 Ti. Si bien NVIDIA no anuncia productos futuros con anticipación, puede esperar que este sea el primero de al menos un par de GPU en lo que es ahora la familia TU11x, ya que NVIDIA querrá seguir la misma estrategia simplificada para los sucesores sucesivos de GP107 y posible GP108.

TU116 es una pieza interesante del kit, tanto por las decisiones que llevaron a este punto como por los inconvenientes y ventajas de eliminar algunas de las funciones de Turing. Como se mencionó anteriormente en este artículo, NVIDIA ha tomado una decisión muy deliberada para eliminar su funcionalidad RTX (los núcleos de trazado de rayos y los núcleos tensoriales) para producir una GPU que sea más adecuada para el renderizado tradicional. El resultado final es un GPU más pequeño y más barato de producir. Pero también significa que NVIDIA tiene que cambiar la forma en que promocionan las tarjetas basadas en esta GPU.

Con un tamaño de matriz de 284 mm 2 , TU116 cuenta una historia en sí misma. Esto lo hace un 40% más pequeño que la siguiente GPU de Turing, la TU106. Del mismo modo, el recuento de transistores ha bajado de 10.8 mil millones a 6.6 mil millones. Esto mejora en gran medida la capacidad de fabricación de la GPU y reduce sus costos, especialmente porque NVIDIA entrará en mercados más competitivos que las otras GPU TU10x. Sin embargo, el TU116 es un 42% más grande que el troquel GP106 de 200 mm 2 que reemplaza, por lo que a pesar de ser más eficiente, NVIDIA sigue lidiando con un aumento significativo en el tamaño del troquel en una base de generación en generación.

Desafortunadamente, TU116 no nos proporciona una línea de base terriblemente buena para determinar cuánto de un TU10x SM estaba compuesto por hardware RTX. TU116 no solo deja caer el hardware RTX en sus SM, sino que es un diseño más pequeño en general; Menos SM, menos canales de memoria y menos ROP. Por lo tanto, no podemos separar completamente los ahorros de eliminar RTX de los ahorros de hacer una GPU más liviana en general. Sin embargo, es interesante observar que, en una base relativa, la diferencia en el recuento de transistores entre TU116 y TU106 es casi exactamente la misma que GP106 y GP104: hay un 39% menos de transistores cuando se retira. Más adelante, nos dará la oportunidad de ver el rendimiento y ver si la brecha de rendimiento entre la GTX 1660 Ti y la RTX 2070, las tarjetas completas de sus GPU respectivas, es algo así como la brecha considerable entre la GTX 1060 6GB y La GTX 1080.

Pero volviendo a la arquitectura, este lanzamiento es una de las pocas veces que hemos visto a NVIDIA usar diferentes GPU en sus tarjetas de consumidor, y es una situación sin un buen paralelo. NVIDIA había hecho muchas familias no homogéneas en el pasado, pero normalmente la oveja negra de la familia es la GPU de servidor de gama alta, por ejemplo, GP100, donde obtiene características adicionales que no se encuentran en la línea de consumidores. En cambio, la familia Turing termina teniendo una división en el medio.

La buena noticia para los consumidores es que, aparte de la funcionalidad RTX, TU116 y su ilk, que de ahora en adelante llamaré Turing Minor de ahora en adelante, es funcionalmente equivalente a TU102 / TU104 / TU106 (Turing Major) . Turing Minor tiene exactamente el mismo conjunto de funciones de DirectX, exactamente la misma arquitectura de cálculo del núcleo (justo en el tamaño de caché), exactamente el mismo video y bloques de visualización, etc. Los núcleos de RT y tensor realmente son lo único que ha cambiado.

La situación es muy parecida para los programadores y desarrolladores también: en los controladores actuales, la GTX 1660 TI se informa a sí misma como una tarjeta de Compute Capability 7.5 (la misma versión de CC que todas las tarjetas de Turing Major), por lo que los desarrolladores no tendrán que hacerlo. incluso compilar código separado para tarjetas de Turing Minor. Mientras su código pueda manejar la falta de núcleos tensoriales, al menos.

(Como un resumen aparte, como ejercicio de rendimiento, ejecutamos la versión tensorial de nuestro banco de pruebas HGEMM en la GTX 1660 Ti. ¿Y se completó? El rendimiento fue un poco menor, a 10.8 TFLOPS versus 11 TFLOPS con tensores desactivados, pero se completó . Lo que indica que NVIDIA ha sido menos que próximo en TU116, o para mantener todas las partes de Turing en CC 7.5, están enviando operaciones de tensor a través de los núcleos CUDA en las tarjetas de Turing Minor)

Mirando el TU116 SM, lo que encontramos es algo casi idéntico a los diagramas SM utilizados para Turing Major, con el SM organizado en 4 particiones, cada una con su propio programa de deformación y conjunto de núcleos CUDA, mientras que las 4 particiones comparten el caché L1 y unidades de textura. El tamaño de la caché y el tamaño del archivo de registro no se modifican aquí, por lo que el rendimiento promedio y la presión de registro tampoco se modifican. La única característica es que al reemplazar los núcleos tensoriales en su diagrama, NVIDIA optó por dibujar los núcleos FP16, lo que es un poco exagerado dado lo que sabemos sobre la arquitectura de Turing. NVIDIA solo envió este diagrama ayer, así que todavía estoy revisando con ellos para ver si esta es la compañía que se está tomando la libertad creativa para resaltar la otra funcionalidad de Turing, o si hay algo más que NVIDIA está minimizando para simplificar las cosas (ala Kepler y GK104).

El curioso caso de FP16: Tensor Cores vs. Núcleos dedicados

A pesar de que las tarjetas de video basadas en Turing han estado disponibles por más de 5 meses, de vez en cuando todavía estoy aprendiendo algo nuevo sobre la arquitectura. Y hoy es uno de esos días.

Algo que se me escapó con la GPU TU102 original y el RTX 2080 Ti fue que para Turing, NVIDIA cambió la forma en que se manejaban las operaciones del FP16 estándar. En lugar de procesarlo a través de sus núcleos CUDA FP32, como fue el caso de GP100 Pascal y GV100 Volta, NVIDIA comenzó a enrutar las operaciones FP16 a través de sus núcleos tensoriales.

Los núcleos tensoriales son, por supuesto, especialistas en FP16, y aunque el envío de operaciones FP16 estándar (sin tensor) a través de ellos es una exageración importante, es sin duda una ruta válida para seguir con la arquitectura. En el caso de la arquitectura Turing, esta ruta ofrece un beneficio muy específico: significa que NVIDIA puede emitir operaciones de FP16 con operaciones FP32 o INT32, lo que esencialmente le da al programador de warp una tercera opción para mantener la partición SM ocupada. Tenga en cuenta que esto realmente no hace nada adicional para el rendimiento del FP16 (todavía es el rendimiento del FP32 2x), pero le da a NVIDIA cierta flexibilidad adicional.

Por supuesto, como acabamos de comentar, el Turing Minor elimina los núcleos tensoriales para permitir una GPU para el alumno. Entonces, ¿qué pasa con las operaciones FP16? Como resultado, NVIDIA ha introducido núcleos FP16 dedicados.

Estos núcleos FP16 son nuevos para Turing Minor y no han aparecido en ninguna arquitectura NVIDIA GPU anterior. Su propósito es funcionalmente el mismo que ejecutar las operaciones FP16 a través de los núcleos tensoriales en Turing Major: para permitir que NVIDIA realice operaciones FP16 de doble emisión junto con las operaciones FP32 o INT32 dentro de cada partición SM. Y como son solo núcleos FP16, son bastante pequeños. NVIDIA no está dando detalles, pero por el solo rendimiento debe ser una fracción del tamaño de los núcleos tensoriales que reemplazan.

Para los usuarios y desarrolladores, esto no debería hacer una diferencia: CUDA y otras API resumen esto y las operaciones del FP16 se ejecutan simplemente donde sea que la arquitectura de la GPU pretende que vayan, por lo que todo es muy transparente. Pero es una buena idea de cómo NVIDiA ha optimizado Turing Minor para el tamaño del troquel al tiempo que conserva el flujo de ejecución básico de la arquitectura.

Ahora, la pregunta más grande en mi mente: ¿por qué es tan importante para NVIDIA poder realizar operaciones de doble FP32 y FP16, de modo que estén dispuestos a dedicar espacio a los núcleos fijos de FP16? ¿Están esperando que estas operaciones se usen frecuentemente juntas dentro de un hilo? ¿O es solo una cuestión de puertos de ejecución y enrutamiento? Pero esa es una pregunta que tendremos que guardar para otro día.

Turing Minor: Turing sin RTX
Para bien o para mal, el lanzamiento de GTX 1660 Ti y Turing Minor significa que NVIDIA ha necesitado ajustar cómo promocionan las nuevas tarjetas y la arquitectura de Turing. Mientras que Turing se lanzó con una larga lista de características, la mayoría de las cuales no tenían nada que ver con RTX, el zeitgeist más amplio del consumidor se centró definitivamente en RTX y por una buena razón: en comparación con todos los cambios arquitectónicos de bajo nivel bajo el capó, el trazado de rayos, DLSS y otras características de RTX son mucho más visibles, y para NVIDIA fueron más fáciles de promocionar. Esto significa que para Turing Minor NVIDIA, en cambio, tiene que centrarse en las mejoras arquitectónicas de bajo nivel en Turing, lo que creo que es excelente, ya que estas se pasaron por alto en gran medida en el lanzamiento de Turing.

Si bien no resumiré toda nuestra inmersión profunda en Turing aquí, en relación con Pascal, la gran diferencia aquí son los numerosos pasos que NVIDIA ha tomado para mejorar su IPC y su eficiencia general. Por ejemplo, Turing realizó el sorprendente movimiento para deshacerse de las formas regulares de Paralelismo a nivel de instrucción (ILP) al eliminar el segundo puerto de despacho del programador de warp. En su lugar, cada programador de warp dispara un conjunto único de instrucciones en cada reloj, aprovechando el hecho de que se necesitan 2 (o más) relojes para emitir un warp completo para intercalar una segunda instrucción en.

Este cambio de ILP va de la mano con la partición del SM en 4 bloques en lugar de 2, lo que sirve para ayudar a controlar mejor la contención de recursos entre los warp y los núcleos CUDA. De hecho, en un nivel alto, un Turing SM se parece mucho más a algunas GPU enfocadas en el servidor de NVIDIA que a sus GPU enfocadas en el consumidor; Hay muchas más tuberías aquí en varias formas para respaldar los núcleos CUDA y ayudarlos a lograr un mejor rendimiento, en lugar de simplemente lanzar más núcleos CUDA al problema. El resultado neto es que, si bien no tenemos métricas de NVIDIA, espero totalmente que la proporción de hardware de soporte y lógica de cola para los núcleos CUDA sea significativamente mayor en Turing que en GP106 Pascal. Aunque de la misma manera, espero que los SM en su conjunto sean más grandes que los de Pascal, lo que ciertamente se refleja en el tamaño del dado.

Una gran parte de este cambio, a su vez, es el hecho de que NVIDIA rompió sus núcleos de Integer en su propio bloque. Anteriormente, una rama separada de los núcleos CUDA FP32, los núcleos INT32 ahora pueden direccionarse por separado de los núcleos FP32, que combinados con el intercalado de instrucciones permiten que NVIDIA mantenga ambos ocupados al mismo tiempo. Ahora no se equivoquen: las matemáticas de punto flotante siguen siendo el corazón y el alma del sombreado y el cálculo de la GPU, sin embargo, el rendimiento de los enteros también ha ido aumentando en importancia con el tiempo, especialmente a medida que los shaders se vuelven más complejos y hay un mayor uso de la generación de direcciones y otros INT32 funciones Este cambio es una gran parte de las ganancias de IPC que NVIDIA reclama para la arquitectura de Turing.


Hablando de núcleos CUDA, como todas las otras partes de Turing, TU116 y Turing Minor obtienen la rápida funcionalidad FP16 de NVIDIA. Esto significa que estas GPU pueden procesar operaciones FP16 al doble de la velocidad de las operaciones FP32, a través de los núcleos FP16 dedicados de la GPU, que para GTX 1660 Ti funcionan a 11 TFLOPS de rendimiento. El uso de sombreadores FP16 en juegos para PC es todavía relativamente nuevo (las consolas de 8ª generación de línea de base no lo admiten y NVIDIA limitó previamente esta característica a las partes del servidor), pero se usa más ampliamente en juegos para dispositivos móviles donde la compatibilidad con FP16 es común. Allí, como estará en el espacio de la PC, los sombreadores FP16 permiten a los desarrolladores intercambiar entre el rendimiento y la precisión del sombreado utilizando un formato de menor precisión; no todos los programas de sombreado requieren una precisión total de FP32, y cuando se hace correctamente, puede mejorar el rendimiento y reducir las necesidades de ancho de banda de la memoria sin ningún impacto real en la calidad de la imagen.

Mientras tanto, mirando el resto de la GPU, la memoria y el sistema de caché son un poco una bolsa de mano. Por un lado, Turing implementa la última tecnología de compresión de memoria sin pérdida de NVIDIA. Esta ha demostrado ser una de las mayores ventajas de NVIDIA sobre AMD, y continúa permitiéndoles salirse con menos ancho de banda de memoria de lo que de otra forma esperaríamos que necesitaran algunas de sus GPU. Los ahorros reales varían de un juego a otro, pero para el lanzamiento de la GTX 2080 Ti, NVIDIA informó que estaban viendo reducciones en el tráfico entre un 18% y un 33%.

Sin embargo, a diferencia de TU116 en comparación con sus hermanos Turing Major, la GPU más reciente tiene menos caché L2 por partición ROP. Las GPU principales de Turing tienen 512 KB de caché L2 por partición, lo que da a TU106 un total de 4 MB de L2, por ejemplo. Por otro lado, TU116 tiene solo 256KB de L2 por partición para un total de 1.5MB de L2, que es la misma cantidad de proporciones de caché y caché que en GP106. El impacto en el rendimiento de esto es difícil de medir dados todos los demás cambios en la GPU, pero claramente NVIDIA había cambiado el tamaño de un troquel a costa de algunos aumentos en las fallas de caché. El comodín en todo esto es cuánto el ancho de banda adicional de GDDR6 ayuda a compensar esos errores.

Finalmente, en el frente de los gráficos, Turing Minor también conserva las capacidades de sombreado adaptativo de Turing. No a diferencia de RTX, esta es una nueva característica que tardará un tiempo en ser adoptada, por lo que solo hemos visto un puñado de juegos (como Wolfenstein II) implementados hasta ahora. Pero al reducir la granularidad / tasa de sombreado de píxeles utilizada en varios puntos de una escena, la tecnología hace posible mejorar el rendimiento al reducir la carga de trabajo de sombreado general.

El truco con el sombreado adaptativo, y por qué es una característica más que un medio transparente e inmediato para mejorar el rendimiento, es que está haciendo una compensación de calidad / velocidad muy directa con los sombreadores de píxeles; la reducción en la tasa de sombreado puede reducir la calidad general de la imagen al reducir la claridad y crear artefactos de aliasing. Por lo tanto, los desarrolladores aún están en su infancia jugando con la tecnología para descubrir dónde pueden usarla sin dañar notablemente la calidad de la imagen. En la práctica, espero que lo veamos más implementado en los juegos de realidad virtual al principio, ya que la tecnología es mucho más fácil de usar allí (reduce la tasa en cualquier lugar que el usuario no esté buscando), a diferencia de los juegos tradicionales.

El resultado final de todo esto es que si bien Turing Minor tiene algunas diferencias de características muy importantes con respecto a Turing Major, al final del día todavía es Turing. Por su parte, NVIDIA tendrá que lidiar con el hecho de que no todas sus tarjetas de la generación actual cuentan con la funcionalidad RTX, pero eso será un problema de marketing. En cuanto a los consumidores, a menos que esté buscando específicamente la funcionalidad de núcleo de tensor y trazado de rayos de NVIDIA, la GTX 1660 Ti es solo otra Turing.

GeForce GTX 1660 Ti Overclocking
Hablemos un poco más sobre el overclocking. Asus envió una tarjeta relativamente fuertemente overclockeada, y mientras el reloj oficial de impulso es de 1890MHz, vi que la velocidad máxima de reloj ya llegaba a 2025MHz. Las GPU Turing anteriores en las tarjetas GeForce RTX han alcanzado sus límites alrededor de los 2000MHz, así que no estaba segura de cuánto más podría obtener. Por otro lado, la velocidad de la memoria parece bastante moderada, considerando que todas las otras tarjetas GDDR6 RTX se ejecutan fácilmente a 14 GT / s. Se siente como un poco de un límite intencional para evitar que la GTX 1660 Ti invada territorio RTX 2060.

Tendré que profundizar un poco más en los próximos días para ver la cantidad de espacio para la cabeza que realmente existe, pero adopté mi enfoque estándar para el overclocking de GPU con MSI Afterburner. Primero, puse el voltaje a +100 y aumenté el límite de potencia a su máximo (120 por ciento), y para estar seguro, puse los ventiladores de la GPU a un 80 por ciento. Las temperaturas se mantuvieron heladas durante las pruebas (50C máx. Este es un pepino fresco), y los ventiladores ni siquiera son tan fuertes a esta velocidad, por lo que los ventiladores grandes y triples definitivamente están haciendo su trabajo. Luego empecé a ver hasta dónde podía empujar el núcleo de la GPU y los relojes de memoria.

El GDDR6 funcionó como lo esperaba: pude maximizar el control deslizante de velocidad de la memoria a +1500 MHz, que termina siendo de 15 GT / s. (He podido alcanzar cerca de 16 GT / s en algunas de las tarjetas RTX, si te estás preguntando). No estoy seguro de que haya mucho límite de ancho de banda, sin embargo, mientras que los núcleos de GPU son más propensos a retener las cosas. Configuré el reloj de la GPU a +100, pero no es lo mismo que un aumento garantizado de 100MHz: los relojes se mantuvieron en el rango de 2025-2075 MHz durante las pruebas, aproximadamente 50MHz más que en el inventario de fábrica. En cuanto al rendimiento, no he ejecutado el conjunto de prueba completo, ya que todavía estoy intentando marcar el overclock y asegurarme de que sea estable, pero esta configuración proporcionó una mejora de entre un 10 y un 15 por ciento a la velocidad de cuadro (a 1440p ultra).

En general, estoy muy contento de ver incluso esa modesta mejora en los relojes centrales, considerando que este será uno de los modelos GTX 1660 Ti de fábrica más altos de fábrica. No es suficiente cerrar la brecha con un RTX 2060, y tengo curiosidad por ver qué tan bien funcionan las tarjetas de referencia con reloj cuando se trata de overclocking, pero es un buen comienzo. Mientras tanto, la memoria tiene muchas piernas: un aumento del 25 por ciento en el ancho de banda es bastante notable.

GeForce GTX 1660 Ti Performance

PC GAMER GPU TESTBED
Intel Core i7-8700K @ 5.0GHz
NZXT Kraken X62
Gigabyte Z370 Aorus Gaming 7
2x8GB G.Skill TridentZ DDR4-3200
Samsung 970 Evo 1TB
Samsung 860 Evo 4TB
EVGA SuperNova P2 1000W
Corsair Carbide Air 740

Idealmente, volvería a probar cada GPU con los últimos controladores cada vez que se lanza una nueva tarjeta, pero eso no es práctico: serían semanas de pruebas y la mayoría de los resultados probablemente no cambiarían. Lo volví a probar todo para el lanzamiento de Turing de Nvidia en septiembre pasado, además de agregar varios juegos nuevos desde entonces. Los nuevos juegos fueron probados con los últimos controladores disponibles en ese momento, y el GTX 1660 Ti está utilizando controladores de revisión que llevan el mismo número de versión 418.91 que los controladores disponibles públicamente.

Mi sistema de prueba de GPU utiliza un Core i7-8700K overclockeado a 5.0GHz para ayudar a minimizar los cuellos de botella de la CPU durante la prueba, junto con otros componentes de gama alta. Puedes ver los detalles completos en el recuadro a la derecha. Para el presupuesto y las tarjetas gráficas de rango medio, el sistema de prueba quizás sea excesivo, pero esto permite que todas las tarjetas gráficas alcancen su máximo potencial de rendimiento.

He probado 19 juegos en 20 tarjetas gráficas para esta revisión inicial, incluidas varias adiciones nuevas, en cuatro combinaciones de configuración / resolución por juego. (Si desea ver los resultados de GPU más antiguas como la serie GTX 900 y las tarjetas R9 de AMD, consulte la revisión de GeForce RTX 2060 ). Las pruebas se realizan con una calidad ‘media’ de 1080p, junto con una calidad ‘ultra’ a 1080p, 1440p. y 4k. En la mayoría de los juegos, los ajustes preestablecidos superan al máximo todas las opciones, mientras que en los juegos que no incluyen ajustes preestablecidos, he superado las configuraciones manualmente (por ejemplo, el menú de gráficos avanzados de GTA5, que no sea superscaling). Algunos juegos castigan las tarjetas con menos de 6 GB o incluso 8 GB de VRAM en estas configuraciones, pero en general el GTX 1660 Ti debería estar bien.

Mientras que algunos discutirán si $ 279 es o no un precio general, la GTX 1660 Ti es una tarjeta que se dirige a los jugadores de 1080p. Eso sigue siendo la mayoría de las personas (60 por ciento), según la última Encuesta de hardware de Steam , a pesar de que las pantallas 1440p han reemplazado a 1080p en gran medida como nuestra recomendación para los mejores monitores de juegos . Y la noticia es buena: a 1080p, la GTX 1660 Ti se desplaza y promedia a más de 60 cuadros por segundo en la mayoría de los juegos.

¿Dónde se queda corto? No es sorprendente, son los juegos más exigentes: Anthem, Assassin’s Creed Odyssey y Metro Exodus no pueden mantener un constante 60 fps a 1080p ultra; en realidad, Metro ni siquiera puede hacer eso con el ajuste preestablecido alto, pero esa es una historia que comento con más detalle en mi análisis de rendimiento de Metro . En esos casos, querrá bajar la configuración una o dos veces, pero a 1080p medio aún queda mucho espacio libre.

En lo que respecta a la competencia, la GTX 1660 Ti adquiere el RX 590 de AMD y gana de manera decisiva, con un promedio de 20-25 por ciento de ventaja. No hay juegos donde la tarjeta de precio similar de AMD salga adelante, aunque al menos se cierra en algunos juegos (Anthem, Battlefield 5 y Strange Brigade). Quizás lo más importante es cómo la GTX 1660 Ti se compara con las GPU más antiguas. Es aproximadamente un 35 por ciento más rápido que la GTX 1060 de 6GB, e incluso viene solo un poco por delante de la GTX 1070, aunque definitivamente hay juegos donde la 1070 gana. Si ya posee un 1070, obviamente esta no es la tarjeta para usted, pero también tiene un precio de alrededor de $ 75 más bajo que los precios actuales de la tarjeta saliente. Por otra parte, estamos hablando de una tarjeta que tiene dos años y medio, por lo que los ahorros con el tiempo realmente no son tan buenos.

Si está sentado en una GPU más antigua como una GTX 970, puede tener más sentido actualizar. El rendimiento es 75 por ciento mejor a 1080p ultra, y 55 más rápido a 1080 mediano. Esa es una tarjeta gráfica que ahora tiene 4.5 años, y por supuesto, cualquier cosa más lenta que un 970 vería ganancias aún mayores. En comparación con el R9 390 de AMD (o el R9 290X de rendimiento similar que tiene más de cinco años), el 1660 Ti es 65 por ciento más rápido, y lo hace mientras reduce el consumo de energía de la tarjeta gráfica a la mitad. Aún así, sería una actualización mucho más notable si está ejecutando algo como un HD 7970 / R9 280X o inferior.

1440p ultra es a menudo demasiado para GPU de rango medio como la GTX 1660 Ti y otras tarjetas gráficas de menos de $ 300. Es viable en algunos juegos pero no en otros, aunque bajar la calidad una muesca o dos ciertamente ayuda. Las tasas de cuadros promedio en 1440p ultra son 62 fps, básicamente empatadas con la GTX 1070, aunque, por supuesto, la Asus 1660 Ti viene con un overclock decente. (Un modelo de referencia sería un 5-10 por ciento más lento).

Sin embargo, ninguna de las dos tarjetas llegará a 60fps. Aproximadamente la mitad de los juegos que probé tienen un promedio de 60 fps o más, a veces mucho más, mientras que la otra mitad cae por debajo, con algunos como Anthem, Assassin’s Creed Odyssey, Deus Ex y Metro Exodus, que están cerca de los 40 fps.

El recién llegado de Nvidia también supera al RX 590 de la corriente principal de AMD en aproximadamente un 25 por ciento, por aproximadamente el mismo precio mientras usa menos energía. También es un 80 por ciento más rápido que un GTX 970, pero solo un 60 por ciento más rápido que el R9 390, ya que el VRAM de 8 GB ayuda a la antigua tarjeta de AMD de Fiji en esta resolución.

Los resultados ultra de 4k son en su mayoría superfluos aquí, pero de todos modos he ejecutado los puntos de referencia. Incluso si reduce la calidad a medio o bajo, bastantes juegos no lograrán romper los 60 cuadros por segundo; simplemente hay demasiados píxeles para obtener una tarjeta de rango medio. Las clasificaciones generales son similares a las de los gráficos anteriores, aunque la VRAM de 6 GB se ha convertido en un factor importante ahora. Pero una vez más, realmente no deberías estar corriendo 4k en una tarjeta como esta.

En términos generales, en términos de valor, la GTX 1660 Ti se ubica cerca de la parte superior de la pila de tarjetas gráficas de rango medio, dependiendo del modelo que esté mirando, naturalmente. Para la GPU aislada, aún se podría argumentar que el RX 580 8GB y el RX 570 4GB son mejores opciones, lo cual tiene sentido considerando que cuestan un 30 por ciento y un 50 por ciento menos, respectivamente. Pero la GTX 1660 Ti se sostiene contra las tarjetas GTX 1060, sin importar los modelos RTX más caros. Cambie a una versión principal completa y la GTX 1660 Ti se ve mucho más prometedora.

La GeForce GTX 1660 Ti es un bienvenido regreso de la marca GTX

Tienes que preguntarte sobre el proceso de pensamiento de Nvidia en la GTX 1660 Ti. ¿Fue siempre en las obras? Probablemente, parece poco probable que se trate de hacer un trazado de rayos y DLSS en algo menos que el RTX 2060. Pero después de todo el bombo a esas nuevas características, casi parece que Nvidia está retrocediendo un poco al darnos una nueva serie de tarjetas GTX. Hay algunas características nuevas en comparación con Pascal (serie 10), pero en general, la arquitectura de Turing solo parece dar cuenta de una mejora del 10 por ciento en el rendimiento central de CUDA; el resto de la mejora se produce a través de más núcleos y velocidades de reloj más altas.

Otra cosa a considerar es cuando llegará el inevitable GTX 1660: con el sufijo Ti y un procesador TU116 completamente habilitado, obviamente, hay muchas oportunidades para que Nvidia lance una GPU de especificaciones más bajas. Sin embargo, es de esperar que se mantenga con una memoria VRAM de 6GB, ya que cada vez menos es cada vez más miope. Una tarjeta ligeramente más lenta con un precio de $ 200 sería una buena noticia, pero tendremos que esperar y ver qué sucede y cómo se ve el producto final.

Mientras tanto, si ha estado sentado en una GPU de rango medio de un par de generaciones atrás, o en una tarjeta de gama alta de hace cinco años o más, la GTX 1660 Ti es una actualización digna. Pasar de una GPU GTX 970 o R9 380X o inferior a la 1660 Ti aumentará significativamente el rendimiento y también reducirá los requisitos de energía. Y si está ejecutando una GTX 960, GTX 770 o una GPU similar, la 1660 es dos veces más rápida. Por supuesto, podría haber obtenido un aumento similar en el rendimiento hace dos años con la GTX 1070, y solo habría costado unos $ 100 adicionales. Y luego sucedió todo eso de la criptomoneda y los precios de la GPU se dispararon durante un año, pero afortunadamente eso ya es cosa del pasado. (Toco madera…)

Sin embargo, no todo es sol y flores con el diseño TU116. Además de admitir que no estamos en el punto en que el hardware de trazado de rayos en tiempo real esté listo para las masas, tiene algunas áreas que podrían convertirse en puntos débiles durante su vida útil. Tiene un 50% más de ancho de banda de memoria que la GTX 1060 de 6 GB, pero la misma cantidad de VRAM. No estoy seguro de cuándo los 6 GB realmente se convertirán en “no es suficiente VRAM”, pero hay más juegos que comienzan a integrarse en el rango de 8 GB y superior, así que prepárese para pasar de las texturas “ultra” a “alta” en el próximo año o dos. También es interesante que el chip tenga un 50 por ciento más de transistores que el GP106 que está en el 1060, y sin embargo, a pesar de la litografía de 12 nm, todavía es un 42 por ciento más grande. Lo sé, 12nm es más marketing que sustancia, pero todavía estoy esperando a ver cuándo Nvidia se mueve a 7nm, y qué tipo de GPU hará en ese momento. Spoiler: serán más rápidos y mejores que Turing, pero es probable que todavía falten un año o más.

En este momento, si está buscando construir una nueva PC para juegos de gama media, capaz de ejecutar casi cualquier juego a 1080p ultra con alta velocidad de fotogramas, la GTX 1660 Ti pertenece a la parte superior de su lista. Supera fácilmente las antiguas tarjetas GTX 1060 de Nvidia y no cuesta mucho más. Ofrece un buen rendimiento y excelente eficiencia, con un precio que puede llegar a una audiencia mucho más amplia que la línea RTX. También hace un mejor trabajo al alcanzar 60 fps o más a 1080p ultra, algo que las tarjetas RX 570/580 y GTX 1060 a veces tienen dificultades para hacer, especialmente en la última generación de juegos. Aquellos que buscan algo que dure algunos años mientras esperamos que llegue un hardware de rastreo de rayos más capacitado (con suerte en los precios generales) encontrarán muchas cosas que gustar en el GTX 1660 Ti.

Fuentes: PCGamer.com, Anandtech.com, Guru3D.com

Mas Pruebas de rendimiento

Battlefield V


Metro: Exodus


Far Cry: New Dawn


The Witcher 3: Wild Hunt


Wolfenstein II: The New order

Shadow of Mordeor: Shadow of War

F1 2018

Rendimiento en Computo










Consumo Energético


Temperatura


6 respuestas a «Revisión de la Nvidia GeForce GTX 1660ti»

  1. Maikel…umm, oye por que en newegg las 470 aparecen en una bestialidad de precio, es decir alrededor y muy por encima de 300 y la 570 aparecen hasta por debajo de 200, siendo la 570 en mi opinion, una tarjeta superior a la 470.
    o sigo sin aprender.

    1. eso ocurre muchos con productos que ya no existen y no se han actualziado los datos de los post
      Hay que ajustar las fechas, o decir que sean productos nuevos
      Esos son precios de cuando llegaron a estar asi por el asunto de la mineria de cripto y no se actualizan, Puede fijarte luego si hay en existencia
      O debes ordenarlos por precios.
      En amazon pasa igual, se quedan post, articulos y precios viejos, que luego los productos no hay y se quedan asi

      1. si, yo los ordne por los mas nuevos, por el menos precio, y como quiera me salian esos precios en las 470, incluso tienen existencias, debe ser que no han revalorizado esos stocks o al go de eso.
        i need some help to beat G Odim. a clue, jaja
        i set a new record o failures.

  2. COÑO Q ESTA GENTE NO CONOCE LOS SON LOS 120 O 150 O 90 DOLARES, JO SIEMPRE SACAN POR ENCIMA DE 200 DE MADRE VAMOS A VER CUANDO ENTRE EN EL MERCADO CUBANO A VER COMO SALEN X Q AQUI SE CASI Q SE TRIPLICAN

    1. Casi siempre las buenas opciones suben los 150 dolares , que es algo entendible y aceptable, en ese rango he visto rx470 y rx570, incluso una reensamblada gigabyte 1060 g1 de 6gb en 199.99, eso para los arriesgados les sale muy barata.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *