PDA

Ver la versión completa : kepler vs fermi



shep
22/04/2014, 19:40
Pues googleando un poco me encontrado con este comentario:

Yo diria que han dado un retroceso en su arquitectura. nVidia Fermi aka GTX 580 ha sido la arquitectura mas elegante hecha por ellos. Una arquitectura escalar, que no requeria de optimizaciones de driver para correr bien, por que tenia un planificador integrado de tareas que balanceaba el uso del GPU. Era una arquitectura orientada al paralelismo de tareas, acabar una tarea lo antes posible. Cuando nVidia sacó el GF104, le hizo ciertas mejoras para aumentar la eficiencia de Fermi, que se uso en el chip GTX 560 Ti y GTX 460, era un Fermi superescalar. Donde se requeria de uso de un compilador para extraer mas el paralelismo del chip, usando la tecnica de paralelismo de instrucciones, por eso habia casos donde un GTX 560 Ti de 384 CUDA cores se le pegaba al GTX 470 que tenía 334 CUDA cores. En el mejor de los casos, el GTX 560 Ti operaba como un chip de 384 CUDA cores pues tenia 3 puertos de despacho, pero en el peor de los casos, solo dos despachos trabajarían, operando como un chip de 256 CUDA cores. nVidia Kepler es un diseño fundamentalmente basado en el GF114/104, por ende GK104. Sumamente eficiente pero terrible en tareas generales que no son juegos. Pues le eliminaron el planificador de tareas, y los hot clocks, haciendo que todos sus shaders corran a la misma frequencia del chip. Debido a que cada CUDA core es cerca de dos veces mas lento que cada Fermi core, nVidia tuvo que triplicar la cantidad de estos mas subir sus clocks para compensar. Y de hecho ha sido un buen diseño, pero como dije, depende aun mas de trucos de driver y optimizaciones ya que ahora es el procesador quien corre con la alocalizacion de recursos. Sigue teniendo 3 dispatch ports, donde en el mejor de los casos puede usar todos sus 1,536 CUDA cores, pero en casos donde no pueda extraer el paralelismo de instrucciones, solo trabajarían 1,024. Aparte que en Titan/GTX 780 Ti, para hacer precision doble, debe fusionar 2 de sus shaders mas el FPU unit, haciendo que solo se puedan usar 960 shaders en el caso de Floating Point data.

Me a parecido muy intersante pero ni idea de cuanto puede tener esto de cierto o de mentira... y queria ver opiniones de aqui.
¿Que os parece?

josrob536
22/04/2014, 20:04
Pues googleando un poco me encontrado con este comentario:

Yo diria que han dado un retroceso en su arquitectura. nVidia Fermi aka GTX 580 ha sido la arquitectura mas elegante hecha por ellos. Una arquitectura escalar, que no requeria de optimizaciones de driver para correr bien, por que tenia un planificador integrado de tareas que balanceaba el uso del GPU. Era una arquitectura orientada al paralelismo de tareas, acabar una tarea lo antes posible. Cuando nVidia sacó el GF104, le hizo ciertas mejoras para aumentar la eficiencia de Fermi, que se uso en el chip GTX 560 Ti y GTX 460, era un Fermi superescalar. Donde se requeria de uso de un compilador para extraer mas el paralelismo del chip, usando la tecnica de paralelismo de instrucciones, por eso habia casos donde un GTX 560 Ti de 384 CUDA cores se le pegaba al GTX 470 que tenía 334 CUDA cores. En el mejor de los casos, el GTX 560 Ti operaba como un chip de 384 CUDA cores pues tenia 3 puertos de despacho, pero en el peor de los casos, solo dos despachos trabajarían, operando como un chip de 256 CUDA cores. nVidia Kepler es un diseño fundamentalmente basado en el GF114/104, por ende GK104. Sumamente eficiente pero terrible en tareas generales que no son juegos. Pues le eliminaron el planificador de tareas, y los hot clocks, haciendo que todos sus shaders corran a la misma frequencia del chip. Debido a que cada CUDA core es cerca de dos veces mas lento que cada Fermi core, nVidia tuvo que triplicar la cantidad de estos mas subir sus clocks para compensar. Y de hecho ha sido un buen diseño, pero como dije, depende aun mas de trucos de driver y optimizaciones ya que ahora es el procesador quien corre con la alocalizacion de recursos. Sigue teniendo 3 dispatch ports, donde en el mejor de los casos puede usar todos sus 1,536 CUDA cores, pero en casos donde no pueda extraer el paralelismo de instrucciones, solo trabajarían 1,024. Aparte que en Titan/GTX 780 Ti, para hacer precision doble, debe fusionar 2 de sus shaders mas el FPU unit, haciendo que solo se puedan usar 960 shaders en el caso de Floating Point data.

Me a parecido muy intersante pero ni idea de cuanto puede tener esto de cierto o de mentira... y queria ver opiniones de aqui.
¿Que os parece?


resumiendo..

gtx 580 mas lenta que gtx 680/770 .... en gaming..
si hablamos de computo no tengo ni idea de como va el tema.. ademas el gf110 tiene los cudas al doble de velocidad del core y en cambio el gk104 lo tiene a la misma velocidad del core, por eso necesita mas cudas para hacer lo mismo..
pero vamos en gaming le da sopas con tortas el GK104 al GF110...
lo que tambien hay de cierto es lo del planificador de tareas por hard o por soft.. aunque de eso yo no entiendo mucho. eso concreto lo podria explicar OLIVER que el si lo tiene bastante papeado el tema..

Saludos.

Oliver91
22/04/2014, 20:22
Pues googleando un poco me encontrado con este comentario:

Yo diria que han dado un retroceso en su arquitectura. nVidia Fermi aka GTX 580 ha sido la arquitectura mas elegante hecha por ellos. Una arquitectura escalar, que no requeria de optimizaciones de driver para correr bien, por que tenia un planificador integrado de tareas que balanceaba el uso del GPU. Era una arquitectura orientada al paralelismo de tareas, acabar una tarea lo antes posible. Cuando nVidia sacó el GF104, le hizo ciertas mejoras para aumentar la eficiencia de Fermi, que se uso en el chip GTX 560 Ti y GTX 460, era un Fermi superescalar. Donde se requeria de uso de un compilador para extraer mas el paralelismo del chip, usando la tecnica de paralelismo de instrucciones, por eso habia casos donde un GTX 560 Ti de 384 CUDA cores se le pegaba al GTX 470 que tenía 334 CUDA cores. En el mejor de los casos, el GTX 560 Ti operaba como un chip de 384 CUDA cores pues tenia 3 puertos de despacho, pero en el peor de los casos, solo dos despachos trabajarían, operando como un chip de 256 CUDA cores. nVidia Kepler es un diseño fundamentalmente basado en el GF114/104, por ende GK104. Sumamente eficiente pero terrible en tareas generales que no son juegos. Pues le eliminaron el planificador de tareas, y los hot clocks, haciendo que todos sus shaders corran a la misma frequencia del chip. Debido a que cada CUDA core es cerca de dos veces mas lento que cada Fermi core, nVidia tuvo que triplicar la cantidad de estos mas subir sus clocks para compensar. Y de hecho ha sido un buen diseño, pero como dije, depende aun mas de trucos de driver y optimizaciones ya que ahora es el procesador quien corre con la alocalizacion de recursos. Sigue teniendo 3 dispatch ports, donde en el mejor de los casos puede usar todos sus 1,536 CUDA cores, pero en casos donde no pueda extraer el paralelismo de instrucciones, solo trabajarían 1,024. Aparte que en Titan/GTX 780 Ti, para hacer precision doble, debe fusionar 2 de sus shaders mas el FPU unit, haciendo que solo se puedan usar 960 shaders en el caso de Floating Point data.

Me a parecido muy intersante pero ni idea de cuanto puede tener esto de cierto o de mentira... y queria ver opiniones de aqui.
¿Que os parece?

Lo que dice es verdad (salvo alguna cosa xD), pero mal interpretado, por que lo pone como algo malo cuando en realidad no tiene por que serlo. Simplemente el mejor caso posible es mejor y el peor caso posible es peor. Para juegos parece que es muy eficiente, ya lo han demostrado el GF104/114 y las Kepler, en computación puede haber más problemas como el que comenta pero, como aun así, el nº de cuda cores es mucho mayor al de Fermi, en ningún caso rinde menos, salvo que la aplicación se atonte claro. De todos modos todo esto parece que lo resuelven con Maxwell con una redistribución completa de todo ese hardware, así que mejor que no se preocupe mucho por el tema.

Lo de las optimizaciones de driver no es del todo cierto, por que el driver lo que hace es ayudar un poco para que la GPU lo tenga más fácil, pero el paralelismo a nivel de instrucción lo busca la propia GPU (los warp schedulers) y no el driver. El driver busca en todo caso dependencias a nivel de thread pero no a nivel de instrucción, solo que, como he dicho antes, el driver tiene pequeñas optimizaciones para facilitar un poco el trabajo a los warp schedulers a la hora de buscar paralelismo a nivel de instrucción.

shep
22/04/2014, 21:20
resumiendo..

gtx 580 mas lenta que gtx 680/770 .... en gaming..
si hablamos de computo no tengo ni idea de como va el tema.. ademas el gf110 tiene los cudas al doble de velocidad del core y en cambio el gk104 lo tiene a la misma velocidad del core, por eso necesita mas cudas para hacer lo mismo..
pero vamos en gaming le da sopas con tortas el GK104 al GF110...
lo que tambien hay de cierto es lo del planificador de tareas por hard o por soft.. aunque de eso yo no entiendo mucho. eso concreto lo podria explicar OLIVER que el si lo tiene bastante papeado el tema..

Saludos.

Una 680/770 con el boost facil va de media a 1100/1150 de core y eso no es precisamente poco... una 580 va a algo mas de 1500 en los shaders, teniendo en cuenta que el gf104 tiene el doble de tmus y 3 veces mas shader luego para sacarle a la 580 25% en juegos de media... no diria que le da sopas con tortas xD

http://tpucdn.com/reviews/NVIDIA/GeForce_GTX_770/images/perfrel_1920.gif

Luego en temas de oc me consta que escala mas la 580.

La cosa es... ¿Tan buena es la arquitectura kepler vs fermi?

Oliver91
22/04/2014, 21:40
Una 680/770 con el boost facil va de media a 1100/1150 de core y eso no es precisamente poco... una 580 va a algo mas de 1500 en los shaders, teniendo en cuenta que el gf104 tiene el doble de tmus y 3 veces mas shader luego para sacarle a la 580 25% en juegos de media... no diria que le da sopas con tortas xD

http://tpucdn.com/reviews/NVIDIA/GeForce_GTX_770/images/perfrel_1920.gif

Luego en temas de oc me consta que escala mas la 580.

La cosa es... ¿Tan buena es la arquitectura kepler vs fermi?

En la gráfica se ve una diferencia de un 33%. El escalado, Kepler escala estupendamente, no me consta que las Fermi escalen mejor, ambas escalan igualmente bien... La diferencia en potencia de shaders es de un 50% a la misma frecuencia de core entre el GK104 y el GF110, pero bueno, también el GF100 tiene 48 ROPs vs los 32 del GK104 (que luego en la vida real rinden más los 32 ROPs del GK104 que los 48 del GF110, al menos en pruebas sintéticas).

No termino de entender tu duda, meter un 100% más cuda cores no significa obtener un 100% más de rendimiento por que el mundo no es ideal y al final en el interior de la GPU pasan cosas que hacen que el rendimiento no crezca de forma perfectamente lineal. Un buen ejemplo de que Kepler es mejorable lo tienes en las Maxwell (que a igualdad de Cuda Cores rinde más que Kepler), pero vamos, que nVidia lleva mejorando el IPC de sus GPUs desde que el GT200 substituyó al G80/G92. Kepler solamente es una Fermi a la que han quitado el hotclock para aumentar la eficiencia energética y resuelve las limitaciones de Fermi (TMUs...), no es que su arquitectura sea tan radicalmente diferente como lo que ha hecho AMD en el pasó a GCN respecto a VLIW.

shep
22/04/2014, 21:48
http://tpucdn.com/reviews/NVIDIA/GeForce_GTX_770/images/perfrel_1920.gif

Yo ahi veo 75% 580, 95% 680 y 100% 770 :/

Lo del hot clock si que habia leido bastantes veces que es lo que la hacia a las fermi (en gran parte) consumir energia como bestias y por eso lo sacaron en kepler, e imagino que no lo volveremos a ver.

Oliver91
22/04/2014, 21:52
Pues eso, 100/75= 33,34% ¿no? Y un 26,67% en el caso de la GTX680. Me refería a la GTX770 vamos, no se si tu hablabas de la GTX680.

shep
22/04/2014, 22:08
Me refiero a ambas, por que ahi la diferencia entre ellas no es mas que clocks mas altos entre ellas. Dudas no es que tenga demasiadas, pero estos dias con los drivers nuevos que me van francamente mal... me puse a buscar videos de gente probadolos en bf4 y algunos que e visto con sli 770 viendo la tasa de fps me a parecido que no tiraba tanto mas que el que tengo yo. Y ya buscando info de kepler me tope con ese comentario que me parecio interesante y lo e querido compartir para ver opiniones.

Oliver91
22/04/2014, 23:04
Me refiero a ambas, por que ahi la diferencia entre ellas no es mas que clocks mas altos entre ellas. Dudas no es que tenga demasiadas, pero estos dias con los drivers nuevos que me van francamente mal... me puse a buscar videos de gente probadolos en bf4 y algunos que e visto con sli 770 viendo la tasa de fps me a parecido que no tiraba tanto mas que el que tengo yo. Y ya buscando info de kepler me tope con ese comentario que me parecio interesante y lo e querido compartir para ver opiniones.

Hombre, las GTX770 son superiores a las GTX580 pero como ves la diferencia tampoco es estelar. Si quieres un buen cambio tus opciones son las GTX780/GTX780 Ti, esta última debería rendir igual o incluso algo más que tu SLI ella solita, la diferencia de rendimiento ronda el 80% a su favor en las gráficas de TPU, te quedas parecido en rendimiento eso si, no lo aumentas como con un SLI de GTX770 que pasarías a tener alrededor de un 35% más.

Es una faena que tengas problemas, por que si tienes el monitor de la firma la verdad es que para 1080 un SLI de GTX580 debe ir divinamente de rendimiento, lo digo por que igual te interesaba más saltarte las Kepler y esperar a que salgan las Maxwell, aunque parece que se van para finales de año.

fedezen
23/04/2014, 10:29
Si hoy pudiera comprar una gtx580 de 3gb nueva, lo haria por sobre cualquier otra opcion. Esta GPU con el adobe premiere y after effects es el combo perfecto.

tartaloo
23/04/2014, 18:33
Pues casualidades de la vida me he encontrado con esto en Pccomponentes:
http://www.pccomponentes.com/evga_geforce_gtx_570_1280mb_gddr5.html

GTX 570 a 318 eurazos.

¿Están tan caras por algún motivo que se me escapa o es una cagada de pccomponentes?

josrob536
23/04/2014, 20:31
Una 680/770 con el boost facil va de media a 1100/1150 de core y eso no es precisamente poco... una 580 va a algo mas de 1500 en los shaders, teniendo en cuenta que el gf104 tiene el doble de tmus y 3 veces mas shader luego para sacarle a la 580 25% en juegos de media... no diria que le da sopas con tortas xD

http://tpucdn.com/reviews/NVIDIA/GeForce_GTX_770/images/perfrel_1920.gif

Luego en temas de oc me consta que escala mas la 580.

La cosa es... ¿Tan buena es la arquitectura kepler vs fermi?

lo que pasa es que no puedes comparar mhz por mhz , por que kleper esta fabricado en un nodo mejor y es mas eficiente..
al final ese 35% que te menciona oliver con oc es mayor.... las kleper escalan no solo en core, si no que tambien en las memos.. es el oc de ambas cosas lo que le proporciona un buen escalado..

mira te dejo una captura mia de 3dmark 11 performance con un SLI de 770 para que puedas juzgar.. no tienen RL y estan subidas tal cual vienen con su disipador original..

http://i.imgur.com/a3lricV.jpg

Saludos..

shep
24/04/2014, 00:07
Esto es lo que dan las mias, 10k menos en gpu.... casi nada xD

http://i.imgur.com/uz1dhFR.jpg

josrob536
24/04/2014, 04:34
hay puedes ver el escalado de las kleper..

mira otra captura de un sli de 760 que tuve en el mismo test...

http://i.imgur.com/iohJrC0.jpg

cabe decir que esta de las 760 no era su maximo oc. lo que pasa que no conservo capturas con el maximo oc .. pero saltaban los 20000 puntos en gpu score..

Saludos..

shep
24/04/2014, 15:32
Tienes algo de ungine heaven guardado? o metro 2033, para comparar un poco mas. Tambien decir que parece que se este rebatiendo que el gk104 se peor que el gf110 o nose, y yo no pretendia esto... simplemente me encontre un comentario curioso sobre el funcionamiento de ambas arquitecturas y queria conocer opiniones aqui.

josrob536
24/04/2014, 16:31
Tienes algo de ungine heaven guardado? o metro 2033, para comparar un poco mas. Tambien decir que parece que se este rebatiendo que el gk104 se peor que el gf110 o nose, y yo no pretendia esto... simplemente me encontre un comentario curioso sobre el funcionamiento de ambas arquitecturas y queria conocer opiniones aqui.

no no me mal interpretes..(igual es mi forma de expresarme, pero mi intencion es buena) solo digo que lo que dice oliver.. que en parte hay cosas ciertas , pero no como lo traducen..
el rendimiento del GK104 es mayor esta claro. y ademas escala mucho y overclokea mucho , tiene un proceso de fabricacion mas depurado..


ESte es el SLI de 770 con oc 24/7 sin tocar voltaje, tocando voltaje hacian mas de 1400 core..
como ves las temp siendo sli y son estupendas ...

creo firmemente que el salto de tu SLI a uno de 770 es muy notorio...


http://i.imgur.com/wrlW7kJ.jpg

Saludos.

shep
24/04/2014, 17:02
Si no fuese por la rl hace tiempo hubiese cambiado las 580, pero el siguiente salto que de a de ser manteniendo la rl y no voy a dejarme la pasta en unas 770 con sus bloques a estas alturas xDD

http://i.imgur.com/dGqlmEF.jpg

Incluso estoy encaprichado en probar una 6990 que siempre e querido y se ven bastantes en segunda zarpa. La rl me frena... gracias a dios.

josrob536
24/04/2014, 17:25
Si no fuese por la rl hace tiempo hubiese cambiado las 580, pero el siguiente salto que de a de ser manteniendo la rl y no voy a dejarme la pasta en unas 770 con sus bloques a estas alturas xDD

http://i.imgur.com/dGqlmEF.jpg

Incluso estoy encaprichado en probar una 6990 que siempre e querido y se ven bastantes en segunda zarpa. La rl me frena... gracias a dios.


yo no me plantearia ese cambio, tu sli para mi es mucho mejor que una 6990. tuve 3 6990... xD

vamos a ver es que en tu caso para la RL lo logico seria o esperar a maxwell o pillar una 780ti, para luego de segunda zarpa meterte la segunda..

una 780ti da 70 fps en heaven.. mas o menos .. dependiendo del oc que alcance... pero eso seria con el oc que hace la media, unos 1250 core y 7500 memos..

Saludos..

shep
24/04/2014, 18:39
probar no es cambiar.... solo probar jajaja

josrob536
24/04/2014, 19:05
probar no es cambiar.... solo probar jajaja

por probar si. mirame a mi las pruebo todas o casi todas...jejejejejejejeje..

Saludos..

Oliver91
24/04/2014, 19:46
El soporte de drivers de AMD para las HD6000 es de todo menos bueno, hace tiempo que tienen olvidadas sus GPUs no GCN así que yo que tu me ahorraba el probar la HD6990. Si me dijeras una HD7990 lo entendería más.

Kat
25/04/2014, 07:34
Cuando esten baratitas las 780 píllate dos, creo que es el cambio más interesante si ya tienes un SLI de 580, al menos para mi. Visto lo que presuntamente serán las GTX 880, ahora ya lo tengo claro. Y The Witcher 3 que será el nuevo destroza equipos lo podrá mover a tope, o eso espero, porque si un SLI de 780 no puede, directamente me retiro del mundillo pc gamer y me compro una Playstation 4.

Pero vaya, que no hay ninguna prisa, todavía estoy alucinando lo bien que se mueve Assassins Creed 4 y Crysis 3 a 1200p y con casi todo a tope en este viejuno equipo mio, comandado por el noble y siempre fiel i7 920, xDDDD