RTX 2080 vs. Radeon VII vs. 5700 XT: Renderització i rendiment de càlcul (actualitzat)

Pavilion_Barcelona-Feature

La major part de la nostra cobertura de GPU se centra en el costat del consumidor de l’empresa i en la comparació de jocs, però vaig prometre examinar el costat de càlcul del rendiment quan el Va llançar Radeon VII. Amb el 5700 XT va debutar recentment, vam tenir l'oportunitat de tornar a aquesta qüestió amb una nova arquitectura GPU d'AMD i comparar RDNA amb GCN.

De fet, la situació computacional general es troba en una cruïlla interessant. AMD ha declarat que vol ser un jugador més seriós en entorns de càlcul empresarial, però també ha dit que GCN continuarà existint al costat de RDNA en aquest espai. El Radeon VII és una variant de consum de l’accelerador MI50 d’AMD, amb suport FP64 a mitja velocitat. Si sabeu que necessiteu un càlcul FP64 de doble precisió, per exemple, el Radeon VII omple aquest nínxol de manera que cap altra GPU en aquesta comparació ho fa.



Gràfic AMD versus Nvidia



El Radeon VII té l’amplada de banda de RAM més elevada i és l’única GPU en aquesta comparació que ofereix un gran rendiment en doble precisió. Però, tot i que aquestes GPU tenen especificacions en paper relativament similars, hi ha una variació significativa entre elles en termes de rendiment, i les xifres no sempre es trenquen de la manera que es pensaria.

Un dels principals punts de conversa d’AMD amb el 5700 XT ara Navi representa una arquitectura GPU fonamentalment nova. El 5700 XT va demostrar ser moderadament més ràpid que el Vega 64 en les nostres proves sobre el costat del consumidor de l’equació, però també vam voler comprovar la situació en el càlcul. Tingueu en compte, però, que la novetat del 5700 XT també funciona contra nosaltres una mica aquí. És possible que calgui actualitzar algunes aplicacions per aprofitar al màxim les seves funcions.



Pel que fa a Blender 2.80

Els resultats de les nostres proves contenen dades de tots dos Batedora 2,80 i el referent autònom de Blender, 1.0 beta2 (llançat a l'agost de 2018). Blender 2.80 és una versió important de l'aplicació i conté una sèrie de canvis significatius. El punt de referència independent no és compatible amb la família RTX de Nvidia, cosa que va fer necessària la prova amb la versió més recent del programari. Inicialment, vam provar el Blender 2.80 beta, però la versió final va caure, de manera que vam abandonar els resultats de la beta i vam tornar a provar.

Imatge de Blender

Hi ha diferències significatives de rendiment entre el punt de referència Blender 1.0beta2 i el 2,80 i una escena, Classroom, no es renderitza correctament a la nova versió. Aquesta escena s'ha eliminat de les nostres comparacions de 2,80. Blender permet a l'usuari especificar una mida de mosaic en píxels per controlar quant es treballa l'escena alhora. El codi dels fitxers Python del punt de referència Blender 1.0beta2 indica que la prova utilitza una mida de mosaic de 512 × 512 (coordenades X / Y) per a les GPU i 16 × 16 per a les CPU. La majoria dels fitxers d’escena que realment es troben dins del punt de referència, però, utilitzen una mida de mosaic de 32 × 32 per defecte si es carreguen a Blender 2.80.



Hem provat Blender 2.80 en dos modes diferents. En primer lloc, hem provat totes les escenes compatibles amb la mida de mosaic predeterminada de les escenes carregades. Aquest va ser 16 × 16 per a Barbershop_Interior i 32 × 32 per a la resta d’escenes. A continuació, hem provat els mateixos renderitzats amb una mida de mosaic predeterminada de 512 × 512. Fins ara, la regla amb mides de mosaic era que les mides més grans eren bones per a les GPU, mentre que les mides més petites eren bones per a les CPU. Sembla que això ha canviat una mica amb Blender 2.80. Les GPU AMD i Nvidia mostren respostes molt diferents a mides de rajoles més grans, amb GPU AMD accelerades amb mides de rajoles més altes i les GPU Nvidia perden rendiment.

Com que els fitxers d'escena que estem provant s'han creat en una versió anterior de Blender, és possible que això afecti els nostres resultats generals. Hem treballat extensament amb AMD durant diverses setmanes per explorar aspectes del rendiment de Blender a les GPU GCN. GCN, Pascal, Turing i RDNA mostren un patró de resultats diferent en passar de 32 × 32 a 512 × 512, amb Turing perdent menys rendiment que Pascal i RDNA obtenen més rendiment en la majoria de les circumstàncies que GCN.

Tots els nostres GPU es van beneficiar substancialment no utilitzant una mida de rajoles 16 × 16 per Barbershop_Interior. Tot i que aquesta prova té un valor predeterminat de 16 × 16, no es renderitza molt bé a la mida de mosaic de cap GPU.

Resoldre problemes relacionats amb els diferents resultats que hem vist al Blender 1.0Beta2 comparat amb el Blender 2.80 beta i, finalment, el Blender 2.80 final ha mantingut aquesta revisió durant diverses setmanes i hem canviat diversos controladors AMD mentre hi treballàvem. Per tant, tots els nostres resultats de Blender 2.80 s’han executat amb Adrenaline 2019 Edition 19.8.1.

Configuració de la prova i notes

Totes les GPU es van provar en un sistema Intel Core i7-8086K mitjançant una placa base Asus Prime Z370-A. El Vega 64, el Radeon RX 5700 XT i el Radeon VII es van provar amb Adrenalin 2019 Edition 19.7.2 (16/07/2019) per a tot però Batedora 2,80. Totes les proves Blender 2.80 es van executar amb 19.8.1 i no amb 19.7.2. El Nvidia GeForce GTX 1080 i el Gigabyte Aorus RTX 2080 es van provar amb el 431.60 Game Ready Driver de Nvidia (23/07/2019).

CompuBench 2.0 executa GPU mitjançant una sèrie de proves destinades a mesurar diversos aspectes del seu rendiment de càlcul. Tanmateix, Kishonti, desenvolupadors de CompuBench, no sembla oferir cap desglossament significatiu sobre com han dissenyat les proves. La simulació de conjunts de nivells pot referir-se a l’ús de conjunts de nivells per a l’anàlisi de superfícies i formes. La subdivisió Catmull-Clark és una tècnica que s’utilitza per crear superfícies llises. Les simulacions de cos N són simulacions de sistemes de partícules dinàmiques sota la influència de forces com la gravetat. El flux òptic TV-L1 és una implementació d’un mètode d’estimació de flux òptic, utilitzat en visió per computador.

SPEC Workstation 3.1 conté moltes de les mateixes càrregues de treball que SPECViewPerf, però també té càrregues de treball addicionals de càlcul de GPU, que es descriuran per separat. Un desglossament complet del prova de l'estació de treball i la seva suite d'aplicacions es pot trobar aquí. SPEC Workstation 3.1 es va executar en el seu mode de prova nativa 4K. Tot i que aquesta prova no es va enviar a SPEC per a la seva publicació formal, les nostres proves de SPEC Workstation 3.1 van complir les normes establertes per a la prova de l’organització, que es pot trobar aquí.

GPU Nvidia sempre es feien proves amb CUDA quan CUDA estava disponible.

Hem preparat dos conjunts de resultats: una sèrie sintètica de benchmarks, creada amb SiSoft Sandra i que investiga diversos aspectes de la comparació d’aquests xips, inclosa la potència de processament, la latència de la memòria i les característiques internes, i un conjunt més ampli de proves que toqueu el rendiment de càlcul i representació en diverses aplicacions. Atès que les proves de SiSoft Sandra 2020 són exclusives d’aquesta aplicació, hem optat per dividir-les en la seva pròpia presentació de diapositives.

Els resultats de Gigabyte Aorus RTX 2080 s’han de llegir com a aproximadament equivalents a un RTX 2070S. Les dues GPU tenen un rendiment gairebé idèntic en les càrregues de treball dels consumidors i també haurien de coincidir entre elles a l’estació de treball.

SiSoft Sandra 2020

SiSoft Sandra és una utilitat d'informació del sistema d'ús general i un conjunt d'avaluació de rendiment complet. Tot i que és una prova sintètica, probablement sigui la utilitat d’avaluació sintètica més completa disponible i Adrian Silasi, el seu desenvolupador, ha estat dècades refinant-la i millorant-la, afegint noves funcions i proves a mesura que evolucionen les CPU i les GPU.

A continuació es mostren els resultats específics de SiSoft Sandra. Alguns dels nostres resultats d’OpenCL són una mica estranys pel que fa al 5700 XT, però segons Adrian, encara no ha tingut l’oportunitat d’optimitzar el codi per executar-lo al 5700 XT. Considereu que aquests resultats són preliminars –interessants, però potser encara no indicatius– pel que fa a la GPU.

Els nostres punts de referència de SiSoft Sandra 2020 apunten principalment en la mateixa direcció. Si necessiteu punt flotant de doble precisió, el Radeon VII és un monstre de càlcul. Tot i que no està clar quants compradors pertanyen a aquesta categoria, hi ha certs llocs, com ara el processament d’imatges i les càrregues de treball d’alta precisió, on brilla la Radeon VII.

El Radeon 5700 XT, basat en RDNA, fa menys per distingir-se en aquestes proves, però també estem en contacte amb Silasi pel que fa als problemes que ens hem trobat durant les proves. La millora del suport pot canviar alguns d'aquests resultats en els propers mesos.

Resultats de l'exàmen

Ara que hem abordat el rendiment de Sandra, anem a la resta de la nostra suite de referència. Els nostres altres resultats s’inclouen a la presentació de diapositives a continuació:

CompuBench20-Simulation2

Conclusions

Què ens diuen aquests resultats? Un munt de coses força interessants. En primer lloc, RDNA és francament impressionant. Tingueu en compte que hem provat aquesta GPU en aplicacions professionals i orientades al càlcul, cap de les quals no ha estat actualitzada ni corregida per funcionar-hi. Hi ha senyals clars que això ha afectat els nostres resultats de referència, incloses algunes proves que no funcionarien o es van executar lentament. Tot i això, el 5700 XT impressiona.

Radeon VII impressiona també, però de maneres diferents de la 5700 XT. SiSoft Sandra 2020 mostra l’avantatge que aquesta targeta pot aportar a les càrregues de treball de doble precisió, on ofereix molt més rendiment que qualsevol altra cosa del mercat. La intel·ligència artificial i l’aprenentatge automàtic s’han convertit en molt més importants darrerament, però si esteu treballant en una zona on la doble precisió de la GPU és fonamental, Radeon VII compta amb una gran quantitat de potència de foc. SiSoft Sandra inclou proves que es basen en D3D11 en lloc d'OpenCL. Però tenint en compte que OpenCL és el principal competidor de CUDA, vaig optar per seguir-lo en tots els casos, excepte per a les proves de latència de memòria, que a nivell mundial mostraven latències més baixes per a totes les GPU quan s’utilitzava D3D en comparació amb OpenCL.

A les proves d’estacions de treball, com SPEC Workstation 3.1, el Radeon 5700 XT sol superar el Vega 64. És una comparació més estreta per a Radeon VII en molts aspectes, malgrat la immaduresa del controlador, l’amplada de banda de memòria més baixa i la memòria RAM inferior. Aquesta família de GPU hauria de tenir potencial al mercat de les estacions de treball, almenys a llarg termini.

AMD ha dit anteriorment que té la intenció de mantenir GCN al mercat per al càlcul, amb Navi orientat al mercat de consum, però no hi ha cap indicació que l’empresa tingui la intenció de continuar evolucionant GCN en una trajectòria diferent de RDNA. El significat més probable d’això és que GCN no serà substituït a la part superior del mercat de computació fins que Big Navi no estigui llest en algun moment del 2020. Segons el que hem vist, hi ha moltes coses per les quals entusiasmar-se en aquest front. . Ja hi ha aplicacions en què RDNA és significativament més ràpid que Radeon VII, tot i la gran diferència entre les targetes en termes de capacitat de doble precisió, amplada de banda de RAM i capacitat de memòria.

Blender 2.80 presenta una interessant sèrie de comparacions entre RDNA, GCN i CUDA. L’ús de mides de rajoles més altes té un impacte enorme en el rendiment de la GPU, però si aquesta diferència sigui bona o dolenta depèn de la marca de GPU que utilitzeu i de quina família arquitectònica pertanyi. Les GPU Pascal i Turing funcionaven millor amb mides de rajoles més petites, mentre que les GPU GCN funcionaven millor amb les de mida més gran. La mida de les rajoles de 512 × 512 era millor en total per a totes les GPU, però només perquè va millorar el temps de renderització total a Barbershop_Interior en més del que va perjudicar el temps de renderització de qualsevol altra escena per a les GPU de Turing i Pascal. La RTX 2080 va ser la GPU més ràpida dels nostres punts de referència de Blender, però el 5700 XT va obtenir uns resultats de rendiment excel·lents en general.

No vull fer declaracions globals sobre la configuració de Blender 2.80; No sóc expert en representació 3D. Aquests resultats de les proves suggereixen que Blender té un millor rendiment amb configuracions de mosaic més grans a les GPU AMD, però que les configuracions de mosaic més petites poden produir millors resultats per a les GPU Nvidia. En el passat, les GPU AMD i Nvidia s’han beneficiat de mides de rajoles més grans. Aquest patró també es podria relacionar amb les escenes específiques en qüestió. Si feu servir Blender, us proposo experimentar amb diferents escenes i mides de rajoles.

En última instància, el que suggereixen aquests resultats és que hi ha més variacions en el rendiment de la GPU en alguns d'aquests mercats professionals del que podríem esperar per als jocs. Hi ha proves específiques on el 5700 XT és notablement més ràpid que el RTX 2080 o el Radeon VII i altres proves en què queda molt enrere. La immaduresa del controlador OpenCL pot explicar alguna cosa d'això, però veiem llampades de brillantor en aquestes xifres de rendiment. El rendiment de doble precisió de la Radeon VII la situa en una classe pròpia en certs aspectes, però la Radeon RX 5700 XT és una targeta molt menys costosa i silenciosa. Segons quina sigui la vostra aplicació objectiu, la nova GPU d’AMD de 400 dòlars podria ser la millor opció del mercat. En altres escenaris, tant la Radeon VII com la RTX 2080 afirmen específicament i particularment ser la targeta més ràpida disponible.

La imatge característica és la representació final de l’escena Benchmark_Pavilion inclosa a la referència independent Blender 1.02beta.

Actualització (27/08/2019):El punt de referència SPEC Workstation 3.1 no notifica a l'usuari si la prova torna a tenir una resolució de sortida inferior a l'especificada. Això va provocar que els nostres resultats originals 5700 XT s’executessin a una resolució inferior a la prova 4K que preteníem. Aquests gràfics s’han actualitzat amb els resultats validats en 4K. El 5700 XT encara ofereix un rendiment impressionant en aquests modes, tot i que no acaba de trencar el cel de la manera que pensàvem que tenia. ET lamenta l'error.

Copyright © Tots Els Drets Reservats | 2007es.com