AMD clobbers Nvidia en el punt de referència actualitzat de Ashes of the Singularity DirectX 12

Fa aproximadament sis mesos, vam tractar el debut de Cendres de la singularitat, el primer títol de DirectX 12 que es va llançar de qualsevol forma. Quan falta només un mes per al llançament del joc, el desenvolupador, Oxide, ha llançat una nova versió important amb un punt de referència molt actualitzat dissenyat per imitar el joc final, amb recursos actualitzats, noves seqüències i totes les millores del Nitrous Engine. L’òxid s’ha cuinat des de l’estiu passat.

Ashes of the Singularity és un successor espiritual de jocs com Total Annihilation i el primer títol de DirectX 12 que mostra les GPU AMD i Nvidia que funcionen de costat a costat en una configuració multi-GPU.



La nova versió del joc llançada a la premsa ara permet fer proves de configuració de diverses GPU, però les limitacions de temps ens limiten a avaluar el rendiment general de les configuracions de GPU única. Amb el llançament d’Ashes en poc menys d’un mes, les dades que veiem avui haurien de ser bastant representatives de la jugabilitat final.



AMD, Nvidia i càlcul asíncron

Ashes of the Singularity no és només el primer joc de DirectX 12: també és el primer títol de PC que fa un ús extensiu informàtica asíncrona. El suport per a aquesta capacitat és una diferència important entre el maquinari AMD i Nvidia, i té un impacte significatiu en el rendiment del joc.

Una GPU que admet un càlcul asíncron pot utilitzar diverses cues d’ordres i executar aquestes cues simultàniament, en lloc de canviar entre gràfics i càrregues de treball de càlcul. AMD admet aquesta funcionalitat a través dels blocs Asynchronous Compute Engines (ACE) i HWS de Fiji.



AMD-HWS

L’arquitectura de Fiji. Els blocs HWS són visibles a la part superior

La computació asíncrona és, en un sentit molt real, l’arma secreta de GCN. Tot i que totes les GPU de classe GCN, des de l’HD 7970 original, poden utilitzar-la, AMD va quadruplicar el nombre d’ACE per GPU quan va construir Hawaii, i després va modificar el disseny de nou amb Fiji. Quan el R9 290 i el 290X utilitzen vuit ACE, Fiji té quatre ACE i dues unitats HWS. Cada HWS pot realitzar el treball de dos ACE i sembla que són capaços de realitzar treballs addicionals (però encara desconeguts).

L’estat i la naturalesa exactes de les capacitats de càlcul asíncrones de Nvidia encara no estan clares. Sabem que Maxwell de Nvidia no pot realitzar res com l'execució simultània que poden gestionar les GPU AMD. Maxwell pot beneficiar-se d'algunes càrregues de treball de càlcul asíncrones lleugeres, com fa a Fable, però els avantatges del maquinari Team Green són petits.



NV-Preemption

El suport de càlcul asíncron de Nvidia és limitat en comparació amb AMD

El motor nitrós que potencia Ashes of the Singularity fa un ús extensiu del càlcul asíncron i l’utilitza fins a un 30% de la càrrega de treball d’un marc determinat. Oxide ha declarat que creuen que aquest serà un enfocament comú en futurs jocs i motors de jocs, ja que DirectX 12 fomenta l’ús de motors múltiples per executar ordres de cues separades en paral·lel.

Configuració i rendiment de la prova:

Hem provat tant l’AMD Fury X com la Nvidia GeForce GTX 980 Ti en un sistema Haswell-E amb 16 GB de DDR4-2667 i Windows 10 amb totes les actualitzacions instal·lades. AMD va distribuir un controlador nou per a aquesta revisió; Nvidia no ho va fer; hem utilitzat el controlador WHQL 361.91, publicat el 16/02/2016 per a les nostres proves de rendiment.

Aquesta vegada ens vam limitar a les proves de DirectX 12, però a Anandtech va cobrir DX11. Les dades de rendiment allà suggereixen que tant AMD com Nvidia van millorar en tots els modes. Nvidia continua superant AMD a DX11 en comparació amb DX12, però la bretxa és molt menor del que era anteriorment. Com abans, però, DirectX 12 no proporciona a Nvidia cap millora del rendiment superior a DX11.

Hem provat Ashes of the Singularity en tres modes de detall: High, Extreme i Crazy i amb la computació asíncrona habilitada i desactivada per mesurar l'impacte sobre les targetes AMD versus Nvidia. La funció està habilitada per defecte.

Primer us mostrarem els resultats amb el càlcul asíncron activat i desactivat, després per resolució.

Ashes-1080p-Async Ashes-1080p-NoAsync

Amb un càlcul asíncron desactivat, el R9 Fury X d’AMD lidera la GTX 980 Ti un 7-8% en els tres nivells de detall. Tanmateix, activeu el càlcul asíncron i AMD rugirà, superant el seu homòleg Nvidia entre un 24-28%. En canvi, el rendiment de la GeForce GTX 980 Ti disminueix un 5-8% si s’activa la computació asíncrona. Això explica una mica de la bretxa entre els dos fabricants, però en cap cas la totalitat.

Passem a 4K i comprovem el rendiment allà:

Ashes-4K-Async

Ashes-4K-NoAsync

Sovint, les resolucions més altes han afavorit les targetes AMD, i això no és una excepció. Amb la computació asíncrona desactivada, les GPU AMD segueixen funcionant un 11-15% més ràpidament que les seves contraparts Nvidia. Activeu el càlcul asíncron i aquest buit es duplica: el Radeon R9 Fury X és ni més ni menys que un 31-33% més ràpid que el Nvidia GTX 980 Ti. Tenint en compte com el Fury X va lluitar per la porta, ha de ser un espectacle benvingut per a Team Red.

Les cendres de la singularitat estan esbiaixades?

Ashes of the Singularity és el primer joc DX12 del mercat, i el delta de rendiment entre AMD i Nvidia generarà controvèrsies pels fans de les dues companyies. No sabrem si els seus resultats de rendiment són típics fins que no veiem més jocs al mercat. Però, el joc és intrínsecament esbiaixat per afavorir l’AMD? Crec que no, per múltiples raons d’enclavament.

En primer lloc, hi ha el fet que Oxide comparteix el codi font del motor amb AMD i Nvidia i ha convidat a les dues empreses a veure i suggerir canvis durant la major part del temps que Ashes ha estat en desenvolupament. La Guia del revisor de l’empresa inclou el següent:

(W) hem creat una branca especial on els venedors no només poden veure el nostre codi font, sinó que fins i tot poden presentar els canvis proposats. És a dir, si volen suggerir un canvi, la nostra oficina els dóna permís per fer-ho ...

Aquesta branca es sincronitza directament des de la nostra branca principal, de manera que solen estar a menys d’una setmana de la branca de desenvolupament de programari principal interna més recent. Els IHV són lliures de fer les seves pròpies versions o de provar les gotes intermèdies que donem al nostre QA.

Oxide també aborda la qüestió de si s’optimitza directament per a motors específics o arquitectures gràfiques.

L’òxid s’optimitza principalment a nivell algorítmic, no per a cap maquinari específic. També ens encarreguem d’evitar les proverbials conegudes “mandíbules de vidre” que té tot el maquinari. Tot i això, no escrivim el nostre codi ni la nostra sintonia per tenir en compte cap GPU específica. Creiem que això suposa massa temps i hem d’executar amb una gran varietat de GPU. Creiem que el nostre codi és molt típic d'un joc de PC raonablement optimitzat.

Vam contactar amb Dan Baker d’Oxide per referir-nos a la decisió d’activar el càlcul asíncron per defecte per a les dues empreses i se’ns va dir el següent:

“El càlcul asíncron està habilitat per defecte per a totes les GPU. No volem influir en els resultats de les proves amb una configuració predeterminada diferent per IHV, us recomanem que proveu les dues maneres, amb i sense el càlcul asíncron activat. Oxide triarà el mètode més ràpid per defecte en funció del que estigui disponible per al públic a l'hora del vaixell '.

En segon lloc, sabem que la computació asíncrona té avantatges de les capacitats de maquinari que AMD ha incorporat a les seves GPU durant un molt de temps. La HD 7970 va ser la primera targeta d’AMD amb un motor de càlcul asíncron i es va llançar el 2012. Fins i tot es podria argumentar que dedicar l’espai de la matriu i l’esforç d’enginyeria a una característica que no seria útil durant quatre anys era una dolent idea, no bona. AMD ha afirmat constantment que alguns dels avantatges de les targetes antigues apareixerien a DX12 i que sembla ser el que està passant.

La computació asíncrona no forma part de l’especificació DX12, però és un mètode per implementar un motor múltiple DirectX 12. Els motors múltiples formen part explícitament de l’especificació DX12. La manera com s’implementen aquests motors pot afectar el rendiment relatiu entre AMD i Nvidia, però són un dels avantatges d’utilitzar DX12 en comparació amb les API anteriors.

Sincronització AMD-vs-NV

Taula i paper per Ext3h

En tercer lloc, cada investigació independent sobre aquest tema ha confirmat que AMD i Nvidia tenen capacitats de càlcul asíncrones profundament diferents. Les pròpies diapositives de Nvidia també ho il·lustren. Les targetes Nvidia no poden gestionar les càrregues de treball asíncrones de la manera que poden fer les AMD i les diferències entre el funcionament de les dues targetes quan es presenten amb aquestes tasques no es poden solucionar amb algunes optimitzacions ràpides del controlador o modificacions de codi. Membre del fòrum Beyond3D i programador de GPU Ext3h ha escrit una guia a les diferències entre les dues plataformes: és un treball en curs, però conté una quantitat important d’informació útil.

En quart lloc, Nvidia PR ha guardat silenci sobre aquest tema. Les preguntes sobre Maxwell i el càlcul asíncron han estat bombollant des de fa mesos; hem demanat informació addicional en diverses ocasions. Històricament, Nvidia respon ràpidament a informació incorrecta o malentesos, sovint fent enginyers o personal de la companyia amb una alta posició disponible per a entrevista. L’empresa té una merescuda reputació de ser proactiva en aquests assumptes, però no hem sentit res a través dels canals oficials.

En cinquè lloc i finalment, sabem que les GPU AMD sempre han tingut enormes capacitats de càlcul de la GPU. Aquestes capacitats no sempre s’han mostrat amb el màxim avantatge per diversos motius, però sí sempre va existir, esperant que els toquin. Quan Nvidia va dissenyar Maxwell, va prioritzar el rendiment de la representació; hi ha una raó per la qual els SKU Tesla de gamma alta de la companyia encara es basen en Kepler (també conegut com el GTX 780 Ti / Titan Black).

És just dir que el disseny de Nitrous Engine funciona millor amb el maquinari AMD, però no hi ha proves que el motor estigui dissenyat per desavantatjar el maquinari Nvidia o per evitar que les targetes Nvidia executin càrregues de treball amb eficàcia.

Conclusió

Cendres de la singularitat llança en un mes. Serà un punt de dades DX12 important durant almenys diversos anys, i encara no sabem si el canvi a aquesta API significa que més motors passaran a utilitzar càlcul asíncron o no. Sens dubte, és possible, sobretot tenint en compte que tant Xbox One com PS4 ja poden fer ús del càlcul asíncron.

De moment, es recomana tractar aquests resultats com un exemple interessant de com una nova API pot obrir capacitats de rendiment i donar vida a un maquinari antic. Tot i que les limitacions de temps ens van impedir provar targetes AMD o NV antigues, les dades que hem vist suggereixen que les GPU AMD veuen els avantatges del càlcul asíncron en tota la pila de productes de l’empresa. No és una cura miraculosa per a una targeta lenta, sinó que aporta un benefici sòlid.

Si ja teniu una targeta GeForce, us recomanem que espereu abans de sortir a comprar maquinari nou. Tant AMD com Nvidia tenen actualitzacions de 14 nm aquest any, i la classificació relativa podria canviar segons les arquitectures de les noves targetes. De moment, però, AMD sembla guanyar més del canvi DX12 del que ho fa Nvidia: el Fury X és un títol absolut a Cendres de la singularitat.

Copyright © Tots Els Drets Reservats | 2007es.com