Les dades RMA del distribuïdor mostren un patró fascinant entre les GPU AMD i Nvidia

NV-vs-AMD Nvidia

Les bones dades de fiabilitat són molt apreciades en informàtica i són frustrantment difícils d’aconseguir. Ocasionalment, una empresa de tercers com SquareTrade publicarà les seves pròpies xifres, però aquests informes són escassos. En realitat, és impossible fer un seguiment de l’evolució d’un fabricant d’un any a l’altre sense un conjunt de criteris coherents i un seguiment plurianual. Recentment, el distribuïdor europeu Mindfactory va optar per compartir les seves dades RMA de GPU per als productes AMD versus Nvidia i els resultats són força interessants.

Abans he escrit sobre les dades de Mindfactory i estic disposat a utilitzar-les com a font d’aquest article, però vull destacar una advertència important per a la qual no tinc cap explicació. Segons a aquest conjunt de dades, Mindfactory va vendre molt pocs RTX 2070 i 2080, i només va enviar un grapat de SKU. Sospito que això implica que les dades només cobreixen els dotze mesos anteriors. Això és rellevant si traurem conclusions sobre l’edat relativa dels nodes de procés en què es van basar aquestes GPU. L'informe inclou 44.100 GPU AMD i 76.280 GPU Nvidia, i és probable que sigui una mostra estadísticament significativa de totes les targetes de canals minoristes venudes per qualsevol de les dues empreses a Europa durant el període de temps rellevant.



S'apliquen totes les advertències habituals. Mindfactory és un minorista europeu. No és una empresa nord-americana i les seves dades són una instantània del mercat total, res més. Aquests resultats no s’han de prendre com a determinants, s’han de llegir amb un gra de sal, el concurs no és vàlid a Alaska o Hawaii, no és necessària la participació; vegeu la botiga per obtenir més detalls, etc, etc.



A continuació, es detallen els plats per emportar d’alt nivell del gràfic, sense cap ordre concret:

  • Les GPU menys complexes i menys potents fallen amb menys freqüència que les GPU més complexes i més potents.
  • Les targetes de gamma mitjana i pressupost d’AMD sí no fallen més sovint que les targetes de gamma mitjana i pressupost de Nvidia.
  • Les GPU PowerColor AMD fallen més sovint que altres marques.
  • El RTX 2080 Ti és la GPU estadísticament amb més probabilitats de fallar. És l’única GPU amb taxes de fallada de dos dígits (un 11%) reportades per diversos proveïdors.
  • Les GPU de gamma alta AMD fallen més sovint, en termes absoluts, que les GPU Nvidia, fins i tot si eliminem l’impacte de PowerColor de les dades d’AMD. Tanmateix, la diferència és significativament menor si ho feu.

Fa uns anys, va sortir un informe que mostrava les taxes de fracàs entre els diferents tipus de RAM. Si algú ho recorda, envieu-me un enllaç; no he tingut sort de trobar l'article. El que va demostrar va ser que era més comú que el DRAM entusiasta de gamma alta fallés que les parts bàsiques de gamma baixa de la talla de Kingston o Crucial. Les taxes de fallades no es correlacionaven perfectament amb el rellotge, però a mesura que augmentava la velocitat del rellotge, també ho feia la taxa RMA. L’article que recordo no era l’estudi de Google 2009 ni el seguiment del 2012 i tampoc crec que fos l’estudi de Microsoft 2012. Es basava en maquinari de consum, no en tecnologia empresarial o de servidor. La qüestió era que el maquinari entusiasta que s’acostava al marge del que és possible té un índex de fallades més alt que les peces estàndard de pantà que estan ben dins dels marges de rellotge i tensió.



Dades de Mindfactory.de

Aquí veiem proves d’una tendència molt similar. Si suposem que aquestes dades cobreixen el juliol del 2019 al juliol del 2020, vol dir que Nvidia encara tenia problemes reals amb el RTX 2080 Ti quan la GPU tenia gairebé un any, molt després que l’empresa comencés a enviar la targeta. Per contra, si el conjunt de dades prové del llançament de Turing, voldria dir que tot el que fa és capturar ja conegut alta taxa de fallades de llançament per al RTX 2080 Ti.

M'agradaria tenir més dades sobre el RTX 2070 i 2080, ja que les dades limitades ho tenim fer han suggerit algunes taxes elevades de rendiment de les targetes Gainward per a les targetes RTX 2080 i KFA2 per a les RTX 2070. Les taxes de retorn RTX 2070 Super i RTX 2080 Super són excel·lents. Són excel·lents perquè Nvidia va tenir mesos per perfeccionar Turing, o van ser excel·lents des del principi? La resposta a aquesta pregunta impactaria significativament en la manera com interpretem les taxes de RMA més altes d’AMD, atès que el 5700 XT i el 5700 es van llançar en un nou procés de 7nm.



El fet que veiem una tendència cap a taxes de fracàs més baixes en GPU més simples i petites d’ambdues empreses és molt probable que sigui rellevant. La taxa de fallida més alta de l’RTX 2080 Ti s’adapta a això: el xip era un reticle-buster que va portar l’enginyeria al seu límit. Pel que fa als diferents índexs d’errors del fabricant, no tenim res més que preguntes. Per què el Gaming Z Trio RTX 2080 Ti de MSI tenia un percentatge de fallades de l’1 per cent amb 2 retorns (~ 200 GPU venudes), mentre que el MSI Lightning Z tenia un percentatge de fallades de l’11 per cent amb 14 retorns (~ 130 GPU venudes)?

La variació dràstica de les taxes de fallada de la GPU podria implicar les pràctiques de refrigeració del fabricant o bé reflecteixen el fet que una empresa va introduir nous models de GPU al llarg d’un any i aquestes targetes posteriors van fallar amb menys freqüència. Unes taxes de fallida més altes a les targetes AMD podrien reflectir el fet que AMD acosta les seves GPU a la vora de l’estabilitat o bé que els socis OEM d’AMD estiguin disposats a fer una mica més a prop les cartes AMD que a Nvidia perquè Nvidia té més autoritat i oportunitat de jugar a la pilota dura (i exigir que les seves GPU s’admetin adequadament). Un dels motius pels quals les plaques base AMD eren històricament menys fiables que les plaques Intel era que AMD no podia obligar VIA a corregir els seus errors (com el famós problema KT133A southbridge) ni exigir als proveïdors de plaques base que dediquessin una quantitat igual de temps de depuració i millora de la BIOS de la placa base AMD. ja que estaven disposats a invertir en plaques Intel. Aquí podria funcionar una dinàmica similar? Podria ser. La qüestió és que no ho sabem. Cap GPU Sapphire té un percentatge de fallades superior al 2% i un 2% coincideix amb qualsevol targeta Nvidia. Es tracta, doncs, d’un problema AMD o PowerColor, però si diem que és un problema PowerColor, el 2080 Ti era un problema de diversos fabricants o alguna cosa específic de Nvidia?

Per això, als fabricants no els agrada publicar dades de qualitat. Les preguntes generen preguntes generen preguntes. Fins i tot si sabéssim el període de temps rellevant, no sabríem quan es van fabricar les GPU Mindfactory venudes. Potser el minorista va obtenir una gran quantitat de GPU inicials de tota mena que van fallar i tots els percentatges de fallades actuals són bàsicament iguals (1-2 per cent) entre totes les targetes i els fabricants. Potser els índexs de fracàs han augmentat recentment perquè el COVID-19 va matar el control de qualitat i les empreses només fan tot el que poden vendre. Sense més informació, no ho podem saber, i és aquella 'més informació' que les empreses no volen lliurar en primer lloc.

Copyright © Tots Els Drets Reservats | 2007es.com