AMD destrueix Nvidia a la mineria de Bitcoin, es pot superar mai la bretxa?

Logotip de Nvidia

Si normalment seguiu el rendiment de la GPU relacionat amb els jocs, però us heu interessat per la mineria de Bitcoin, probablement us haureu adonat i us ha sorprès el fet que les GPU AMD són els líders de rendiment incontestats del mercat. Això contrasta amb el negoci de gràfics de PC, on la sèrie HD 7000 d’AMD ha estat jugant un joc defensiu contra la família de productes GK104 / GeForce 600 de Nvidia. A la mineria de Bitcoin, la situació és gairebé invertida: el Radeon 7970 és capaç de fer 550MHash / segon, mentre que el GTX 680 és aproximadament 1/5 més ràpid.

Hi ha un article a la Wiki de Bitcoin que intenta explicar la diferència, però la peça original es va escriure el 2010-2011 i no s’ha actualitzat des de llavors. Es refereix a les arquitectures VLIW de Fermi i AMD i implica que el millor rendiment d’AMD es deu a tenir molts més nuclis de tonalitat que les targetes Nvidia equivalents. Això no és del tot precís i no explica per què el GTX 680 és més lent que el GTX 580 a la mineria BTC, tot i tenir molts més nuclis. En aquest article s’explicarà la diferència, es tractarà si els millors miners de CUDA canvien o no dramàticament el delta del rendiment entre AMD i Nvidia i es detalla si el rendiment de la GPGPU de Nvidia és generalment comparable o no als actuals.



Temes no aquí es discuteixen:



  • Bombolles
  • Oportunitat d’inversió
  • Ja siguin o no ASIC, quan arribin el mes que ve, aquest estiu, en el futur destruirà el mercat miner de GPU.

Són preguntes importants, però no són el focus d’aquest article. Nosaltres voluntat discutiu fins a un cert punt sobre l’eficiència energètica i el Mhash / watt, perquè aquests factors tenen un impacte en la comparació del rendiment miner d’AMD contra Nvidia.

La mecànica de la mineria

La mineria de Bitcoin és una implementació específica de l'algorisme SHA2-256. Una de les raons per les quals les targetes AMD excel·len en la mineria és perquè les GPU de l’empresa tenen diverses funcions que milloren el seu rendiment enter. En realitat, això és una cosa estranya; Les càrregues de treball de la GPU han estat històricament pesants en coma flotant perquè les textures s’emmagatzemen a la meitat (FP16) o al màxim (FP32).



El problema es fa més confús pel fet que quan Nvidia va començar a impulsar CUDA, va emfatitzar el trencament de contrasenyes com un dels punts forts de les seves cartes. És cert que les GPU GeForce, començant per G80, ofereixen un rendiment criptogràfic significativament superior a les de les CPU, però el maquinari d’AMD ara bufa el de Nvidia fora de l’aigua.

El primer motiu pel qual les targetes AMD superen els seus homòlegs Nvidia a la mineria BTC (i l’entrada Bitcoin actual) cobreix això) es deu a que l'algorisme SHA-256 utilitza una operació de rotació dreta de enter de 32 bits. Això significa que el valor enter es desplaça (explicació aquí), però els bits que falten es tornen a adjuntar al valor. En una rotació dreta, els bits que cauen de la dreta es tornen a connectar a l'esquerra. Les GPU AMD poden fer aquesta operació en un sol pas. Abans del llançament de la GTX Titan, les GPU Nvidia requerien tres passos: dos canvis i un complement.

Diem 'abans de Titan', perquè una de les funcions introduïdes per Nvidia amb Compute Capability 3.5 (només compatible amb el GTX Titan i el Tesla K20 / K20X) és un canvi d'embut. El canvi de embut pot combinar operacions, reduint significativament la penalització de 3 cicles Nvidia. Veurem quant millora el rendiment momentàniament, perquè aquesta no és l’única millora de GK110 respecte a GK104. El GK110 també és capaç de fer fins a 64 canvis enters de 32 bits per SMX (Titan té 14 SMX). En canvi, GK104 només podia gestionar 32 canvis enters per SMX i només tenia vuit blocs SMX.



Capacitat d

Hem destacat la diferència de capacitat de desplaçament enter de 32 bits entre CC 3.0 i CC 3.5.

AMD juga coses a prop del pit pel que fa a les capacitats enteres de 32 bits de Graphics Core Next (GCN), però la companyia ha confirmat que GCN executa el codi INT32 al mateix ritme que el punt flotant de doble precisió. Això implica una taxa teòrica d’enviament int32 màxima de 64 per rellotge per CU: el doble de la taxa base de GK104. L’altre avantatge d’AMD, però, és el gran nombre d’unitats de càlcul (CU) que formen una GPU. El Titan, com hem dit, té 14 SMX, en comparació amb els 32 CU de l’HD 7970. Les unitats de càlcul / SMX poden ser molt més importants que el nombre total de nuclis en aquests contextos.

Copyright © Tots Els Drets Reservats | 2007es.com