AMD revela una nova arquitectura GPU Radeon, amb el nom de codi Vega

Actualització: Una versió anterior d'aquesta història implicava que Vega tindria 128 nuclis per CU. Vega és capaç de realitzar 128 operacions de 32 bits per CU, però, atès que aquests màxims teòrics es calculen com a sumats multiples fusionats, les dades encara apunten a 64 nuclis per unitat de càlcul.

Fa més d’un any, AMD va establir una estratègia de dos eixos per actualitzar la GPU de 14 nm. En primer lloc, actualitzaria les seves GPU de gamma mitjana amb un nou maquinari de 14 nm basat en una GPU Graphics Core Next actualitzada, amb el nom de codi Polaris. Aquestes targetes de nivell mitjà i mitjà serien seguides per una actualització completa de gamma alta basada en un nou disseny de GPU, amb el nom de codi Vega. Polaris va arribar a l’hora prevista i va proporcionar un augment significatiu del rendiment a les zones on AMD ho necessitava més, però els detalls sobre Vega s’han anat materialitzant lentament.



Avui, això canvia. Encara no tenim el maquinari de revisió a la mà, però AMD finalment ha retirat la cortina i ha compartit informació significativa sobre què pot fer Vega i què canvia en comparació amb GCN. Vega utilitzarà memòria d’alta amplada de banda (HBM2) de segona generació en lloc de HBM o GDDR5. HBM2 ofereix dues millores substancials respecte a HBM: duplica la velocitat de dades per pin, cosa que significa que es proporciona 2x més amplada de banda de memòria en el mateix nombre de 'piles' i augmenta significativament la quantitat de RAM que pot cabre a cada pila. Si recordeu, HBM va superar les piles de 4x1 GB, o 4 GB de RAM en total. Això ja va suposar una mica de pressió per a la família Fury X d’AMD el juny del 2015, però HBM2 enderroca aquesta limitació.



Les targetes de consumidor amb HBM2 començaran probablement a 8 GB de RAM, amb la norma capaç de suportar almenys 32 GB. Qualsevol targeta amb tanta memòria RAM que aparegui el 2017 serà orientada a l'estació de treball o al servidor, però el marge lliure hi és quan AMD finalment la necessita per a targetes de consum. Els rumors que AMD llançarien tant una versió HBM2 com una GDDR5X de Vega semblen equivocats, de la mateixa manera que els rumors d’un Fury X de 8 GB en el període previ al llançament d’aquesta GPU que mai no es van materialitzar.

HBM-GDDR5



AMD, però, no només confia en HBM2 per obtenir memòria tradicional. Vega també introduirà dues noves funcions relacionades amb HBM2: una memòria cau d’alt ample de banda i un controlador de memòria cau d’alt ample de banda.

HBCC

L’HBC i l’HBCC ofereixen a Vega una gran memòria (en comparació amb les memòries cau on-die, encara que no es coneix la mida exacta) que pot utilitzar de diverses maneres. AMD encara no dóna els detalls exactes sobre el funcionament d’aquesta memòria cau, però l’objectiu és permetre el moviment de dades de gra fi i mantenir les dades importants locals a la GPU sense haver de treure-les de la memòria. També s’hi pot accedir sense aturar altres càrregues de treball; normalment la GPU s’aturarà si traieu les dades de textura de la memòria principal, mentre que l’HBCC d’AMD evita aquest problema.



El controlador de memòria cau d’amplada de banda alta proporciona 512 TB d’espai d’adreces virtuals i utilitza pàgines relativament petites per assegurar-se que la GPU s’alimenta de les dades que necessita en lloc d’una gran quantitat d’informació que finalment no s’utilitzarà. També hi ha algorismes per controlar la velocitat amb què es carreguen o desallotgen les dades de la memòria cau.

Comparació de jocs

Una de les idees errònies més freqüents sobre l'assignació de RAM de la GPU i la popular utilitat gratuïta GPU-Z és que GPU-Z és capaç de dir-vos quanta RAM és la GPU en realitat utilitzant. Com vam tractar per primera vegada en les nostres proves de si 4 GB de RAM eren suficients per al Fury X, és no. GPU-Z i totes les utilitats que informen de l’ús de VRAM a DirectX 11 no us poden dir quanta RAM utilitza la GPU perquè aquesta informació no la proporciona l’API DirectX 11. En lloc d’això, informen de la quantitat de RAM assignada per la GPU, no de si la GPU realment fa ús d’aquest VRAM. Com es mostra a la diapositiva anterior, la diferència entre la quantitat de VRAM assignada i la quantitat de VRAM que s’utilitza és força significativa, fins i tot en els títols populars. L’objectiu del clúster HBC + HBCC d’AMD és permetre a la GPU carregar i accedir a les dades de manera més eficient.

Hem reunit les següents diapositives, amb explicacions més breus, en una sola presentació de diapositives. Es pot fer clic a cada diapositiva per obrir una versió més gran a la seva pròpia finestra.

GeometryPipeline PrimitiveShaders LoadBalancing DrawStreamBinning

Coneix la NCU:

Des del 2012 fins a l’actualitat, les GPU d’AMD s’han construït al voltant de Graphics Core Next i les seves unitats de càlcul. Amb Vega, AMD estrena les seves Noves Unitats de Computació (NCU). Cada NCU encara oferirà 64 nuclis, però la flexibilitat addicional significa que les CU poden realitzar 512 operacions de 8 bits per rellotge, 256 operacions de 16 bits o 128 operacions de 32 bits.

RapidPackedMath

Les NCU poden empaquetar diverses operacions de 8 o 16 bits a la mateixa finestra d’execució, cosa que permet a la GPU duplicar o quadruplicar el seu rendiment segons la seva càrrega de treball. Entenem que l’ALU no es torna a configurar dinàmicament sobre la marxa, però pot executar instruccions d’amplada variable (1x 32 bits, 2 × 16 bits, etc.). Això dóna a AMD una mà potent per jugar en camps emergents com la IA o l’aprenentatge profund augmentant el rendiment.

NCU-Opt

Un dels punts febles de GCN era que el nucli afavoria dramàticament l'amplada respecte a la velocitat del rellotge. Va funcionar molt bé al començament de la seva vida, quan va competir contra Kepler i fins a cert punt amb Maxwell, però Pascal va donar a Nvidia una enorme quantitat de velocitat de rellotge que el disseny més ampli de l’AMD RX 480 no contrarestava eficaçment. AMD encara no publica les velocitats de rellotge objectiu ni les taxes IPC, però Vega està dissenyat per oferir millores en tots dos fronts, amb taxes de rellotge més altes. i major eficiència IPC.

RenderL2

Finalment, AMD connecta els ROP de Vega directament a la memòria cau L2. Això augmentarà el rendiment dels jocs que utilitzen la representació diferida, ja que permet que els fons de renderització de la GPU puguin escriure directament a L2 en lloc de moure primer dades per la memòria principal.

Pensaments finals

Hi ha moltes coses que encara desconeixem sobre Vega, incloses les TDP, el nombre de nuclis, el preu i les xifres de rendiment. AMD ha jugat les seves cartes a prop de la seva armilla tant amb Vega com amb Ryzen, només revelant informació a poc a poc. Encara no tenim data de llançament per a Vega: AMD ja havia dit H1, però també és possible que la companyia estigui jugant això prop del pit també. De moment, no són àrees on estic disposat a especular.

Pel que fa al propi disseny de la GPU, aquestes semblen el tipus de millores adequades que ha de fer Vega. Maxwell de Nvidia va suposar un gran salt d’eficiència sobre Kepler i es creu que el seu representat en mosaic va ser una gran part del motiu. AMD adopta aquest enfocament té molt sentit, mentre que la memòria cau i el controlador de memòria cau d’amplada de banda elevada de banda ofereixen funcions que fins ara no havíem vist en una GPU.

WholeBlock

Sabem que AMD necessitava IPC més alt i velocitats de rellotge més ràpides, i la companyia promet que Vega els lliurarà tots dos. Tot i que les xifres de rendiment no ens ho expliquen tot, poder emetre fins a 11 polígons per rellotge en lloc de quatre és una millora substancial del processament de la geometria, fins i tot abans de tenir en compte l’eficiència relativa.

Hi ha algunes altres parts interessants del diagrama de blocs, com el bloc 'Emmagatzematge en xarxa'. Això podria ser una referència al concepte SSD + GPU AMD presentat a SIGGRAPH 2016, o fins i tot a un grup d’emmagatzematge de baixa latència que no passa per la necessitat d’extreure dades mitjançant PCI Express. Mentrestant, l’amplada variable de l’ALU que admet dades de 8 bits, 16 bits i 32 bits dóna a AMD l’oportunitat d’emportar-la als mercats d’alta gamma HPC, AI i deep learning on Nvidia ha dominat fins ara.

Les especificacions de paper només ens poden dir tant i no em pronunciaré sobre el rendiment de l’equip verd contra el vermell fins que no tinguem el maquinari a la mà. Però, segons el que hem vist, AMD ha fet els moviments adequats amb Vega. Després de cinc anys amb GCN, AMD necessitava un enfocament dramàticament nou. Sembla que en tenen.

Copyright © Tots Els Drets Reservats | 2007es.com