Analizing Bulldozer: per què el xip d’AMD és tan decebedor

AMD FX swoosh i Bulldozer moren

AMD’s Bulldozer és finalment per aquí, després d’anys de desenvolupament, i el seu rendiment és significativament pitjor del que ningú esperava. La situació és prou lletja com perquè pugui explicar per què tants executius van deixar AMD durant els darrers dotze mesos i per què l’empresa es va mostrar tan tancada amb la seva sortida. L’actuació general de Bulldozer ha estat àmpliament cobert; el nostre objectiu aquí és aprofundir Per què la CPU funciona com ho fa en lloc de cobrir-la en una àmplia gamma d'escenaris del món real.

Nota: El Turbo Core d’AMD i el Mode Turbo d’Intel es van desactivar en tots els xips, per tal d’evitar que ajustessin la velocitat de rellotge de la CPU i produïssin resultats. Com a conseqüència, els resultats aquí seran més baixos que en una revisió estàndard, en particular per al rendiment d'un fil.



El primer que s’ha d’entendre sobre Bulldozer és que s’utilitzen aspectes de multi-threading simultanis per combinar les funcions del que normalment serien dos nuclis discrets en un sol paquet (AMD es refereix a aquesta combinació com a “mòdul“). Cada mòdul conté allò que Windows identifica com a dos nuclis, però la combinació de la programació d’instruccions i els recursos de la CPU té un impacte en l’escala de la CPU en proves multi-thread quan es compara amb els mateixos programes que s’executen en processadors multi-core “tradicionals”.



AMD Bulldozer

Quan AMD va dissenyar Bulldozer, pretenia una CPU que fos més fàcil de pujar a freqüències més altes mantenint el mateix IPC (instruccions per cicle de rellotge) que el seu predecessor de sis nuclis. Per tal d’arribar a velocitats de rellotge més altes, AMD va allargar la canonada de la CPU i va augmentar les latències a tota l’arquitectura. El concepte de construir fitxes per a una freqüència més alta ha tingut un mal rap des del desastrós Prescott Pentium 4; després de veure el rendiment general de Bulldozer, la decisió d’AMD de fer aquesta ruta potser no ha estat molt bona. Tal com estan les coses, el FX-8150 lluita per superar Thuban en diverses proves, mentre que el seu IPC definitivament va tenir un èxit.



AMD Bulldozer

Abans d’explorar l’arquitectura de la CPU, però, hi ha un factor del sistema operatiu a discutir. Segons AMD, Windows 7 no entén molt bé l’assignació de recursos de Bulldozer. Windows 7 'veu' vuit nuclis de CPU independents, tot i que cada mòdul comparteix recursos de planificació i d'execució. De vegades té més sentit girar fils a nuclis inactius abans de programar-los en nuclis que ja estiguin ocupats amb una altra cosa. Altres vegades, és millor fer girar dos fils relacionats al mateix nucli. El Windows 8 aparentment serà molt més competent en la programació de càrregues de treball on tingui el màxim sentit executar-les.

Aquest problema té un impacte pràctic en el rendiment de la CPU a causa de la manera com s’implementa el Turbo Core d’AMD. El nou sabor de Turbo Core pretén augmentar la velocitat màxima del rellotge fins a dos graus de velocitat si només hi ha quatre nuclis habilitats. Com que Windows 7 no entén quins nuclis s'ha d'apagar, però, és menys probable que la CPU augmenti la seva velocitat de rellotge tan alt com ho faria d'una altra manera. Intel va introduir originalment les velocitats 'Turbo' com una manera de treure més rendiment de les càrregues de treball de fils lleugers o de fils únics, però l'arquitectura de Bulldozer fa que els megahertzs ​​addicionals siguin particularment importants.



Rendiment AMD Bulldozer

Rendiment AMD Bulldozer

Hem comprovat l’impacte del programador de Windows 7 mesurant el rendiment de la CPU a Maxwell Render 1.7 i Cinebench 11.5. Tots dos programes permeten a l'usuari definir un nombre específic de fils (quatre, en el nostre cas). L'etiqueta 4M / 8C significa que els vuit nuclis estan actius, 4M / 4C significa que els quatre mòduls són actius, amb un nucli operatiu per mòdul, i 2M / 4C indica una configuració de mòdul dual / quad-core. Ambdues proves mostren una disposició 4M / 4C que supera el sistema 4M / 8C aproximadament un vuit per cent quan s’utilitzen quatre fils. Això suggereix que les ineficiències del planificador poden perjudicar el rendiment general de Bulldozer en càrregues de treball que no poden aprofitar els vuit nuclis.

Copyright © Tots Els Drets Reservats | 2007es.com