IDF 2012 – Detalii picante despre Haswell

Scris de: , in categoria: Stiri, in 14 September, 2012.

IDF 2012 – Detalii picante despre Haswell

 

Haswell este cu siguranta cel mai asteptat subiect pentru cititorii Lab501, dar cum informatiile oferite de Intel au fost destul de evazive  am asteptat sa adun si cateva informatii “neoficiale” pentru a face lucrurile mai interesante.

Cum Windows 8 a fost dezvoltat de la inceput cu interfata touch in minte, asa Haswell a fost proiectat cu gandul la un consum cat mai mic. Inca de la Ivy Bridge, Intel a folosit tehnologia de Power Gating (oprirea de parti ale CPU-ului care nu sunt folosite in acel moment) pentru controller-ul de memorie, aceasta fiind pastrata in Self Refresh pana la noi ordine.

Cu Haswell insa lucrurile devin cu adevarat serioase, Power Gating-ul fiind acum prezent la nivelul intregului procesor. Ca acest lucru sa functioneze cum trebuie, Intel va integra on-die un controller VRM ce poate lucru cu mai multe tensiuni diferite in acelasi timp.

Pentru a reduce puterea consumata in IDLE de 20x cum a declarat anul trecul CEO-ul Intel, Paul Otellini, pe langa clasicele stari S0 (Active) si S3/S4 (Sleep) Haswell are o a treia stare numita S0ix (Active Idle). Procesorul se afla permanent in aceasta stare atunci cand este in IDLE, avand frecventa si voltaj redus precum si parti din el oprite (Power Gating). De remarcat ca este un proces strict hardware, acesta fiind 100% transparent pentru software.

Procesul de fabricatie tri-gate pe 22nm a fost si el imbunatit, primind optimizari pentru a reduce consumul de energie. Intel a lucrat de asemenea si la posibilitatea de a opri conexiunile I/O atunci cand acestea nu sunt folosite. Astfel conexiunile USB, SATA si PCI-Express vor fi de acum oprite sau vor trece automat intr-un mod de salvare a energiei. Toate aceste lucruri, impreuna cu posibilitatea de a suporta display-uri de tip Panel Self Refresh for face ca durata bateriei pe tablete, ultrabook-uri si notebook-uri sa fie semnificativ mai mare.

Arhitectura pe partea de CPU este bazata in mare masura pe cea a Ivy Bridge, dar primind cateva modificari menita sa aduca un spor de performanta, dintre acestea mentionez:

  • improved code fetch bandwidth
  • better branch prediction
  • larger Out-Of-Order window
  • larger L2 TLB
  • lower virtualization latencies
  • 2 new dispatch ports

Toate imbunatatirile de mai sus sunt importante dar trebuie sa vorbim in special de ultima. Datorita celor 2 noi porturi, Haswell poate executa acum 8 operatii / ciclu fata de doar 6 operatii / ciclu. Mai mult, Haswell poate executa acum doua operatii FMA per core comparativ cu una singura pentru Ivy Bridge.

Daca AVX ne oferea un spor semnificativ de performanta atunci cand rulam aplicatii ce aveau suport, acum cu Haswell vom beneficia de AVX2 (tehnologie denumita pana nu demult Haswell New Instructions). Fata de Ivy Bridge, Haswell va fi de 2 ori mai rapid ajungand la 32 FLOPS / ciclu / core in single precision si 16 FLOPS / ciclu / core in double precision. Impresionant, nu?

Dimensiunile si organizarea cache-urile L1 si L2 vor fi pastrate identic ca si la Ivy Bridge, in schimb latimea de banda se va dubla in cazul ambelor (cache-ul L2 putand face acum cate o citire in fiecare ciclu). Pentru a creste si mai mult performanta, Haswell va avea la dispozitie noi moduri de Turbo Boost si va avea optimizari pentru a face mai bine load balancing-ul intre nuclee.

Intel TSX (Transactional Synchronization Extensions) este o tehnologie ce aduce o mare flexibilitate programatorilor, micsorand printre altele posibilitatea aparitie a conflictelor la accesarea memorie. Intel TSX este compusa din 2 parti:

  • Hardware Lock Elision: XACQUIRE / XRELEASE – acestea sunt 2 prefixe ce sunt destinate pentru a fi compatibile cu procesoarele fara TSX
  • Restricted Transactional Memory: XBEGIN / XEND – reprezinta un set nou de instructiuni ce ofera flexibilitate pentru programatori

Primii pasi pentru o scalare a performantei placii video integrate a fost facuta o data cu Ivy Bridge si lansarea HD 2500 / HD 4000 anul acesta. Cum am explicat si atunci, partea grafica din Ivy Bridge a fost reproiectata pentru o modularitate crescuta astfel ca in viitor sa mai poata primi blocuri aditionale.

Partea de grafica si media din Haswell va primi mici imbunatatiri la majoritatea blocurilor importante pentru a putea continua scalarea performantei. Pentru a descarca driverul video de task-ul de a aloca comenzile intre diversele parti ale GPU-ului, Haswell va avea o unitate hardware dedicata numita Command Stream.

Daca in cazul Sandy Bridge si Ivy Bridge ring-ul functiona la aceeasi frecventa si la acelasi voltaj cu procesorul, in cazul Haswell el este decuplat complet de partea de CPU. Avantajele sunt multiple in acest caz: poate lucra la voltaj si frecventa mai ridicate fara a deranja in vreun fel CPU-ul, poate fi oprit la nevoie (Power Gating), etc.

 

 

Dupa cum se poate observa din slide-ul de mai sus, Haswell va avea 3 variante de placi video integrate: GT1, GT2 si GT3. Desi detaliile arhitecturale oficiale nu sunt disponibile momentan se pare ca GT1 va avea 1 bloc de procesare activ, GT2 va avea 2 blocuri active iar GT3 va fi cireasa de pe tort cu 4 blocuri de procesare active. Cum fiecare bloc s-ar parea ca are 10 unitati de executie active (EU), ar insemna ca GT1 ar avea 10 EU, GT2 20EU iar GT3 un impresionant 40EU (prin comparatie Ivy Bridge are 8 EU sau 16 EU).

Daca GT1 si GT2 vor continua trend-ul de performanta inceput de Intel o data cu SB si IB, GT3 va fi cu totul altceva tintind segmentul de performanta a placilor video discrete intre 200RON si 300RON. Pentru asta s-ar parea ca Intel a acordat o atentie deosebita varfului de gama GT3, adaugandu-i on-die o memorie cache de 64MB situata pe un interposer. Informatia nu este confirmata oficial de catre Intel, dar trebuie sa va spun ca GT3 este total altceva fata de orice grafica integrata de pana acum. Sistemele echipate cu Haswell care erau in cadrul conferintei rulau fara probleme jocuri DX11 in rezolutie FullHD (1920×1080) cu detaliile pe High.

 

 

In cazul platformei destinata ultrabook-urile am avut un demo in care avand aceeasi performanta grafica, sistemul cu Ivy Bridge consuma 17W in timp Haswell avea nevoie doar de 7.5W. Acestea fiind zise, ultrabook-ul cu procesor de 10W va deveni posibil o data cu lansarea Haswell anul viitor!

 

 

Intel nu a aratat nici o informatie oficiala privind performanta partii de CPU sau de overclocking, in schimb o sursa din industrie destul de sigura mi-a soptit ceva destul de interesant la ureche si cred ca v-ar place si voua sa aflati, nu? Asadar, se pare ca de ceva timp Intel are un laborator care se ocupa cu testarea procesoarelor Intel la temperaturi extreme (a se citi LN2).

Acest lucru l-am putut vedea chiar in martie inainte de lansarea Ivy Bridge, cand in prezentare am putut vedea faptul ca sursa de entropie a fost testata pentru o functionare pe LN2. Rezultatul l-am vazut in practica, overclocking lui Ivy Bridge pe LN2 fiind spectaculos toate recordurile fiind rapid intrecute. Eh, din testele interne se pare ca Haswell poate functiona fara probleme la 10GHz pe o placa de baza Intel… oare la cat ar ajunge pe o placa de baza destinata overclocking-ului? 🙂

 

Comentarii

6 comentarii la: IDF 2012 – Detalii picante despre Haswell

  1. Robert a scris pe:

    Interesante zvonurile intel, speram ca toate acestea sa se concretizeze. Sunt placut impresionat de performanta noilor IGP-uri, si tind sa cred ca atat ATI cat si NVIDIA se vor simti atacate. Ce se aude de numarul de nuclee, vom avea un octocore in zona Extreme / High-End?

  2. Ciupearca a scris pe:

    sper ca Intel sa dezvolte niste GPU-uri pentru Haswell care sa faca fata placilor video maintream (chiar sa le scoata de pe piata, oricum acolo se va ajunge in maxim 2 ani dupa cum se misca Intel), iar pretul placilor video high-end sa scada la adevarata lor valoare, adica 200-300 euro

  3. NewBreed a scris pe:

    Tudore sper ca i-ai “felicitat” pentru penalizarea pe care o suferim cand facem OC pe aer unui Ivy B!Poate reusesc si ei sa puna ceva de calitate in Die si IHS.

  4. In perspectiva, se mai aude ceva de acele procesoare cuantice?

  5. Marius a scris pe:

    nu cred ca vor fi scoase placile video mainstream din schema de aceste IGP-uri, chiar daca vor fi foarte performante vor fi tinute pe loc de memoria ram

  6. andrey a scris pe:

    Interesant. Totusi nu cred ca AMD va fi amenintat de GPU-urile celor de la intel. Noua generatie de APU-uri va fi pe 28nm si vor avea procesoare grafice din seria HD 7970(Trinity are are procesorul grafic din HD 6970). Nu cred ca au reusit mai mult de o egalarea a procesorului grafic din A10 5600 poate 5800.

Lasa-ne un comentariu: