Intel Core i7: Nehalem sub microscop – partea 2

Scris de: , in categoria: Procesoare & Chipseturi, in 4 November, 2008.

Dupa introducerea facuta in partea 1 unde am stabilit care sunt imbunatatirile aduse de arhitectura Nehalem si la ce sa ne putem astepta in aplicatiile reale, a venit momentul sa punem procesoarele Core i7 fata in fata cu benchmark-urile.

Alegerea conditiilor de test nu a fost usoara si stabilirea listei finale de teste ce va fi rulata mi-a dat ceva batai de cap. Core i7 avand o orientare generala catre mediul industrial si fiind optimizat pentru o paralelizare masiva, am optat in final pentru o pondere mai mare a aplicatiilor ce scaleaza bine cu numarul de thread-uri disponibile. Mentionez asta pentru ca mai departe veti vedea diferente de performanta ce se intind pe o plaja larga de valori, si intelegerea motivelor pentru care Nehalem e mai rapid e importanta in cazul in care studiati articolul de fata in scopul unei viitoare achizitii.

Platformele de test utilizate au aratat in felul urmator:

Intel Core 2 Extreme Qx9770
GIGABYTE GA-X48T-DQ6
2x1GB Kingston KHX14400D3K2 (configurat ca DDR1600 8-8-8-20)

AMD Phenom X4 9950 Black Edition
GIGABYTE GA-MA790GP-DS4H
2x1GB Team Xtreem TXDD2048M1066HC5DC (configurat ca DDR1066 5-5-5)

Intel Core i7 Extreme 965
GIGABYTE GA-EX58-UD5
3x1GB Kingston KHX14400D3K2 (configurat ca DDR1333 9-9-9)

Componentele comune tuturor platformelor sunt cele doua placi video GIGABYTE 4870X2 in Crossfire, sursa de alimentare Coolermaster Real Power Pro 1250W si hard-disk-ul Western Digital AAJS de 160GB. Sistemul de operare e Windows Vista Ultimate 64-bit SP1, iar driverele video sunt Catalyst 8.10.

Desi departe de a fi complet riguros, am incercat sa amortizez putin diferentele dintre DDR2 si DDR3 respectiv dual si triple channel cu setari diferite ale memoriei. Majoritatea aplicatiilor nu sesizeaza oricum diferente consistente intre DDR1333 si DDR1600, insa mi s-a parut mai corect daca tot am introdus teste sintetice de latime de banda a memoriei.

Fiecare procesor a fost testat la frecventa default cat si la o frecventa la care se pot overclocka majoritatea exemplarelor fara probleme. 3Ghz pentru Phenom X4, 4Ghz pentru Core 2 si 3.73Ghz pentru Core i7 sunt valori accesibile pentru utilizare zilnica, fara a fi nevoie de tensiuni de alimentare exagerate sau sisteme de racire deosebite. Deasemenea, Core i7 a fost testat si cu optiunea de hyperthreading oprita, desi functia de overclocking automat turbo mode a ramas activa permanent.

Asadar, primul test la care am supus pe rand fiecare procesor e Cinebench 10, benchmark bazat pe o aplicatie profesionala si care evalueaza performanta multimedia, avand abilitatea de a folosi eficient toate cele 8 fire de executie disponibile in procesoarele Core i7.

Optimizarile lui Core i7 par sa functioneze foarte bine, si diferenta de performanta fata de predecesorul sau e consistenta la aceeasi frecventa chiar si cu hyperthreading-ul dezactivat. La activarea hyperthreading-ului insa Core i7 la 3.2Ghz e cu aproape 10% mai rapid decat Core 2 la 4Ghz.

Pov-Ray 3.7 beta masoara performanta in raytracing, avand acelasi tip de cerinte ca si Cinebench.

Evident, diferentele sunt asemanatoare si aici, cu un avantaj usor mai mare al lui Core i7.

Ramanand tot in sfera multimedia, urmatoarea misiune e recodarea unui fisier .avi cu ajutorul ultimei versiuni de DivX Converter la preset-ul de calitate Home Theater. Am folosit un fisier de 700MB ce continea spectacolul lui Chris Rock “Kill the Messenger” (foarte amuzant apropo, merita vazut), care are o durata de 80 minute.

Aici Core i7 impresioneaza si mai tare, aplicatia rulata e una intalnita des in conditii reale si diferenta de la 905 la 668 de secunde e masiva. Nu e vorba de cateva procente la un nivel teoretic, ci poate economisi timp si bani celor ce se ocupa de prelucrarea video de exemplu.

Tot ca aplicatie practica putem considera si necesitatea arhivarii unor fisiere cu WinRAR 3.8. Graficul reprezinta numarul de MB arhivati pe durata a 10 minute in benchmark-ul integrat.

Facand o scurta excursie in zona testelor pur sintetice, haideti sa vedem ce inseamna mai exact controller-ul de memorie tri-channel integrat al lui Core i7. Pentru asta vom folosi Everest Ultimate Edition ce ne arata exact largimea de banda a memoriei si latenta cu care poate fi accesata.

Avand in vedere ca am folosit memorii configurate ca DDR1333 9-9-9 si deja exista kituri DDR2000, acum e destul de clar de unde provine un mare spor de performanta al noii arhitecturi. Core i7 poate comunica cu memoria de aproximativ doua ori mai multe date in acelasi interval de timp raportat la Core 2, si intr-o aplicatie cum e arhivarea acest lucru e foarte important. Si latenta are rolul ei bineinteles, iar figura de mai jos ne arata cat de bine lucreaza tot subsistemul procesor-controller-memorie la Core i7.

Wprime e un benchmark croit special pentru platformele multicore, ce foloseste calcule matematice simple impartite in mod egal pe fiecare procesor disponibil. E ideal pentru a pune in evidenta avantajele unei arhitecturi cu posibilitati mari de calcule paralele.

SuperPi 1.5 face tot calcule matematice simple, masurand timpul in care poate determina un numar de zecimale ale lui Pi. Pentru calcularea a primului milion de cifre dupa virgula programul pune accent mai mult pe unitatile de executie ale procesorului, in timp ce pentru 32 e milioane de cifre determinate intr-un mod cat mai rapid e nevoie de un lucru cu memoria bun, pentru ca informatiile ce trebuiesc stocate, apelate si mutate devin mult mai voluminoase. Timpii in secunde ii aveti mai jos:

E o aplicatie single-threaded destul de imuna la optimizarile pentru paralelizare ale lui Core i7, fiind insa puternic influentata de rapiditatea nucleului in operatiuni simple.

Avand si acest segment de performanta acoperit, trecem la ceea ce multi dintre voi asteptati, si anume comportamentul in aplicatii 3D. Sau, mai putin pompos, “jocuri”. Buni indicatori al performantei in jocuri sunt benchmark-urile de la Futuremak. Suita lor e bogata, sa vedem intai 3DMark 06 cum incearca (inutil dealtfel) sa puna probleme lui Core i7.

Fiind un benchmark 3D influenta procesorului e diminuata de importanta mai mare a placilor grafice. Se poate vedea totusi in punctajul separat “CPU score” care e situatia dintre concurentii de astazi.

3DMark Vantage e mai recent decat 3DMark 06 si foloseste mai bine arhitectura moderna a lui Core i7, avand si un beneficiu mai mare la activarea hyperthreading. Aici e terenul lui Nehalem, o aplicatie moderna, complexa si care scaleaza bine:

World in Conflict e un joc complex de strategie ce are nevoie de un aport important al procesorului pentru a urmari fiecare unitate pe terenul de lupta. De fapt chiar si la rezolutia de 1920×1200 cu efectele puse pe High Detail, scorul e extrem de dependent de puterea procesorului, precum se vede in grafic.

Daca ar fi beneficiat si de avantajele hyperthreading-ului, probabil ca framerate-ul maxim ar fi fost in zona a 100fps.

Ultima suita de rezultate pe care o avem e performanta in Crysis Warhead, masurata cu Framebuffer Benchmarking Tool. Am folosit setarile 1680×1050 Mainstream DX10 pentru un balans care sa mentina o incarcare mica pe placile video si sa solicite mai mult procesorul, insa la comparatia rezultatelor intre platforme ceva anormal a iesit la iveala.

Ei bine, e evident ca ceva e in neregula si prima decizie (dupa ce am verificat si rerulat testele de cateva ori) a fost sa inlocuiesc Warhead cu un alt joc; apoi insa, am analizat mai atent. Core i7 965 e evident dupa toate standardele cea mai rapida solutie pentru desktop existenta la ora actuala; intre 3.2Ghz si 3.73Ghz diferenta nu exista in graficul de mai sus, ceea ce imi spune ca sistemul e deja limitat de alti factori. Si totusi, fie o problema a driverului ATI fie o optimizare discreta a jocului pentru un anume tip de procesor face ca rezultatele sa fie altele decat cele la care ne asteptam. Pai daca o asemenea circumstanta poate face diferenta de la 44 la 58 fps, in timp ce diferenta dintre cel mai slab si cel mai bun procesor din test e de la 35 la 44 fps, merita oare sa acordam atat de mare importanta procesorului pentru unele din jocurile moderne ? Mai ales in conditiile in care am folosit una din cele mai puternice solutii grafice existente, si anume doua HD4870X2 in CrossfireX, iar accentul pe procesor a fost pus deja prin setarile de rezolutie si calitate modeste.

Concluzie

Intel Core i7 e tot ceea ce ne am asteptat de la Nehalem, si ceva in plus. Vine cu o arhitectura moderna ce va fi baza urmatoarelor modele pentru multi ani de acum inainte, ofera imbunatatiri de performanta de la consistente pana la uimitoare si promite sa mai scoata cativa asi din maneca pe masura ce software-ul se va orienta si mai mult catre multi-threading.

Desi nu am atins aici performanta gaming foarte mult, in ultimele jocuri placile grafice actuale pot oferi tot ce au mai bun chiar si cu un procesor din generatia precedenta. Asta nu inseamna ca nu exista o imbunatatire, ci doar ca e posibil sa avem nevoie de acceleratoare grafice noi pentru a o scoate complet in evidenta.

Daca insa va intereseaza si altceva in afara de jocuri, atunci nici nu exista discutie. Core i7 e un salt important, e mai rapid pe toate planurile, are un sistem de power management excelent si are o arhitectura foarte scalabila.

Articolul se poate comenta si pe crazypc.ro >>

Comentarii

12 comentarii la: Intel Core i7: Nehalem sub microscop – partea 2

    1. darco_2 a scris pe:

      nu credeam ca voi vedea un test autohton atat de repede. Felicitari! Foarte util faptul ca ai comparat si cu un Qx9770 OC la 4ghz. Din cate vad din acele grafice i7 [email protected] fara HT activat, echivaleaza cu acel [email protected] aprox. 3800mhz. M-ar interesa, totusi, acel 3200mhz cu HT cu ce frecv. a aceluias procesor fara HT poate fi echivalat?

    2. Micutzu Post author a scris pe:

      Depinde foarte mult de aplicatie, daca poate folosi corect cele 8 thread-uri disponibile. De exemplu, performanta lui Core i7 la 3.2Ghz cu HT poate fi echivalata cu un Penryn la aproximativ 6Ghz intr-o situatie fericita pentru hyperthreading, cum e winRAR-ul. In situatiile in care multiplele fire de executie nu sunt folosite, cum e World in Conflict, Penryn overclockat sanatos poate tine pasul cu i7 965 default.

    3. Pacat ca ai testat 965 in loc de 920. Binenteles ca multi cititori sunt niste geeks (inclusiv eu in anumite limite) si ca numerele alea arata bine.

      Majoritatea oamenilor insa nu isi permit sa dea 1000 de euro ( aka vreo 9 salarii minime pe economie) pe un procesor.

    4. Adrian a scris pe:

      @ThunderM, a testat si omu’ ce a avut.

    5. Monstru a scris pe:

      Cred ca i920 va putea fi supratactat fara probleme la 3200MHz.

    6. giosi a scris pe:

      Cind apar la noi?
      La ce preturi?
      Deja salivez…i7 920 e pe gustul meu
      am vazut ceva la 1000 de bucati la 284 $….la noi cine stie

    7. giosi a scris pe:

      super aricolul…tineti-o tot asa

    8. Monstru a scris pe:

      Dupa mijlocul lunii ar trebui sa fie disponibile in retail, acum, bineinteles, depinde mult si de importatori. Referitor la pret, deobicei la noi se face conversia in euro, 1:1 cu dolarul. Probabil ca i920 va fi disponibil undeva in jurul sumei de 1100 RON.

    9. Xsulecu a scris pe:

      la fel de interesant ca prima parte

    10. Coco a scris pe:

      Salut,

      1. As fi interesat in domeniul audio profesional, in ce masura ajuta noile procesoare i7, la inregistrarile multitrack cu un soft ca Cubase, astfel incat sa nu mai fie probleme cu latenta ?

      2. Oare se va putea compara ca performanta/latenta, lucrul pe i7/CPU/Cubase, cu Pro Tools HD pe DSP , la lucrul in timp real, efecte + inregistrari multitrack ?
      3. Sa fie oare conceput si pentru a inlocui DSP-urile care sunt renumite la rularea mai multor aplicatii audio in timp real, fara probleme de latenta ?

    11. Monstru a scris pe:

      Salutare!

      Nu am testat noile procesoare in aplicatiile precizate de tine, deci nu putem emite o opinie legata de performanta in cazul folosirii unor aplicatii similare. Totusi, ca o parere personala, nu cred ca se pune problema inlocuirii DSP-urilor, acestea fiind procesoare dedicate.

    12. gabe_racer a scris pe:

      Cu intarziere citesc si eu review-ul vostru.Felicitari M1cutzu pentru munca depunsa!

    Lasa-ne un comentariu: