Core i7 920 vs Core 2 Quad Q9550 – performanta 24/7

Scris de: , in categoria: Procesoare & Chipseturi, in 26 November, 2008.

Fara indoiala, unul dintre cele mai importante evenimente ale anului a fost lansarea unei noi generatii de procesoare Intel. Genul acesta de evenimente are deobicei darul de a incita mintile pasionatilor, zvonuri si presupuneri despre performantele noii arhitecturi fiind vehiculate pe internet inca din primavara. Agitatia este justificata,  o noua lansare Intel insemnand de multe ori impunerea unor noi tehnologii, renuntarea la unele mai vechi, stabilirea tendintelor pietei in urmatorii ani, s.a.m.d. Lansarea lui Nehalem coincide cu un ramas bun adresat socket-ului LGA775, precum si memoriei DDR2 (cel putin pe platformele Intel). Evident, LGA775 va fi folosit ani de zile de acum inainte, la fel si memoriile DDR2, dar Intel nu va mai produce noi chipset-uri pentru aceasta platforma. Cu alte cuvinte, avem un nou socket, LGA 1366, DDR3 se impune intr-un final pe piata (in kit-uri de cate 3 stick-uri), putem realiza configuratii de tip  CrossfireX sau SLI pe aceeasi platforma, cu chipset Intel, Nvidia nu mai produce chipset-uri pentru platformele Intel, Hyper-Threading-ul revine, de data asta aducand un spor considerabil de performanta, nevoia de aplicatii care sa fie capabile de multi-threading devine si mai acuta, etc. Cam multe aspecte interesante pentru o singura lansare, nu-i asa?

Nu o sa insist asupra arhitecturii, aceasta a fost explicata pe larg de catre Razvan in partea 1 a trilogiei dedicata noilor procesoare. Daca nu ati citit deja acest articol, nu pot decat sa va invit sa o faceti acum, pentru a intelege mai bine articolul de fata. De asemenea, primul test cu Nehalm publicat in Romania il puteti gasi in partea a 2-a, cel mai puternic procesor al noii generatii fiind pus fata in fata cu cel mai puternic procesor al generatiei precedente. Desigur, daca majoritatea pasionatilor de IT de la noi ar fi putut sa scoata din buzunar suma necesara achizitionarii unui i965, articolul de fata nu ar fi avut sens. Din pacate nu am ajuns la acel nivel de trai, versiunea Extreme fiind un vis pentru multi. Din fericire, avem si doua variante mai ieftine si cred ca nu gresesc daca afirm ca i920 va fi cel mai vandut Core i7 in toata lumea. Pretul este piperat, dar nu il depaseste pe cel al Yorkfield-ului echivalent, prin urmare parerea mea este acesta va fi i7-ul care va poposi pe platformele majoritatii utilizatorilor care isi vor lua inima in dinti si vor trece la noua tehnologie.  Asa ca, a venit momentul sa uitam putin de variantele extreme si de configuratiile scumpe bazate pe mai multe GPU-uri si sa ne concentram asupra unor configuratii mai pamantene, care reflecta mai bine  posibilitatiile consumatorilor. Platformele de test utilizate (click pentru dimensiunea optima):

Am stat si m-am gandit destul de mult ce platforme sa aleg pentru test. Pentru ca testul sa fie cat mai util pentru marea masa a utilizatorilor, am incercat sa aleg componente mainstream pentru fiecare platforma. Pentru i920 am ales una dintre cele mai ieftine placi de baza disponibile pe piata in momentul redactarii articolului si anume solutia de referinta Intel DX58SO, botezata sugestiv “Smackover”. Nu ma intelegeti gresit, placa vine cu dotari foarte utile pentru overclocking si cu un pret pe masura, dar in momentul in care am inceput testele nu erau disponibile inca pe piata noastra variante mai ieftine; e posibil ca situatia sa se schimbe in urmatoarea perioada. Procesorul a fost racit cu ajutorul cooler-ului Noctua NH-U12P, turatia folosita pentru ventilator fiind cea stock, 1300 RPM. Pentru a reduce pe cat posibil impactul hard-disk-ului in anumite teste (in special cele multimedia) am folosit un drive SSD Intel X25 de 80GB.

Pentru a tine piept Nehalem-ului am ales procesorul echivalent, si anume Q9550. Ok, poate in momentul acesta credeti ca am imbatranit si am uitat ca i920 este tactat la 2,66GHz, in timp ce Q9550 se lauda cu 2800MHz din fabrica. Ei bine, nu este chiar asa. Q9550 chiar este tactat la 2800MHz dar … tot la aceeasi frecventa este tactat si i920. In momentul in care pornim platforma, lasand toate setarile pe Auto in Bios, TurboMode este activat. Din acest motiv, cele 4 core-uri ale lui i920 vor fi tactate la 2800Mhz in full load, multiplicatorul disponibil pentru i920 cu TurboMode activat fiind 21, spre deosebire de 20, multiplicatorul maxim in regim de functionare non-turbo. Tinand cont ca acestea sunt setarile stock, asa cum vine procesorul si placa de baza din fabrica (deci asa cum le vor folosi majoritatea celor care nu vor modifica setarile din BIOS) am considerat Q9550 ca fiind Yorkfield-ul echivalent ca frecventa. Trebuie sa fac totusi o precizare: ultimul bios pentru Smackover aduce o aditie in plus, si anume cresterea multiplicatorului in TurboMode la valoarea de 22 atunci cand este folosit un singur core. Deci, atunci cand toate 4 core-urile sunt incarcate, multiplicatorul folosit este 21, iar atunci cand numai un core este incarcat, multiplicatorul pentru acesta creste automat la 22. Un feature foarte util, pentru a pastra rigurozitatea testului nu am folosit acest bios, astfel incat frecventa lui i920 nu a depasit valoarea de 2800MHz nici chiar atunci cand am rulat teste single-core, gen SuperPi. Avand un pret similar (putin mai mare decat i920) Q9550 este cel mai bun companion pentru comparatie, oferindu-ne posibilitatea de a descoperi diferentele de performanta intre cele doua generatii de procesoare, dar intr-o categorie de pret accesibila unei mase mai mari de utilizatori. Din acelasi motiv am ales si placa de baza Gigabyte GX-X48T-DQ6, deoarece ofera o implementare accesibila ca pret a unei solutii bazate pe X48 si DDR3. In baza acelorasi considerente am ales si placa video, Gigabyte GTX260 216SP, o placa video de ultima generatie, cu o putere suficienta pentru a rula decent majoritatea jocurilor si un pret decent. Memoria folosita a fost aceeasi pentru ambele platforme, 2GB Mushkin Ascent,  dual-channel pentru X48 si Yorkfield, 3GB Mushkin Ascent, triple-channel pentru X58 si Nehalem.

Am facut cunostiinta cu protagonistii acestui test. Acum sa discutam putin despre metodologia de testare, in special despre setarile folosite. In ambele cazuri am folosit doua randuri setari. Fiecare procesor a fost testat la frecventa stock, setarile din Bios fiind lasate pe Auto.  Raportul maxim disponibil pentru memorii pentru i920 este 2:8. Folosind acest raport la setari stock obtinem frecventa de 1066, acesta fiind si unul dintre dezavantajele acestui procesor. Avantajul major fata de Yorkfield vine tocmai din arhitectura Nehalem, si consta intr-o latime de banda impresionanta, chiar si pentru aceasta frecventa. Logic, daca ne gandim la controller-ul de memorie integrat. In tabara X48 si Yorkfield, avem un alt avantaj, si anume frecventa mult mai mare la care acest chipset poate lucra cu memoria DDR3, fara nici un fel de efort. Astfel, frecventa aleasa pentru memorii este 1600. Initial nu am vrut sa “trisez”, insa, in momentul in care am vazut ca aplicarea setarii “Load Defaults” din Bios-ul placii Gigabyte are ca efect setarea FSB-ului la 400 si a multiplicatorului 7 (in loc de 8.5 x 333 cum ar fi fost normal) am ajuns la concluzia ca avem de-a face cu un feature (la fel ca si multiplicatorul crescut in cazul Bloomfield-ului) si ar trebui sa ne folosim de acest aspect. Astfel, am ajutat putin Yorkfield-ul, oferindu-i o latime de banda sporita. Cat de mult a contat acest fapt in comparatia cu Nehalem, vom vedea in teste.

Evident, nu puteam realiza un test fara a explora potentialul de overclocking al noilor procesoare. Astfel, dupa teste indelungate, am ajuns la o serie de setari dictate de comportamentul Bloomfield-ului, nu al Yorkfield-ului. Desi am putut overclocka  i920-ul peste 4GHz, frecventa la care acest procesor este stabil este sensibil mai mica. As fi putut rula testul la 3,6-3,7GHz, dar temperaturile raportate mi s-au parut destul de mari, si voltajele necesare pentru QPI si IOH erau destul de ridicate. Datorita acestor aspecte, am ales o frecventa pe care eu consider ca 99% dintre i920-uri si 99% dintre overclockeri o vor putea atinge fara probleme, si anume 3500MHz. Pentru corectitudinea comparatiei, Q9550 a fost tactat la aceeasi frecventa. De data aceasta nu am mai putut “trisa” pentru nici unul dintre concurenti, TurboMode fiind dezactivat din Bios, multiplicatorul maxim pentru i920 avand valoarea 20. De asemenea, datorita multiplicatorului mic al Q9550-ului, FSB-ul folosit, precum si frecventa memoriei, au fost asemanatoare cu cele folosite la frecvente stock.

Tinand cont de scop, am ales o suita cat mai variata de teste, atat dintre cele sintetice cat si aplicatii pe care le utilizam in viata de zi cu zi.  Am incercat sa aleg o serie de teste care sa raspunda intrebarilor tuturor utilizatorilor, fie ei profesionisti sau gameri inraiti. Pana la urma, chiar daca am citit deja teste comparative, cu totii ne intrebam cum se comporta Nehalem intr-o aplicatie sau alta, pentru ce merita sa il achizitionam, cat de mare este sporul de performanta adus, etc.. Va imbunatati performanta in jocuri? Va creste productivitatea in cazul aplicatiilor folosite de profesionisti? Va reduce timpul consumat de conversiile multimedia? O gramada de intrebari pe care un potential cumparator trebuie sa si le puna. Ei bine, voi incerca in testele de mai jos sa clarific cat mai multe aspecte si sa raspund majoritatii intrebarilor de acest gen. Una dintre cele mai importante componente ale industriei IT in momentul de fata este domeniul Multimedia. Fie ca vorbim despre utilizari casnice (cu totii convertim din cand in cand cate un DVD sau ajustam o poza) sau despre domeniul profesionist (grafica, DTP, encodare folosind un bit-rate ridicat , etc) aplicatiile multimedia sunt mari consumatoare de resurse si timp. Astfel, orice imbunatatire adusa in acest sens echivaleaza cu mai putin timp petrecut in fata calculatorului acasa si mai putin timp pierdut la birou.

DivX este cel mai popular codec folosit in momentul de fata. Am folosit ultima versiune disponibila pe site-ul producatorului. Pentru test am ales un fisier .VOB de 1GB. Acesta a fost convertit intr-un fisier divx cu o dimensiune de 280MB folosind preset-ul Home Theater. Am cronometrat si am notat durata operatiunii in secunde.

Diferentele sunt semnificative, Bloomfield-ul fiind capabil de a realiza aceasta operatiune sensibil mai repede decat omologul sau, Q9550. Tot la capitolul encodari intra si x264HD, dar la un nivel avansat, intrand in sfera profesionistilor. Acesta masoara puterea de encodare a procesorului folosind un set de fisiere standard pe care le encodeaza folosind un bitrate ridicat (~4MB/s). Scopul este obtinerea unui framerate cat mai mare .

Spre deosebire de DivX, x264HD aloca mult mai bine resursele, incarcand procesorul mult mai mult (in timpul unei encodari DivX core-urile sunt incarcate in proportie de 60%. In momentul encodarii cu x264HD, aceasta valoare tinde spre 100%). Astfel, diferenta dintre cele doua procesoare este semnificativ accentuata, i920 fiind cu ~20% mai rapid.

Liderul incontestabil al procesarii fotografiilor tocmai a beneficiat de un nou update, Adobe lansand pachetul Creative Suite 4. Photoshop CS4 aduce o serie de imbunatatiri, printre care si o mai buna procesare multi-core, dar si suport OpenGL pentru realizarea anumitor operatiuni cu ajutorul GPU-ului. Evident, optiunea de accelerare OpenGL a fost dezactivata in cadrul acestui test, pentru a nu influenta performanta celor doua procesoare testate.  Problema in cazul Photoshop-ului este dependenta de drive-ul de scratch, dar si de memoria RAM. In incercarea de a obtine rezultate cat mai elocvente pentru testul nostru, am folosit un test recomandat atat de DTP-isti cu experienta dar si de fotografi profesionisti. Astfel, am aplicat filtrul Radial Blur, Amount-100%,  Method – Spin, Quality-Best. Pentru teste am folosit 3 fotografii, de dimensiuni diferite. Astfel, pentru primul test am folosit o fotografie “etalon” pe forumurile profesionistilor (un BMP  la 2400×1800, al carui subiect este un frumos exemplar cabalin). Pentru al doilea test am folosit o fotografie realizata intr-un studio, folosind un aparat profesionist impreuna cu un digital-back Phase One P45+ cu o rezolutie de 45MP.  Pentru al treilea test am folosit un scan al unei picturi de Boticelli (Nasterea Afroditei), fisierul BMP avand o rezolutie de 11780×7320. Pe fiecare dintre cele trei imagini am aplicat filtrul Radial Blur, cu setarile descrise mai sus, si am cronometrat timpul necesar finalizarii operatiunii.

Din nou, diferenta poate fi observata foarte usor, i920 depasindu-si adevarsarul cu gratie. In cazul fotografiei etalon, dar si in cazul TIFF-ului, diferenta de performanta este semnificativa. Un aspect interesant intervine insa in cazul celei de-a treia imagini. Datorita dimensiunilor iesite din comun, se pare ca greul nu a mai cazut in sarcina procesorului, ambii concurenti obtinand rezultate asemanatoare.

Cinebench R10 nu mai are nevoie de nici o prezentare, Aceste foloseste un motor de randare, impreuna cu o scena predefinita, pentru a masura performantele procesorului in acest tip de aplicatii. Acest program este optimizat pentru procesarea multi-core, folosind la maxim toate nucleele disponibile.

Daca primul test foloseste un singur core al fiecarui procesor, testul xCPU dezvaluie adevarata  putere de calcul a procesoarelor testate. In acest tip de aplicatie Nehalem straluceste, diferentele obtinute fata de Q9550 fiind foarte mari.

Daca tot vorbim despre randari, nu puteam sa uitam POVRay, care evidentiaza performantele sistemului de calcul in raytracing. La fel ca si Cinebench, POVRay foloseste o scena predefinita pentru a masura performanta procesorului.

Graficul este destul de elocvent, sporul de performanta adus de Nehalem fiind urias.

Parasind momentan sfera multimedia, ne concentram atentia asupra unui program pe care il folosim cu totii zilnic. WinRAR, ajuns la versiunea 3.80, foloseste intensiv atat procesorul cat si memoria sistemului, viteza de arhivare/dezarhivare fiind direct proportionala cu performantele acestora.

Ei bine, de data aceasta diferenta este zdrobitoare, i920 avand performante duble fata de Q9550. Controller-ul integrat isi spune din nou cuvantul, iar rezultatele obtinute sunt pur si simplu extraordinare.

PCMark 2005  testeaza intregul sistem, simuland o serie de aplicatii cotidiene. Am rulat atat intreaga suita PCMark, cat si testele pentru procesor si memorie separat.

Datorita aportului placii grafice si a hard-disk-ului, diferentele in cazul rularii intregii suite de teste sunt evidente, dar nu iesite din comun. Situatia se schimba simtitor in cazul rularii testelor de procesor si memorie separat.

PCMark Vantage aduce testarea intregului sistem la nivelul anului 2008, complexitatea testelor fiind mult mai mare, la fel si durata lor. Astfel, de-a lungul a 26 de minute, au loc o serie de teste care incearca sa reproduca cat mai fidel cerintele unui sistem normal si anume office, gaming, internet si multimedia.

Nu avem de-a face cu o diferenta uriasa, mai ales in cazul frecventei stock, micul “cheat” al placii de baza Gigabyte avand un aport considerabil in obtinerea unui scor ridicat.

Tot in sfera testelor sintetice se incadreaza si Everest. Testele inglobate in cadrul acestui program vizeaza in mod special latimea de banda si performanta procesorului in calcule aritmetice.

Aici isi dezvalui noua arhitectura secretele, integrarea controller-ului in procesor avand un impact urias in lucrul cu memoriile, asa cum putem observa si in graficele de mai sus. Diferenta dintre cele doua platforme este uriasa, Nehalem fiind “built for the kill”.

Am rulat si doua dintre testele pentru procesor din cadrul suitei Everest, rezultatele confirmand  diferenta de performanta evidentiata de catre testele anterioare.

Un alt test sintetic interesant este PassMark Performance Test. Acesta foloseste o serie de teste destul de stufoasa, fiind incluse atat teste pentru procesor, memorie, placa video, HDD, unitatea optica, s.a.m.d.

WPrime 1.55 este unul dintre primele teste optimizate pentru procesare multi-core, numarandu-se printre putinele programe care chiar pot incarca la maxim 4 core-uri sau 8 core-uri, rezultatul scaland direct proportional cu numarul acestora. Scorul mai bun este cel mai mic.

Ei bine, se pare ca WPrime poate exploata si avantajele oferite de Hyper Threading, calcului fiind realizat in 4 threaduri in cazul Yorkfield-ului si in 8 threaduri in cazul Bloomfield-ului. Datorita acestui aspect, sporul de performanta este drastic.

Unul dintre cele mai indragite benchmark-uri este SuperPI. Micuta aplicatie ruleaza pe un singur core, dar scorul obtinut reflecta foarte bine performantele tehnologiei folosite, ansamblul procesor / controller / RAM fiind testat riguros cu ajutorul unui simplu calcul , Pi cu un numar specificat de zecimale. Evident, am rulat PI 1M (calcularea numarului cu un milion de zecimale). Timpul mai mic este mai bun, programul masurand timpul necesar calculului efectiv.

Timpul obtinut de i920 este foarte bun, insa tind sa cred ca in domeniul competitional E8600 va mai ramane ceva vreme de acum inainte in fruntea clasamentului, datorita frecventei uriase pe care o poate atinge (>6500MHz), arhitectura Nehalem nefiind chiar atat de puternica incat sa poata face fata diferentei foarte mari de frecventa (in momentul redactarii acestui articol, frecventa maxima obtinuta cu i965 folosind  azot lichid era 5400MHz).

Evident, nu puteau lipsi din test benchmark-urile 3D si jocurile, o mare parte din utilizatorii unui PC fiind pasionati de gaming. Am rulat intreaga suita 3DMark, dar si 4 jocuri actuale, pentru a vedea cum se comporta noua arhitectura in acest tip de aplicatii.

3DMark2001 nu mai are nevoie de nici o prezentare, fiind unul dintre cele mai complexe teste de procesor/memorii/placa video chiar si acum, la mai bine de 7 ani de la lansare.

Evident, Vista x64 penalizeaza serios performanta in aceasta aplicatie, diferentele fiind foarte mici intre cele doua procesoare. Chiar si asa, diferenta este suspect de mica si ceva nu pare in regula…. Asa ca, am rulat 3DMark2003 pentru a pune accentul mai mult pe performantele 3D. 2003 este cel mai putin influentat de procesor dintre toate cele cinci 3DMark-uri folosite in momentul de fata, asa ca nu ma asteptam la nimic spectaculos in momentul in care am inceput testele…

La ceva spectaculos nu ma asteptam, dar rezultatele testelor m-au uimit atat de tare incat am rulat benchmark-ul si pe Vista pe 32 de biti, pentru ambele procesoare…Ei bine nu, am refacut testele de mai multe ori, pe ambele sisteme de operare, si rezultatele au fost similare de fiecare data. In acest test, platforma bazata pe X48 si Yorkfield obtine de fiecare data rezultate mai bune. Tinand cont de ceea ce spuneam mai sus in legatura cu impactul scazut al procesorului in acest test, o idee incepe sa se contureze destul de clar, o idee neplacuta legata de noua arhitectura…Dar un singur benchmark nu constituie o baza solida pentru o argumentatie corecta, asa ca am continuat testele.

Fiind puternic dependent de procesor, 3DMark2005 aduce din nou avantajul de partea Nehalem-ului. Totusi, la frecventa stock, FSB-ul ridicat folosit pentru Q9550 isi face simtita prezenta, rezultatul fiind foarte apropiat de cel obtinut cu i920. Vazand rezultatele din cele trei teste de mai sus eram foarte curios de ce imi va dezvalui 3DMark2006…

Din nou FSB-ul crescut isi spune cuvantul, la frecventa stock Q9550 avand rezultate mai bune.  Situatie se remediaza in momentul in care overclockam procesoarele, dar pentru linistea mea sufleteasca am rulat si  pe Vista 32, deoarece diferenta mi se pare destul de mica….Sa aiba i920 performante mai slabe in 3D? Am aruncat repede un ochi la CPU score si m-am linistit…

i920 depaseste fara nici o problema Q9550-ul, scorul obtinut fiind de fiecare data mai bun. Bun, bun, dar ce se intampla, in cazul rularii la 2800MHz, i920 obtine un CPU score cu 500 de puncte mai bun decat Q9550, si totusi scorul per total este mai slab…Unde sa fie problema?

In momentul in care ne uitam la testele axate pe placa video, observam cu stupoare cum aceasta obtine rezultate mai bune impreuna cu platforma X48 + Q9550. Deci, desi CPU Score-ul obtinut de i920 este mai mare in toate cazurile, performantele placii video sunt putin mai slabe in momentul in care o folosim impreuna cu acesta….Ceea ce explica pe deplin si rezultatele obtinute in 3DMark2003.

Situatia se accentueaza in momentul in care rulam 3DMark Vantage. Scorul overall este mai bun pentru i920, CPU score-ul este urias fata de scorul obtinut de Q9550 (se pare ca si Vantage profita la maxim de Hyper Threading) dar scorul obtinut de placa video este mai mic cu 100 de puncte in defavoarea palformei X58/i920.

Am lasat la sfarsit jocurile, pentru a incerca sa elucidam comportamentul bizar al placii video impreuna cu platforma X58, si…pentru a va mentine interesul pana la sfarsitul testului. Am rulat 4 jocuri (Crysis Warhead, World In Conflict, FarCry2 si Company of Heroes), folosind doua setari. Pentru a pune accentul mai mult pe procesor, pastrand in acelasi timp factorul  realism , am folosit 1280×1024, cu Antialiasing dezactivat, si setarile de calitate la un nivel mediu (majoritatea userilor folosesc 1280×1024. Pentru a elimina pe cat posibil aportul placii grafice, puteam rula testele folosind 1024×768, dar cred ca foarte putini oameni se mai joaca folosind aceasta rezolutie, iar scopul testului este tocmai performanta in daily use). Pentru a testa in conditii cat mai apropiate de realitate, am folosit 1680×1050, cu AA maxim disponibil in fiecare joc, si setarile de calitate pe maxim. In toate testele am folosit DirectX 10.

Crysis Warhead este ce-a de-a doua aparitie a faimosului mancator de resuse, Crysis fiind unul dintre cele mai aratoase jocuri, dar si unul dintre cele mai slab optimizate dupa parerea unora. Pentru 1280×1024 am folosit setarile Gamer, no AA, iar pentru 1680×1050 am folosit preset-ul Enthusiast, AA 16x.

Dupa cum putem observa din grafice, nu exista nici o diferenta intre cele doua procesoare in acest test, rezultatele fiind limitate de placa video folosita, chiar si in cazul folosirii unei rezolutii mai mici. Deh…optimizarea despre care vorbeam mai sus…

World In Conflict  este recunoscut ca fiind puternic dependent de procesor, ceea ce se potriveste de minune cu scopul testului nostru. Am folosit preset-ul Medium in cazul 1280×1024, respectiv Very High, 16x AA pentru 1680×1050.

Stiind ca acest joc raspunde bine la sporul de performanta adus de procesor, in momentul in care am observat diferentele foarte mici dintre cele doua procesoare am rulat testul si in Vista 32 pentru a verifica inca odata rezultatele. Cu toate acestea, situatia nu se schimba, cele doua procesoare avand rezultate similare. Cunoscand deja comportamentul 3D al platformei X58 cred ca putem presupune ca aceste similitudini se datoreaza anularii sporului adus de procesor datorita comportamentului mai slab in 3D al platformei.

FarCry2 este unul dintre testele mele preferate. Jocul vine cu un utilitar de benchmarking bine pus la punct, dar si cu un engine foarte performant, Dunia reusind sa arata extraordinar fara a sufoca orice sistem care nu are cel putin doua GPU-uri. Setarile folosite au fost High, noAA, cu Fire, Physics si Real Trees pe Medium, pentru 1280×1024, respectiv Very High si AA 8X pentru 1680×1050.

De data aceasta avantajul este de partea Yorkfield-ului, acesta obtinand rezultate mai bune in cazul ambelor setari folosite. Diferenta este destul de mare, si cred ca acest test evidentiaza foarte clar o penalizare a performantei 3D in cazul platformei bazate pe i920.

Ultimul test este Company of Heroes, bazat pe engine-ul Essence Engine, care include suport pentru iluminare HDR (High Dynamic Range), Shader Model 3.0, normal mapping, iluminare si umbre dinamice. In cazul 1680×1050 am setat totul pe maxim, cu AA 16X, iar pentru 1280×1024 am folosit setari mai modeste si Antialiasing dezactivat.

Din nou framerate-ul este foarte asemanator. Merita remarcat sporul de performanta adus de Nehalem la frecventa stock.

Concluzii

Dupa acest maraton in care am pus la incercare ambele platforme intr-o serie destul de ampla de teste, a venit si momentul in care tragem linie si trebuie sa raspundem la o intrebare fireasca:

Bine, bine, dar ce inseamna toate astea?  Sa imi iau Nehalem sau nu?

Profesionistii sigur vor beneficia de pe urma trecerii la acest procesor, dar si utilizatorii normali care modifica imagini, randeaza scene 3D sau encodeaza material video in mod frecvent. In marea majoritate a testelor i920 reuseste sa se detaseze destul de clar de concurentul sau direct, deci sporul de performanta exista cu siguranta, si poate fi evidentiat cu usurinta intr-un numar destul de mare de aplicatii. Mai mult decat atat, nu pot decat sa sper ca industria software va tine pasul cu realizarile tehnologice, astfel incat sa avem parte de un numar cat mai mare de aplicatii optimizate pentru procesarea multi-threaded. In momentul in care se va intampla acest lucru, Nehalem se va detasa si mai mult de vechile generatii de procesoare. Momentan, nu as putea sa incadrez in aceeasi categorie si jocurile. Rezultatele obtinute in teste au confimat anumite presupuneri, diferenta dintre cei 12MB Cache Level 2 ai Yorkfield-ului si cei 8MB Cache Level 3 ai Bloomfield-ului inclinand balanta in jocuri in favoarea celui dintai. Desigur, in momentul in care folosim configuratii monstruoase de genul tri-SLI sau CrossfireX cu 4870X2-uri, limitarea impusa de procesor de accentueaza foarte mult, si banii mei sunt pusi pe Nehalem. Dar in cazul folosirii unui singur GPU, se poate observa cu usurinta penalizarea de performanta care apare in cazul platformei X58/Nehalem. Cel mai usor ar fi sa presupunem ca X58 nu este foarte rapid in 3D si stim cu totii faptul ca X48 este unul dintre cele mai rapide chipset-uri in acest gen de aplicatii, deci diferenta ar fi explicabila. De asemenea, am putea da vina pe implementarea celor de la Intel, dar ma indoiesc sincer de acest fapt. Oricum, vom testa majoritatea placilor de baza disponibile pentru Nehalem cat de curand, deci vom lamuri si acest aspect. Cred ca problema este putin mai complexa, si exista mai multi “vinovati” pentru acest lucru. Asa cum spuneam mai sus, diferenta dintre cache-ul celor doua procesoare este un factor demn de luat in seama. Evident, cei de la Intel au imbunatatit arhitectura per total, si asta se poate observa in majoritatea aplicatiilor. Dar in momentul in care folosim un cache mai mic si o latenta mai mare in cazul Cache-ului Level1, vor exista cu siguranta anumite implicatii in performanta platformei in anumite aplicatii.  Asta nu inseamna ca avem de-a face cu o problema grava, nici pe departe. Pur si simplu, desi se pot observa imbunatatiri serioase in majoritatea aplicatiilor, Nehalem nu aduce momentan imbunatatiri considerabile in jocuri. In cazul unei platforme normale, cu o placa video mainstream,  Yorkfield sau Wolfdale se descurca foarte bine. Odata cu aparitia unor placi video noi dar mai ales a unor jocuri noi, situatia se va schimba si balanta va inclina incet dar sigur in favoarea arhitecturii Nehalem. Desi aspectul 3D m-a surprins putin, nu putem trece cu vederea sporul urias de performanta adus in majoritatea celorlalte aplicatii. Arhitectura imbunatatita isi spune cuvantul, si cred ca Nehalem este o alegere foarte fireasca pentru profesionisti si entuziasti deopotriva.

Un gust amar mi-a lasat Vista x64. Pentru a testa cel mai nou procesor, pentru care vor fi disponibile kituri de memorie de 3GB, 6GB dar probabil si de 12GB, se impunea folosirea unui sistem de operare capabil sa foloseasca asemenea cantitati de memorie. Vista x64 a fost alegerea logica, din pacate nu si cea mai fericita. O serie de probleme si inconsecvente m-au facut sa verific anumite rezultate si in Vista pe 32 de biti, pentru a ma asigura ca modul in care se comporta X58 in jocuri nu este cauzat strict de catre sistemul de operare. Rezultatele in jocuri sunt indentice, chiar si rezultatul in 3DMark2006 este aproape identic. In schimb, rezultatul in 3DMark2003 se modifica destul de mult, chiar daca tot Yorkfield-ul obtine un scor mai bun. Acest lucru m-a facut sa realizez ca inca mai este mult de lucru pana cand Vista x64 va folosi cu adevarat platformele pe care ruleaza. Am rulat si Cache & Memory Test din Everest pentru a compara putin latimea de banda intre cele doua sisteme de operare, si am obtinut pe ambele platforme cu ~2000MB/s mai mult in cazul versiunii pe 32 de biti. Deci tocmai sistemul de operare care ar trebui sa lucreze mai bine cu memoriile penalizeaza performanta acestora….Stiu, aplicatiile pe 32 de biti sunt portate, si este normal sa rezulte o mica diferenta de performanta, dar din pacate nu intotdeuna aceasta diferenta este chiar mica … Personal mi-am invatat lectia si in afara de kituri de memorii mai mari de 3GB, nu voi mai folosi acest sistem de operare in teste pana la un eventual Service Pack 2 (sau Windows 7).

Am incercat sa ofer cat mai multe informatii pentru a-i ajuta pe cei interesati sa faca alegerea corecta. Cu toate acestea, mai sunt multe de spus despre noile procesoare Intel. Modul in care acestea se overclock-eaza, posibilitatile de overclocking in cazul memoriilor, posibilitatile in regim de functionare sub-zero s.a.m.d. De asemenea, placile de baza LGA 1366 merita un test aprofundat, la fel si kiturile TriChannel care nu vor intarzia sa apara si sa invadeze piata. Sa nu uitam performantele heatsink-urilor destinate noului socket, pot aparea surprize interesante in momentul in care suprafata de disipare a caldurii creste. Ei bine, nu am putut inghesui toate aceste informatii intr-un singur test, asa ca va invit sa ne vizitati in urmatoarea perioada, pentru ca vom incerca sa atingem toate subiectele pe care le-am amintit mai sus, continuand seria articolelor legate de Nehalem.

Comentarii

30 comentarii la: Core i7 920 vs Core 2 Quad Q9550 – performanta 24/7

  1. Marian a scris pe:

    din nou un test excelent,m-ati scutit de cautari pe net.Sa va tita Domnul sanatosi

  2. Cere a scris pe:

    Frumos review, Monstrule. O observatie: ar fi bine ca, pe grafice, sa adnotezi: “slower/faster is better” pentru ca nu toti cititorii sunt familiari cu aplicatiile din suita de teste. Da rezultatul se deduce din context, dar ar mari usability-ul.

  3. ChrisBard a scris pe:

    Super fain articolul, o gramada de teste, felicitari domnilor !!!

  4. Drew a scris pe:

    O mica precizare: superPI nu calculeaza pi la puterea 10^6, ci pi urmat de 10^6 zecimale.

    Graficele intr-adevar ar trebui notate cu o explicatie. De exemplu, la winRAR 3.80 nu se intelege nimic din graficul respectiv.

    In rest, felicitari pentru alegerea unor platforme de test si a unor setari echilibrate.

  5. Monstru Post author a scris pe:

    Scuzele mele, am modificat corespunzator, se pare ca oboseala si-a spus cuvantul. Paradoxal, daca ne gandim ca SuperPi este benchmark-ul meu preferat….pe care il stapanesc….destul de bine 🙂

    Sunt complet de acord cu ideea notarii pe grafice si o voi folosi cu siguranta in articolele urmatoare. Totusi, cred ca graficul cu WinRAR este FOARTE intuitiv, orice persoana care a folosit macar odata aplicatia isi poate da seama fara prea mari batai de cap ce anume poate masura acest program…

  6. deliusan a scris pe:

    O suita de teste care, din intamplare, scoate la iveala “micile greseli” ale celor care implementeaza sistemele noi de operare … adica, bineinteles, mica firma a lui Bill Gates. E foarte interesant si alarmant sa descoperi ca Vista 64 nu aduce mare lucru in plus … Felicitari pt articol, Monstrule !

  7. gigi a scris pe:

    sal,
    Foarte ok review-ul. Ma bucur ca am putut gasi asa ceva si pe pagini romanesti, nu numai stiri. Sunteti primi pe care i-am gasit (site romanesc).

  8. Monstru Post author a scris pe:

    Multumim pentru aprecieri 🙂

  9. Claudiu a scris pe:

    Salut.
    In primul rand multumiri pt munca depusa, foarte utila si pentru un incepator ca mine.
    Rugaminte: am un Q9550 si as dori sa il tactez undeva pe la 3,5 Ghz
    Acum el este setat 333 x 8,5 din fabrica.
    Nu vreau sa stric nimic si as vrea sfatul unui expert. Ce tensiuni pot sa pun, ce setari memorii, ce frecvente.
    Numele placii de baza Gigabyte GA-EP35-DS4
    3 x Kingmax KLDD48F-A8KB5 total 3 Gb la ddr2-800
    video Gigabyte GeForce 9800 GT
    Daca ai timp sa iti faci si pentru mine as ramane recunoscator.

  10. Monstru Post author a scris pe:

    Salut Claudiu,

    in cadrul paginii “Despre noi” poti gasi adresa mea de mail. Da-mi te rog un mail cu datele de contact (ID de messenger de exemplu), ca sa putem vorbi despre acest subiect.

  11. mihai a scris pe:

    salut am citit tot legat de teste , nu sunt un expert dar vreau sa stiu din 2 cuvinte daca diferenta de 20 euro dintre I7 920 si q9550 se merita sau nu. monstru ai facut o treaba buna ca ai comparat 2 procesoare aproape asemanatoare nu ma asteptam sa gasesc asa ceva pe site-uri din roamania . cand pot sa vad si io niste teste dintre amd x4 940 , E8600 , q9650 , si acest I7 920 vreau sa stiu care este cel mai potrivit pentru jocuri si de ce . multumesc mult astept raspuns

  12. Monstru Post author a scris pe:

    Salut Mihai,

    imi este destul de greu sa rezum concluzia intregului test in cateva cuvinte, dar voi incerca. Strict pentru jocuri, in acest moment, E8600 si Q9550 isi fac treaba cu brio, i920 nu aduce nimic in plus in acest sens. Daca jocurile sunt activitatea principala pe care vrei sa o desfasori pe o eventuala nou achizitionata platforma, poti alege fara griji ori E8600 ori Q9550. In acest moment exista putine jocuri care folosesc cu adevarat un quad-core, deci E8600 isi face treaba fara probleme. Totusi, au inceput deja sa apara si jocuri optimizate pentru procesare multi-core (vezi GTA IV de exemplu), deci Q9550 ar fi o investitie … “de viitor”. Pe de alta parte, daca intentionezi sa desfasori si alte activitati pe noul PC (codari video, baze de date, masini virtuale, etc), atunci i920 se impune ca solutie clara.

    Cum tu m-ai intrebat strict de jocuri, as zice ca Q9550 este cea mai buna alegere.

  13. Ady a scris pe:

    As vrea si yo sa-mi ziceti ce componente trebuie pentru un calculator special de “gaming”. Q9550 sau i7 920 ? Banii nu conteaza dar vreau sa stiu sa-mi formez o idee despre componente.

  14. Monstru Post author a scris pe:

    Scopul review-ului este acela de a te informa si de a te ajuta sa faci alegerea potrivita in functie de nevoile tale.

  15. Salut,

    Legat de recomandari: “Pe de alta parte, daca intentionezi sa desfasori si alte activitati pe noul PC (codari video, baze de date, masini virtuale, etc), atunci i920 se impune ca solutie clara.”

    Sistemele cu noua tehnologie sunt un avantaj pentru oamenii care au afaceri a caror productivitate se bazeaza pe cele enumerate de “Monstru” – apropo, care e numele tau? -. Cei profesionisti pana la capat au sisteme multi procesor si pentru aceia trebuie mentionat ca noua arhitectura este must-have acum cand apar si procesoarele si placile de baza pentru servere – probabil ca va aparea si skulltrail pentru Core I7. Sfatul cu 8600 este destul de bun – desi foarte scump, mai bine ai un 8400 si-l clockezi, cei de la intel au obiceiul sa ceara foarte mult pe putin mai mult ca performanta – desigur vreun cretin care castiga multi bani facand nimic, ma va contrazice, dar cu un 8400 clockat pe o placa de baza buna, te joci foarte bine si pese 2 ani. Ganditi-va ca un q9550 e mai greu de clockat ca un e8400 respectiv e8600 -, ai nevoie de racire pe apa si multe altele, iar in multe jocuri e la fel ca e8400 de rapid .Deci pentru jocuri e8400 este adecvat – sau e8600 -. Deci decat sa iei un q9550 pentru jocuri si in plan secundar chestii semi-pro, mai bine iti iei un i920 care face foarte multe si se renteaza pentru 3-4 ani de acum incolo – mai ales ca, costurile pe acolo sunt. Noua serie face minuni printre cei ce chiar fac bani cu sculele astea, dar nu-si permit solutii multi-procesor. Arhitectura cea noua cu memory controller si hyper-threading si consum redus de energie e fenomenala, adica e ca si cum ai avea doua q6600 under the hood, dar consuma mai putin ca un q6600, asta da schimbare de situatie!

    TOP
    XEON bazat pe core i7 2 bucati minim per statie – pentru profesionisti

    Core I7 semipro

    Core 2 Duo 8xxx gamers, centre multimedia

    Core q9550 pentru cei care au deja o placa de baza killer, cu racire pe apa si nu se justifica trecerea la o noua platforma – Pentru cei aflati in situatia aceasta recomand sa treaca la o noua platforma numai CAND in testul din 3d mark la cpu va scrie peste 10000 de puncte neclockat, altfel sa ramana la q6600 lor sau q9550 daca tehnologia SSE4 va face o diferenta zdrobitoare fata de SSE3 – adica sa treaca la q9550 daca va fi asa, daca nu, sa astepte inca vreo 2 ani si apoi sa schimbe tot.

  16. Monstru Post author a scris pe:

    Ok, un punct de vedere destul de bine argumentat, cu care sunt in mare parte de acord. E8400 reprezinta intradevar o solutie foarte buna din punct de vedere al raportului calitate pret, iar folosirea unui quad-core pe LGA775 nu se justifica foarte mult in momentul de fata. Totusim trebuie sa nu uitam ca scopul acestui test a fost comparatia cu procesorul direct concurent din generatia anterioara, chiar daca acest concurent este o solutie potrivita sau nu pentru anumiti useri.

    Legat de numele meu, in partea de sus a site-ului exista un link catre sectiunea “despre noi” 🙂

  17. Sorin a scris pe:

    Hasselblad??!!! Mega bestial!!! O rugaminte, daca se poate un review pt. Phase One P45+? Multumiri!

  18. george00 a scris pe:

    de curand am achizitiot un computer pe platforma i7 evident configurat de mine si ansamblat, diferentele sunt justificabil mai mari intre un quad core si un i7 o technologie mai noua ce te ajuta cam la toate avand in vedere cat costa un q9550 si un i7 920 e clar sa alegi 920, in primul rand un procesor i7 lucreaza direct cu mem ram pe cand la un quad core chipsetu lucreaza cu ramu diferentele de performanta sunt evident mai mari in favoarea i7 dupa cate stiu intel pregateste un nou procesoar i9 pe o technologie de 32 nm si cred ca un pret pe masura

  19. costy a scris pe:

    doua cuvinte as avea de spus “smecher test”

  20. Alex a scris pe:

    Foarte interesant articolul.

    Monstru practic in acest moment daca am un c2q 9550 merita upgrade-ul la 920 daca sistemul este folosit in special pentru jocuri?

    Mie chiar si dupa 1 and de la test nu mi se pare justificata trecerea de la un core2quad 9550 la I7 doar pentru jocuri.

    Daca ma insel astept sa fiu contrazis pe tema acesta.

    In final vreau sa te felicit pentru munca depusa este exact genul de articol pe care il cautam de multa vreme.

  21. Monstru Post author a scris pe:

    Multumim pentru aprecieri 🙂

    Din punctul meu de vedere, aprecierile din articol sunt valabile si astazi. Strict pentru gaming nu are rost sa schimbi platforma, Q9550 isi face in continuare treaba cu brio. Mai bine investesti banii intr-o placa grafica mai puternica, un HDD mai mare, un SSD pentru sistemul de operare, s.a.m.d.

  22. aTc a scris pe:

    Utilizez soft matematic de tip MatLab sau MathCad si executabile compilate in Delphi Pascal 7/32 biti. Actualmente am un E6420 cu DDR2/667 toate pe o placa Asus P5LD2-VM.
    Aplicatiile se refera la calcule cu matrici de pina la 2GB in RAM si formule matematice cu functii “urite”.

    Intrebare care ar fi cel mai EFICIENT (pret/putere de calcul) i5 sau quad95xx, sin in ce configuratie?! Si de ce?

    Testele mele pe i5 si i7 pe platforma Win7/64 de biti cu softurile(demo pe 64 de biti), nu m-au prea incintat. Pe un i5-650 cu Win7/32 de biti insa lucrurile stau ff.bine adica am obtinut un timp de ~4 ORI mai bun!!! Cu toate astea i5-ul nu folosea toate cele 4 procesoare la 100%, ci la 57-63%. Ma intreb ce performante ar avea daca ar lucra la 100%.

    Ce am observat la o trecere in revista a testelor d-voastra sunt performantele extraordinare ale noii arhitecturi de acces a memoriei RAM. Asta este ceea ce cred eu ca face diferenta + noua arhitectura a cache-ului – care depaseste chiar cei 12MB ai lui Q9550. Practic putere de calcul marita a procesoarelor i5 si i7 ar veni de aici si mai putin din fortele CPU-ului…

    Anyway, un articol bine structurat si executat 🙂 care e si un bun brainstorming…

  23. sal se merita sa schimb un E8400 cu E8600 a scris pe:

    schimb cu e8600 plus 1ooron diferenta

  24. pe un e8600 si 100ron diferenta ?

  25. razvan a scris pe:

    am eu un e 8600 de vanzare.

  26. mihai a scris pe:

    Un review corect, in mare parte, doar mai putin atunci cand ai spus despre tehnologie turbo boost a lui I7.

    i7, la fel ca si i5 de altfel, are ceva limitari la turbo boost.

    ex: turbo boost nu va functiona decat pe maxim 2 nuclee, cea ce face aplicatiile multi-threaded sa nu beneficieze la maxim de aceasta tehnologie.

    in plus, turbo boost nu se activeaza decat atunci cand threadul este prea “greu” pentru un nucleu sa il ruleze al frecventa standard.

    si in al treilea rand, turbo boost se realizeaza overclocking un nucleu in timp ce un altul este “under clockat”. tehnologie merge bine, pt ca in mare parte nucleele nu trebuie sa ruleze threaduri prea grele, si foarte putine aplicatii folosesc mai mult de 2 threaduri.

    Dar castigul de performanta din toata chestia asta este destul de mic.

  27. foarte buna articolo!! respect!

  28. anonim a scris pe:

    Nu e corect. Nu e aceeasi cantitate de RAM.

  29. a a scris pe:

    What’s up to every body, it’s my first pay a quick visit of this website; this webpage contains amazing and really excellent data in favor of readers.

  30. Vreau sa te felicit pentru munca depusa este exact genul de articol pe care il cautam de multa vreme!

Lasa-ne un comentariu: