1. Einleitung
Intels neuestes Flaggschiff, der „Core 2 Extreme QX9650“ hatte nur eine sehr kurze Lebensdauer. Bereits kurze Zeit später kam mit dem QX9770 ein um 200 MHz höher getaktetes, neues Spitzenmodell. Nichtsdestotrotz wird uns der Intel QX9650 zu Testzwecken völlig ausreichen, zumal es sich um zu 100% den gleichen Kern handelt. Zum Vergleich haben wir das erste Modell der Vorgängergeneration in 65nm zur Verfügung – den „Core 2 Extreme QX6700“.
Dank des offenen Multiplikators aller Prozessoren der „Extreme-Edition“ können wir alle anderen Modelle simulieren. Somit stehen uns zum Vergleich auch die für die Masse am meisten interessanten Mittelklasse-CPUs im Preisbereich von 200-300 Euro zur Verfügung. Den aktuellen Preis-/Leistungs-König „Q6600“ mit Kentsfield-Kern haben wir somit ebenso im Vergleich wie den Nachfolger „Q9450“ mit dem neuen Yorkfield-Kern.
Zunächst hier eine Übersicht, was nun die bisherigen Unterschiede sind: FSB (Frontsidebus) – dieser fällt beim Yorkfield mit bis zu 1600 MHz (QDR) höher aus, wie man sieht.
Der Kentsfield hat, vor allem bei einem älteren Modell, mit manchen Mainboards Probleme, durch Overclocking einen hohen FSB zu erreichen. Mit dem aktuellen „G0-Stepping“ wurde dieser Umstand zwar schon verbessert, wie man an dem neuesten Kentsfield-Modell, dem QX6850 mit 3,0 GHz und 1333 MHz FSB (QDR) sieht, allerdings kommen die neuen Yorkfield-Modelle selbst in den kleinen Varianten mit einem Frontsidebus von mindestens 1333 MHz daher. Das neue Spitzenmodell hat sogar stolze 1600 MHz. Den FSB zu steigern ist bei einem Quadcore sehr sinnvoll, da sich diesen alle vier Kerne teilen müssen.
Bei sehr datendurchsatzlastigen Anwendungen, die alle vier Kerne voll auslasten, ist der FSB nämlich immer der Flaschenhals.
Daher kann auch der im Desktop-Bereich bisher kaum konkurrenzfähige Phenom X4 von AMD im Server-Bereich punkten, da dieser keinen FSB, sondern einen wesentlich schnelleren Hypertransport-Bus besitzt. Bis Intel in diesem Bereich ebenfalls so weit ist, muss der FSB so stark wie möglich gesteigert werden.
Man ist dort aber auf gutem Weg, wie man sieht. Ob und wie viel Performance der erhöhte FSB-Takt bringt, das werden die Vergleiche in unserem Benchmark-Parcours zeigen. L2 -Cache – dieser wurde von 2x4 MiB auf 2x6 MiB erhöht, was insgesamt stolze 12 MiB ergibt.
Diese Steigerung von 50% ist insbesondere der 45nm-Fertigung zu verdanken.
Der Cache verbraucht nämlich einen sehr großen Teil der Chip-Fläche. Wie man aber in obiger Tabelle sieht, konnte die Chipgröße trotz der vor allem durch den größeren Cache erhöhten Transistorzahlen um ca. 25% reduziert werden! Anhand dieses Vergleichs des alten und neuen Xeons (welche den gleichen Kern haben wie ihre Desktop-Varianten) wird dieser Umstand deutlich visualisiert: Durch den verkleinerten Flächenverbrauch können nicht nur die Produktionskosten gesenkt werden, sondern es wird auch die erste Hürde für zukünftige Achtkern-Prozessoren überwunden, da diese wieder mehr Platz benötigen werden. Dass beim Yorkfield augenscheinlich wieder alles „doppelt“ vorhanden ist, das liegt an der Tatsache, dass Intel weiterhin wie bereits beim Kentsfield keinen nativen Quadcore fertigt, sondern zwei Dualcores zu einem Prozessor verbindet. Der Nachteil ist, dass die Kerne untereinander durch den langsamen FSB kommunizieren müssen. Lediglich jeweils die zwei Kerne, die an dem gleichen L2-Cache angebunden sind, können direkt ihre Daten austauschen.
Im Desktop-Bereich ist dieser Umstand aber nicht weiter schlimm, wie bereits unser Test des Vorgängermodells QX6700 ergeben hat.
SSE4.1 – was ausgeschrieben für „Streaming SIMD Extensions“ steht, ist inzwischen in der Version 4.1 vorhanden.
Durch diese Befehlssätze sollen bestimmte Rechenvorgänge extrem beschleunigt werden können, genauer gesagt um bis zur achtfachen Geschwindigkeit. Die 47 neuen Instruktionen sollen vor allem Video-Berechnungen zu Gute kommen, z.B. unterstützt der neueste DivX-Codec bereits diese Effizienztechnik.
TDP – die „Thermal Design Power“ hat sich mit bis zu 136 Watt beim QX9770 auf einen neuen Höchstwert gesteigert.
Allerdings geht Intel bei den neuen 45nm-Modellen sehr vorsichtig mit den Watt-Angaben vor. Wie unser Test ergeben hat, ist der QX9650 nämlich deutlich sparsamer als der ältere QX6700, obwohl beide dieselbe TDP von 130 Watt haben. Somit hat der 45nm-Prozess die Leistungsaufnahme definitiv gesenkt.
45nm Fertigung
Damit wären wir auch schon bei der 45nm Technik. Um die feinen Strukturen zu ermöglichen, hat Intel neue Techniken und Materialien angewandt. Der 65-Nanometer-Prozess ist nämlich in seiner aktuellen Form bereits an die Grenze des Möglichen angelangt, weil durch die ständige Verkleinerung des „Gate-Dielektrums“ (SiO2) der Verlust von elektrischem Strom immer höher wurde, was folglich nicht nur die Leistungsaufnahme, sondern auch die Hitzeentwicklung des Prozessors gesteigert hat.
Das Gate ist der Teil eines Transistors, der bestimmt, ob er ein- oder ausgeschaltet ist. Das Gate-Dielektrum ist wie auf dem Bild zu sehen eine dünne Isolator-Schicht. Diese soll verhindern, dass elektrische Leckströme entstehen. Denn Leckströme verursachen letztendlich die hohe Leistungsaufnahme der heutigen Prozessoren. Durch die ständige Verkleinerung der Prozessoren wirkt jedoch auch die Isolierschicht immer schlechter und verursacht somit die unerwünschten Leckströme.
Zuletzt hat sich dieser Umstand mit dem Pentium 4 auf Prescott-Basis deutlich bemerkbar gemacht. Trotz Verkleinerung von 130nm auf 90nm wurde er zum größten Hitzkopf aller Zeiten. Bereits 2003 hat Intel das High-K-Dielektrum als Lösung für dieses Problem entdeckt. Mit der Penryn-Architektur wurde die Technik erstmal massentauglich.
Das bisherige Siliziumdioxid (SiO2), aus dem das Gate-Dielektrum bisher bestand, wurde bei der 45-Nanometer-Technik durch ein auf Hafnium basierendes High-K-Dielektrikum ersetzt. Dadurch soll im Vergleich zum alten 65nm-Prozess die Stromaufnahme um bis zu 30% reduziert worden sein.
Aber weil das High-K-Dielektrum mit der bisherigen Poly-Silizium-Gate-Elektrode inkompatibel ist, wurde diese mit einer neuartigen Legierung versehen, welche von Intel bisher nicht näher beschrieben wurde und schlicht als „Metall-Gate-Elektrode“ bezeichnet wird.
Mit der neuen 45-Nanometer-Generation hat Intel den Einsatz dieser Technik erstmals angewandt. Durch diese Änderungen sollen laut Intel die Transistoren nicht nur eine höhere Energieeffizienz haben, sondern auch um 20% schneller schalten können.
Wenn man von den 3,0 GHz beim höchsten 65nm-Modell ausgeht, wären damit in absehbarer Zeit bis zu 3,6 GHz Standardtakt bei einem 45nm-Modell realistisch. Intel hat somit noch viel Spielraum nach oben, wenn AMD im Laufe der Zeit höher getaktete Phenom-Modelle auf den Markt bringt. Die Plattform: Zusammen mit dem QX9650 hat Intel auch eine neue Generation von Chipsätzen herausgebracht. Der X38 ist dabei der neue Highend-Chipsatz, welcher aber gleichzeitig schon wieder durch den X48 veraltet ist. Der X48, welcher sich im Vergleich zum Vorgänger aber durch den offiziellen FSB1600-Support unterscheidet, wurde zusammen mit dem QX9770 veröffentlicht. Der für uns interessante Mainstream-Chipsatz ist jedoch der P35. Da der P35-Chipsatz der beliebteste ist, verwenden wir auch ein Mainboard auf Basis dieses Chipsatzes für unseren Test. Der X38 unterstützt lediglich mehr Speichertakt bei DDR3-RAM und hat einen zweiten PCI-Express-x16-Slot. In Sachen Overclocking steht der P35 seinem großen Bruder allerdings in nichts nach.
Die neue ICH9-Southbridge hat im Vergleich zum Vorgänger „ICH8“ nochmal 2 zusätzliche USB-2.0-Ports hinzubekommen. Des Weiteren unterstützt der ICH9 erstmals „Turbo-Memory“, welches für die die ReadyBoost- und ReadyDrive-Funktionen von Windows Vista gedacht ist. In Form von einer kleinen x1-PCI-Express-Steckkarte sollen NAND-Flash-Speicher verbaut werden können, welche dann in Verbindung mit Windows Vista als Betriebssystem als schneller Cache verwendet werden. Damit soll sich der Bootvorgang wesentlich verkürzen und oft benutzte Programme schneller starten.
Der Flash-Speicher mit schnellem PCI-Express-Interface ist leider bisher noch nicht verfügbar. Mit einem USB-Stick kann man diese Vorteile bereits heute benutzen, aber nur mit begrenzter Geschwindigkeit.
Hier zeigt der 45nm-Prozess seine wahre Stärke, denn in ihm schlummern viele Reserven. Glatte 4,0 GHz haben wir mit dem QX9650 ohne Probleme mit einem ganz normalen Mainboard wie dem Gigabyte GA-P35C-DS3R erreicht. Die VCore musste dabei lediglich auf 1,50 Volt eingestellt werden, was real unter Last gerade einmal 1,396 Volt entsprach. (Leerlauf: 1,456 V)
Den FSB haben wir auf reale 400 MHz und den Multiplikator auf 10 erhöht. Gekühlt wurde das ganze mit einem Scythe Mugen und einem auf 5 Volt gedrosseltem Lüfter.
Unter den selben Voraussetzungen musste auch unser QX6700 zeigen, was er für einen Takt schafft. Bei ihm waren lediglich 3,2 GHz bei gleicher eingestellter Spannung drin! Da er aber deutlich stromhungriger ist, brach die VCore unter Last auf 1,376 Volt ein. (Leerlauf: 1,440 V)
Den FSB konnten wir dank des guten Mainboards ebenfalls auf 400 MHz steigern, der Multiplikator beträgt aber nur noch 8.
Sockel 775 Testsystem: Mit dem QX9650 und QX6700 haben wir die anderen Modelle simuliert, womit das unsere getesteten Prozessoren sind: *Die Stromsparfunktionen sind bei einer höher eingestellten VCore nicht mehr verfügbar.
Interessant ist vor allem der Vergleich zwischen QX9650 und QX6850, da diese exakt die gleichen Einstellungen haben. Damit werden die Effizienz-Fortschritte des neuen Yorkfield-Kerns ersichtlich. Kommen wir also zu den Benchmarkergebnissen… Der 3D Mark01 SE ist zwar mittlerweile sehr alt und nutzt nur einen Prozessorkern, dieser wird aber immer noch stark gefordert. Der Benchmark ist trotz seines Alters immer noch CPU-limitiert, da man riesige Performancegewinne durch einen höheren Takt erzielt, wie man sieht. Interessant ist auch der Vergleich zwischen Kentsfield und Yorkfield auf gleichem Takt. (QX9650 vs. QX9850)
Der Yorkfield hat sogar bei exakt gleichen Taktraten eine etwas höhere Geschwindigkeit. Der Unterschied zwischen Q9450 und QX6700 ist noch größer, das zeigt die starke Wirkung eines hohen FSBs. Das Bild ist ähnlich wie beim 3D Mark01, nur sind die Unterschiede weniger stark ausgeprägt. Beim CPU-Test des 3D Marks 06 sind die Unterschiede wieder etwas höher. Der Yorkfield erreicht wieder eine ca. 4% höhere Performance unter 100% gleichen Takteinstellungen. Quake 4 als erstes Spiel in unserem Test bescheinigt dem Yorkfield sogar noch höhere Effizienzsteigerungen als die bisherigen synthetischen Benchmarks. So ist der QX9650 mit seinen 3,0 GHz und FSB1333 sogar schneller als ein auf 3,2GHz/FSB1600 übertakteter QX6700. UT2004 gehört auch nicht mehr zu den neuesten Spielen, ist aber dank seiner hohen CPU-Last auch immer noch sehr gut als Vergleichsbenchmark geeignet. Auch dieser zeigt ein ähnliches Bild wie Quake 4, nur noch ein bisschen stärker. Knapp 10% mehr Effizienz hat der Yorkfield bei gleichen Taktraten! Wir wollten sehn, ob die vorherige Map nicht zufällig den Yorkfield bevorteiligt hat, aber es ist sogar das Gegenteil der Fall. In dieser Map von UT2004 kann selbst der kleine Q9450 mit dem deutlich höher getakteten QX6850 mithalten.
Beim Nachfolger von UT2004, welcher sogar mehrere Prozessorkerne nutzt, sieht es sogar nochmal einen Tick besser aus. Crysis skaliert nicht mehr so gut mit höherem CPU-Takt, wie man am übertakteten 4-GHz-Modell sieht. Trotzdem ist der Yorkfield seinem Vorgänger gnadenlos überlegen. Anders sieht es beim Verschlüsseln aus. Hier ist zwischen den Generationen Null Unterschied. Nicht mal der höhere FSB des Q9450 macht sich gegenüber dem QX6700 bemerkbar. Beim Packen von Dateien ins 7Zip-Format ist der Yorkfield wieder gute 5% schneller. Unter SuperPI sind die Unterschiede wieder etwas größer. Die gesteigerte Integer-Effizienz und der höhere Cache machen sich hier bemerkbar. Der FPU-Test von Everest zeigt ebenfalls eine gesteigerte Effizienz. Im Gegensatz zu SuperPI ist bei Everest absolut gar kein Performancegewinn beim Yorkfield zu sehen. Beide liegen exakt gleichauf. Der Cinebench profitiert wieder deutlich vom Yorkfield. Knappe 9% Performancegewinn bei gleichem Takt sind sind. Beim 3D-Test unter OpenGL sind die Unterschiede weniger stark ausgeprägt, aber genauso vorhanden. Die CPU-Skalierung ist hier nicht so hoch, wie man am 4-GHz-Modell sieht, trotzdem kann sich der Yorkfield um 5-6% vom Kentsfield absetzen.
Mit einem Energy Check 3000 haben wir die Leistungsaufnahme des Gesamtsystems gemessen. Dass die übertakteten Modelle soviel mehr im Idle-Zustand verbrauchen, liegt an den fehlenden Stromsparmodi, welche mit Übertaktung nicht mehr funktionieren. Trotzdem zeigt sich, dass egal ob mit oder ohne Stromsparmodus der Yorkfield wesentlich sparsamer geworden ist. Die "typische" last simulieren wir dadurch, indem wir den 3D Mark06 laufen lassen. Alle Hardwarekomponenten werden hier gefordert, die Prozessorkerne sind teilweise ausgelastet. Hier sind die Unterschiede noch wesentlich höher als im Leerlauf. Unter maximaler Volllast quälen wir das System neben dem 3D Mark 06 noch zusätzlich mit vier Prime95-Instanzen. Damit sind alle Prozessorkerne konstant voll ausgelastet. Die Unterschiede hier sind immer noch beträchtlich. Unter Standardtakt benötigt der Kentsfield gute 50 Watt mehr. Mit Übertaktung "nur" noch knapp über 40 Watt.
6. Fazit
Der Yorkfield ist rundum gelungen! Obwohl er "nur" ein Refresh des Kentsfield ist, so hat er doch deutliche Verbesserungen erfahren. Bis zu 10% mehr Performance bei gleichem Takt ist ein super Ergebnis. Dazu biete er ein um ca. 25% erhöhtes Taktpotenzial, was vor allem die Übertakter unter uns freuen wird!
Der Stromverbrauch ist dabei auch deutlich gesenkt worden. Egal ob im Leerlauf oder ob unter Volllast, egal ob mit oder ohne Übertaktung, der Yorkfield spart einiges an Strom. Sogar auf 4 GHz übertaktet benötigt er kaum mehr als ein Kentsfield unter Standardtakt. Die "Extreme"-Spitzenmodelle sind natürlich nur zu Preisen von ca. 800 Euro für den QX9650 und saftige 1100 Euro für den QX9750 zu haben, allerdings gibt es dafür den kleinen Q9450 schon ab ca. 280 Euro.
Den alten Q6600 erhält man sogar für nur 170 Euro und ist damit immer noch interessant, trotz seiner niedrigeren Performance. Wenn Intel die Preise der 45nm-Modelle noch weiter senkt, dann wird aber selbst der nicht mehr konkurrenzfähig sein.