1. Einleitung
Intels neuestes Flaggschiff, der „Core 2 Extreme QX9650“ hatte nur eine sehr kurze Lebensdauer. Bereits kurze Zeit später kam mit dem QX9770 ein um 200 MHz höher getaktetes, neues Spitzenmodell. Nichtsdestotrotz wird uns der Intel QX9650 zu Testzwecken völlig ausreichen, zumal es sich um zu 100% den gleichen Kern handelt. Zum Vergleich haben wir das erste Modell der Vorgängergeneration in 65nm zur Verfügung – den „Core 2 Extreme QX6700“.
Dank des offenen Multiplikators aller Prozessoren der „Extreme-Edition“ können wir alle anderen Modelle simulieren. Somit stehen uns zum Vergleich auch die für die Masse am meisten interessanten Mittelklasse-CPUs im Preisbereich von 200-300 Euro zur Verfügung. Den aktuellen Preis-/Leistungs-König „Q6600“ mit Kentsfield-Kern haben wir somit ebenso im Vergleich wie den Nachfolger „Q9450“ mit dem neuen Yorkfield-Kern.

Zunächst hier eine Übersicht, was nun die bisherigen Unterschiede sind:

Der Kentsfield hat, vor allem bei einem älteren Modell, mit manchen Mainboards Probleme, durch Overclocking einen hohen FSB zu erreichen. Mit dem aktuellen „G0-Stepping“ wurde dieser Umstand zwar schon verbessert, wie man an dem neuesten Kentsfield-Modell, dem QX6850 mit 3,0 GHz und 1333 MHz FSB (QDR) sieht, allerdings kommen die neuen Yorkfield-Modelle selbst in den kleinen Varianten mit einem Frontsidebus von mindestens 1333 MHz daher. Das neue Spitzenmodell hat sogar stolze 1600 MHz. Den FSB zu steigern ist bei einem Quadcore sehr sinnvoll, da sich diesen alle vier Kerne teilen müssen.
Bei sehr datendurchsatzlastigen Anwendungen, die alle vier Kerne voll auslasten, ist der FSB nämlich immer der Flaschenhals.
Daher kann auch der im Desktop-Bereich bisher kaum konkurrenzfähige Phenom X4 von AMD im Server-Bereich punkten, da dieser keinen FSB, sondern einen wesentlich schnelleren Hypertransport-Bus besitzt. Bis Intel in diesem Bereich ebenfalls so weit ist, muss der FSB so stark wie möglich gesteigert werden.
Man ist dort aber auf gutem Weg, wie man sieht. Ob und wie viel Performance der erhöhte FSB-Takt bringt, das werden die Vergleiche in unserem Benchmark-Parcours zeigen. L2 -Cache – dieser wurde von 2x4 MiB auf 2x6 MiB erhöht, was insgesamt stolze 12 MiB ergibt.
Diese Steigerung von 50% ist insbesondere der 45nm-Fertigung zu verdanken.
Der Cache verbraucht nämlich einen sehr großen Teil der Chip-Fläche. Wie man aber in obiger Tabelle sieht, konnte die Chipgröße trotz der vor allem durch den größeren Cache erhöhten Transistorzahlen um ca. 25% reduziert werden! Anhand dieses Vergleichs des alten und neuen Xeons (welche den gleichen Kern haben wie ihre Desktop-Varianten) wird dieser Umstand deutlich visualisiert:


Im Desktop-Bereich ist dieser Umstand aber nicht weiter schlimm, wie bereits unser Test des Vorgängermodells QX6700 ergeben hat.
SSE4.1 – was ausgeschrieben für „Streaming SIMD Extensions“ steht, ist inzwischen in der Version 4.1 vorhanden.
Durch diese Befehlssätze sollen bestimmte Rechenvorgänge extrem beschleunigt werden können, genauer gesagt um bis zur achtfachen Geschwindigkeit. Die 47 neuen Instruktionen sollen vor allem Video-Berechnungen zu Gute kommen, z.B. unterstützt der neueste DivX-Codec bereits diese Effizienztechnik.
TDP – die „Thermal Design Power“ hat sich mit bis zu 136 Watt beim QX9770 auf einen neuen Höchstwert gesteigert.
Allerdings geht Intel bei den neuen 45nm-Modellen sehr vorsichtig mit den Watt-Angaben vor. Wie unser Test ergeben hat, ist der QX9650 nämlich deutlich sparsamer als der ältere QX6700, obwohl beide dieselbe TDP von 130 Watt haben. Somit hat der 45nm-Prozess die Leistungsaufnahme definitiv gesenkt.
45nm Fertigung
Damit wären wir auch schon bei der 45nm Technik.


Das Gate ist der Teil eines Transistors, der bestimmt, ob er ein- oder ausgeschaltet ist. Das Gate-Dielektrum ist wie auf dem Bild zu sehen eine dünne Isolator-Schicht. Diese soll verhindern, dass elektrische Leckströme entstehen. Denn Leckströme verursachen letztendlich die hohe Leistungsaufnahme der heutigen Prozessoren. Durch die ständige Verkleinerung der Prozessoren wirkt jedoch auch die Isolierschicht immer schlechter und verursacht somit die unerwünschten Leckströme.
Zuletzt hat sich dieser Umstand mit dem Pentium 4 auf Prescott-Basis deutlich bemerkbar gemacht. Trotz Verkleinerung von 130nm auf 90nm wurde er zum größten Hitzkopf aller Zeiten. Bereits 2003 hat Intel das High-K-Dielektrum als Lösung für dieses Problem entdeckt. Mit der Penryn-Architektur wurde die Technik erstmal massentauglich.
Das bisherige Siliziumdioxid (SiO2), aus dem das Gate-Dielektrum bisher bestand, wurde bei der 45-Nanometer-Technik durch ein auf Hafnium basierendes High-K-Dielektrikum ersetzt. Dadurch soll im Vergleich zum alten 65nm-Prozess die Stromaufnahme um bis zu 30% reduziert worden sein.
Aber weil das High-K-Dielektrum mit der bisherigen Poly-Silizium-Gate-Elektrode inkompatibel ist, wurde diese mit einer neuartigen Legierung versehen, welche von Intel bisher nicht näher beschrieben wurde und schlicht als „Metall-Gate-Elektrode“ bezeichnet wird.
Mit der neuen 45-Nanometer-Generation hat Intel den Einsatz dieser Technik erstmals angewandt. Durch diese Änderungen sollen laut Intel die Transistoren nicht nur eine höhere Energieeffizienz haben, sondern auch um 20% schneller schalten können.
Wenn man von den 3,0 GHz beim höchsten 65nm-Modell ausgeht, wären damit in absehbarer Zeit bis zu 3,6 GHz Standardtakt bei einem 45nm-Modell realistisch. Intel hat somit noch viel Spielraum nach oben, wenn AMD im Laufe der Zeit höher getaktete Phenom-Modelle auf den Markt bringt. Die Plattform:


Die neue ICH9-Southbridge hat im Vergleich zum Vorgänger „ICH8“ nochmal 2 zusätzliche USB-2.0-Ports hinzubekommen. Des Weiteren unterstützt der ICH9 erstmals „Turbo-Memory“, welches für die die ReadyBoost- und ReadyDrive-Funktionen von Windows Vista gedacht ist. In Form von einer kleinen x1-PCI-Express-Steckkarte sollen NAND-Flash-Speicher verbaut werden können, welche dann in Verbindung mit Windows Vista als Betriebssystem als schneller Cache verwendet werden. Damit soll sich der Bootvorgang wesentlich verkürzen und oft benutzte Programme schneller starten.
Der Flash-Speicher mit schnellem PCI-Express-Interface ist leider bisher noch nicht verfügbar. Mit einem USB-Stick kann man diese Vorteile bereits heute benutzen, aber nur mit begrenzter Geschwindigkeit.
Hier zeigt der 45nm-Prozess seine wahre Stärke, denn in ihm schlummern viele Reserven. Glatte 4,0 GHz haben wir mit dem QX9650 ohne Probleme mit einem ganz normalen Mainboard wie dem Gigabyte GA-P35C-DS3R erreicht. Die VCore musste dabei lediglich auf 1,50 Volt eingestellt werden, was real unter Last gerade einmal 1,396 Volt entsprach. (Leerlauf: 1,456 V)
Den FSB haben wir auf reale 400 MHz und den Multiplikator auf 10 erhöht. Gekühlt wurde das ganze mit einem Scythe Mugen und einem auf 5 Volt gedrosseltem Lüfter.
Unter den selben Voraussetzungen musste auch unser QX6700 zeigen, was er für einen Takt schafft. Bei ihm waren lediglich 3,2 GHz bei gleicher eingestellter Spannung drin! Da er aber deutlich stromhungriger ist, brach die VCore unter Last auf 1,376 Volt ein. (Leerlauf: 1,440 V)
Den FSB konnten wir dank des guten Mainboards ebenfalls auf 400 MHz steigern, der Multiplikator beträgt aber nur noch 8.
Sockel 775 Testsystem:


Interessant ist vor allem der Vergleich zwischen QX9650 und QX6850, da diese exakt die gleichen Einstellungen haben. Damit werden die Effizienz-Fortschritte des neuen Yorkfield-Kerns ersichtlich. Kommen wir also zu den Benchmarkergebnissen…

Der Yorkfield hat sogar bei exakt gleichen Taktraten eine etwas höhere Geschwindigkeit. Der Unterschied zwischen Q9450 und QX6700 ist noch größer, das zeigt die starke Wirkung eines hohen FSBs.














Mit einem Energy Check 3000 haben wir die Leistungsaufnahme des Gesamtsystems gemessen.




Der Yorkfield ist rundum gelungen! Obwohl er "nur" ein Refresh des Kentsfield ist, so hat er doch deutliche Verbesserungen erfahren. Bis zu 10% mehr Performance bei gleichem Takt ist ein super Ergebnis. Dazu biete er ein um ca. 25% erhöhtes Taktpotenzial, was vor allem die Übertakter unter uns freuen wird!
Der Stromverbrauch ist dabei auch deutlich gesenkt worden. Egal ob im Leerlauf oder ob unter Volllast, egal ob mit oder ohne Übertaktung, der Yorkfield spart einiges an Strom. Sogar auf 4 GHz übertaktet benötigt er kaum mehr als ein Kentsfield unter Standardtakt. Die "Extreme"-Spitzenmodelle sind natürlich nur zu Preisen von ca. 800 Euro für den QX9650 und saftige 1100 Euro für den QX9750 zu haben, allerdings gibt es dafür den kleinen Q9450 schon ab ca. 280 Euro.
Den alten Q6600 erhält man sogar für nur 170 Euro und ist damit immer noch interessant, trotz seiner niedrigeren Performance. Wenn Intel die Preise der 45nm-Modelle noch weiter senkt, dann wird aber selbst der nicht mehr konkurrenzfähig sein.