Tachyum 192-Core-Chip (Bild © Tachyum)
Nach der Codierung des RTL-Designs begann Tachyum mit dem physischen Design von Prodigy, das die präzise Platzierung von Transistoren und Leiterbahnen beinhaltete. Nachdem sich die Notwendigkeit ergab, bestimmte IPs zu ersetzen, musste das Prodigy-Designteam auch seine RTL-Simulations- und Physical-Design-Tools wechseln. Mit einem neuen Satz von EDA-Tools optimierte Tachyum die Einstellungen effizient, so dass die Anzahl der Kerne um 50% und die Anzahl der SERDES auf jedem Chip von 64 auf 96 erhöht werden konnte. Trotz dieser Verbesserungen wurde die Chipgröße nur minimal vergrößert, nämlich von 500 mm2 auf 600 mm2, um die physikalischen Möglichkeiten zu verbessern.
Obwohl Tachyum technisch gesehen mehr seiner effizienten Kerne hinzufügen könnte, ohne die 858-mm2-Grenze zu überschreiten, wäre eine solche Konfiguration durch die Speicherbandbreite eingeschränkt, selbst wenn 16 DDR5-Controller mit mehr als 7.200 MT/s eingesetzt würden. Die Tachyum-Kerne sind deutlich leistungsstärker als alle anderen Prozessorkerne auf dem Markt.
Weiteren Verbesserungen
- Erweiterung des L2/L3-Cache des Chips von 128 MB auf 192 MB
- Integration von DDR5 7200 Speicherunterstützung neben DDR5 6400
- Erhöhte Geschwindigkeit mit 1 DIMM pro Kanal
- Größeres Gehäusedesign, um zusätzliche 32 serielle Verbindungen und Anschlussmöglichkeiten für bis zu 32 DIMMs an einen einzigen Prodigy-Chip zu ermöglichen
Als Universalprozessor ermöglicht die patentierte Architektur des Prodigy einen fließenden und dynamischen Übergang zwischen Standard-CPU-Aufgaben und KI/ML-Workloads. Diese Fähigkeit stellt sicher, dass er sowohl in der Trainings- als auch in der Inferenzphase eine außergewöhnliche KI/ML-Leistung erbringt - eine Eigenschaft, die im Bankensektor immer wichtiger wird, um Betrug und Cyberangriffe präventiv zu erkennen.
Prodigy verspricht eine revolutionäre Auswirkung auf die Leistung des Rechenzentrums, den Stromverbrauch und die Gesamtwirtschaftlichkeit, indem es sowohl die CAPEX als auch die OPEX deutlich reduziert. Aufgrund seiner Vielseitigkeit bei Hochleistungs- und Standard-Unternehmensanwendungen können Server mit Prodigy fließend zwischen verschiedenen Arbeitslasten wechseln. Dies macht kostspielige, dedizierte KI-Hardware überflüssig und steigert die Serverauslastung erheblich. Im Vergleich zu bestehenden Lösungen bietet Prodigy bei Cloud-Aufgaben die bis zu vierfache Leistung von Top-Tier-x86-Prozessoren und bei HPC- und KI-Anwendungen die bis zu drei- bzw. sechsfache Leistung der leistungsstärksten GPU.