GeForce RTX 5070 (Bild © NVIDIA)
GeForce RTX 5070 im Detail
Die neue GeForce RTX 5070 wird standardmäßig über 6.144 CUDA Kerne verfügen und weist außerdem 48 RT-Kerne auf. Dazu steht fest, dass sie mit 80 ROPs und einen Boost-Takt von 2.512 MHz arbeiten wird. Durch die Nutzung des nun enthüllten GB205-Grafikchips bietet diese Karte einen voraussichtlich günstigeren Einstieg in Blackwell-Generation. Natürlich bietet sie neben DLSS4 mit Multi-Frame-Generation auch fortschrittliches Raytracing und KI-gestützte Funktionen, die man auch von den anderen Modellen der RTX 50-Serie kennt. NVIDIA hat zwar noch keinen Termin für die offizielle Markteinführung genannt, aber es kursieren bereits Gerüchte über den Launch am 20. Februar 2025. Die Karte wird sich hinter der GeForce RTX 5070 Ti einreihen.
GeFroce RTX 3070 | GeFroce RTX 4070 | GeFroce RTX 5070 | |
---|---|---|---|
Codename | GA104 | AD104 | GB205 |
GPU Architecture | Ampere | Ada Lovelace | Blackwell |
GPCs | 6 | 5 | 5 |
TPCs | 23 | 23 | 24 |
SMs | 46 | 46 | 48 |
CUDA Kerne / SM | 128 | 128 | 128 |
CUDA Kerne | 5888 | 5888 | 6144 |
Tensor Kerne / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Kerne / GPU | 184 (3rd Gen) | 184 (4th Gen) | 192 (5th Gen) |
RT Kerne | 46 (2nd Gen) | 46 (3rd Gen) | 48 (4th Gen) |
GPU Boost Clock (MHz) | 1.725 | 2.475 | 2.512 |
Peak FP32 TFLOPS (non-Tensor) | 20.3 | 29.1 | 30.9 |
Peak FP16 TFLOPS (non-Tensor) | 20.3 | 29.1 | 30.9 |
Peak BF 16 TFLOPS (non-Tensor) | 20.3 | 29.1 | 30.9 |
Peak INT32 TOPS (non-Tensor) | 10.2 | 14.6 | 30.9 |
RT TFLOPS | 39.7 | 67.4 | 93.6 |
Peak FP4 Tensor TFLOPS with FP32 Accumulate (FP4 AI TOPS) | N/A | N/A | 493.9/987.82 |
Peak FP8 Tensor TFLOPS with FP16 Accumulate | N/A | 233.2/466.42 | 246.9/493.92 |
Peak FP8 Tensor TFLOPS with FP32 Accumulate | N/A | 116.6/233.22 | 123.5/246.92 |
Peak FP16 Tensor TFLOPS with FP16 Accumulate | 81.3/162.62 | 116.6/233.22 | 123.5/246.92 |
Peak FP16 Tensor TFLOPS with FP32 Accumulate | 40.6/81.22 | 58.3/116.62 | 61.7/123.52 |
Peak BF16 Tensor TFLOPS with FP32 Accumulate | 40.6/81.22 | 58.3/116.62 | 61.7/123.52 |
Peak TF32 Tensor TFLOPS | 20.3/40.62 | 29.1/58.22 | 30.9/61.72 |
Peak INT8 Tensor TOPS | 162.5/3252 | 233.2/466.42 | 246.9/493.92 |
Frame Buffer Memory Size and Type | 8 GB GDDR6 | 12 GB GDDR6X | 12 GB GDDR7 |
Memory Interface | 256-bit | 192-bit | 192-bit |
Memory Clock (Data Rate) | 14 Gbps | 21 Gbps | 28 Gbps |
Memory Bandwidth | 448 GB/sec | 504 GB/sec | 672 GB/sec |
Pixel Fill-rate (Gigapixels/sec) | 165.6 | 158.4 | 201 |
Texture Units | 184 | 184 | 192 |
ROPS | 96 | 64 | 80 |
Texel Fill-rate (Gigatexels/sec) | 317.4 | 455.4 | 482.3 |
L1 Data Cache/Shared Memory | 5888 KB | 5888 KB | 6144 KB |
L2 Cache Size | 4096 KB | 36864 KB | 49152 KB |
Register File Size | 11776 KB | 11776 KB | 12288 KB |
Video Engines | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) |
1 x NVENC (8th Gen) 1 x NVDEC (5th Gen) |
1 x NVENC (9th Gen) 1 x NVDEC (6th Gen) |
TGP (Total Graphics Power) | 220 W | 200 W | 250 W |
Transistoren | 17.4 Milliarden | 35.8 Milliarden | 31.1 Milliarden |
Die Größe | 392.5 mm2 | 294.5 mm2 | 263 mm2 |
Herstellungs Prozess | Samsung 8 nm 8N, NVIDIA Custom | TSMC 4nm 4N, NVIDIA Custom | TSMC 4nm 4N, NVIDIA Custom |
PCI Express Interface | Gen 4 | Gen 4 | Gen 5 |
GeForce RTX 5070 Ti Spezifikationen
Die GeForce RTX 5070 Ti wird hingegen mit dem größeren Chip und Design der großen Schwester GeForce RTX 5080 bestückt sein. Der Grafikchip ist der GB203, den sich beide teilen, auch wenn er bei der GeForce RTX 5070 Ti deutlich beschnitten wird. Dieses Modell verfügt über 8.960 CUDA-Kerne, 70 RT-Kerne und 96 ROPs. Der Boost-Takt soll bei 2.452 MHz liegen und bei den Modellen der Boardpartner womöglich höher gehen. Obwohl es die gleiche 16-GB-Speicherbestückung ist, sinkt der Energiebedarf und im Vergleich zum GeForce RTX 5080. Enthusiasten können damit rechnen, dass sie ab dem 20. Februar erhältlich sein wird und dass mögliche Partnerkarten folgen werden. Es bleibt abzuwarten, ob es eine Founders Edition geben wird.
GeFroce RTX 3070 Ti | GeFroce RTX 4070 Ti | GeFroce RTX 5070 Ti | |
---|---|---|---|
Codename | GA104 | AD104 | GB203 |
GPU Architecture | Ampere | Ada Lovelace | Blackwell |
GPCs | 6 | 5 | 6 |
TPCs | 24 | 30 | 35 |
SMs | 48 | 60 | 70 |
CUDA Kerne / SM | 128 | 128 | 128 |
CUDA Kerne | 6144 | 7680 | 8960 |
Tensor Kerne / SM | 4 (3rd Gen) | 4 (4th Gen) | 4 (5th Gen) |
Tensor Kerne / GPU | 192 (3rd Gen) | 240 (4th Gen) | 280 (5th Gen) |
RT Kerne | 48 (2nd Gen) | 60 (3rd Gen) | 70 (4th Gen) |
GPU Boost Clock (MHz) | 1.770 | 2.610 | 2.452 |
Peak FP32 TFLOPS (non-Tensor) | 21.7 | 40.1 | 43.9 |
Peak FP16 TFLOPS (non-Tensor) | 21.7 | 40.1 | 43.9 |
Peak BF 16 TFLOPS (non-Tensor) | 21.7 | 40.1 | 43.9 |
Peak INT32 TOPS (non-Tensor) | 10.9 | 20.0 | 43.9 |
RT TFLOPS | 42.5 | 92.7 | 133.2 |
Peak FP4 Tensor TFLOPS with FP32 Accumulate (FP4 AI TOPS) | N/A | N/A | 703/14062 |
Peak FP8 Tensor TFLOPS with FP16 Accumulate | N/A | 320.7/641.42 | 351.5/7032 |
Peak FP8 Tensor TFLOPS with FP32 Accumulate | N/A | 160.4/320.82 | 175.8/351.52 |
Peak FP16 Tensor TFLOPS with FP16 Accumulate | 87/1742 | 160.4/320.82 | 175.8/351.52 |
Peak FP16 Tensor TFLOPS with FP32 Accumulate | 43.5/872 | 80.2/160.42 | 87.9/175.82 |
Peak BF16 Tensor TFLOPS with FP32 Accumulate | 43.5/872 | 80.2/160.42 | 87.9/175.82 |
Peak TF32 Tensor TFLOPS | 21.7/43.42 | 40.1/80.22 | 43.9/87.92 |
Peak INT8 Tensor TOPS | 174/3482 | 320.7/641.42 | 351.5/7032 |
Frame Buffer Memory Size and Type | 8 GB GDDR6X | 12 GB GDDR6X | 16 GB GDDR7 |
Memory Interface | 256-bit | 192-bit | 256-bit |
Memory Clock (Data Rate) | 19 Gbps | 21 Gbps | 28 Gbps |
Memory Bandwidth | 608 GB/sec | 504 GB/sec | 896 GB/sec |
Pixel Fill-rate (Gigapixels/sec) | 339.84 | 626.4 | 686.6 |
Texture Units | 192 | 240 | 280 |
ROPS | 96 | 80 | 96 |
L1 Data Cache/Shared Memory | 5888 KB | 5888 KB | 6144 KB |
L1 Data Cache/Shared Memory | 6.144 KB | 7.680 KB | 8.960 KB |
L2 Cache Size | 4.096 KB | 49.152 KB | 49.152 KB |
Register File Size | 12.288 KB | 15.360 KB | 17.920 KB |
Video Engines | 1 x NVENC (7th Gen) 1 x NVDEC (5th Gen) |
1 x NVENC (8th Gen) 2 x NVDEC (5th Gen) |
1 x NVENC (9th Gen) 2 x NVDEC (6th Gen) |
TGP (Total Graphics Power) | 290 W | 285 W | 300 W |
Transistoren | 17.4 Milliarden | 35.8 Milliarden | 45.6 Milliarden |
Die Größe | 392.5 mm2 | 294.5 mm2 | 378 mm2 |
Herstellungs Prozess | Samsung 8 nm 8N, NVIDIA Custom | TSMC 4nm 4N, NVIDIA Custom | TSMC 4nm 4N, NVIDIA Custom |
PCI Express Interface | Gen 4 | Gen 4 | Gen 5 |
Das neue Whitepaper geht näher auf die Blackwell-Verbesserungen ein und gibt tiefere Einblicke in fortschrittliches Raytracing, aktualisierte Tensor Cores und eine bessere Energieeffizienz. Wir sind gespannt, wie gut die neuen Karten dann am Ende sein werden und werden berichten, sobald es neue Informationen gibt.