ChatGPT o3 mini und o3 mini hight (Bild © PCMasters.de)
Die neueste Version von ChatGPT hört auf den Namen o3-mini, ist so konzipiert, dass sie mit weniger finanziellen und technischen Ressourcen auskommt und gleichzeitig gute Leistungen bei Aufgaben in den Bereichen Mathematik, Informatik, Naturwissenschaften und Technik erbringen soll. In den internen Tests von OpenAI hat o3-mini einen Vorteil gegenüber seinem Vorgänger o1-mini gezeigt.
Ein herausragendes Merkmal des neuen Modells ist der einstellbare „Reasoning Effort“, der es den Nutzern ermöglicht, die Rechenintensität der KI an die jeweiligen Aufgaben anzupassen. Wenn man die Optionen auf niedrig, mittel oder groß stellt, kannst die KI so optimiert werden, dass sie schnell antwortet oder bei komplexen Problemen mehr logisches Denken erfordert. Diese Flexibilität stellt eine deutliche Verbesserung gegenüber früheren Modellen dar.
Neben den Leistungsverbesserungen verfügt o3-mini-high jetzt auch über eine integrierte Internetsuchfunktion. Dieses Prototyp-Feature liefert Antworten zusammen mit relevanten Online-Quellen und ebnet so den Weg für informativere und kontextreiche Ergebnisse.
Benchmark-Tests zeigen, dass die Leistung des o3-mini bei geringem Denkaufwand mit der des o1-mini gleichzieht, während sie bei mittlerem Aufwand mit der des o1-Modells gleichzieht. Bei großem Denkaufwand übertrifft o3-mini die Fähigkeiten von o1-mini und o1 und glänzt besonders bei komplexen Softwareentwicklungsaufgaben. Beim SWE-bench Verified Benchmark erzielte das Modell eine beeindruckende Erfolgsquote von 49,3 % und stellte damit einen neuen Leistungsstandard für die Angebote von OpenAI auf. Auch bei der Bearbeitung von Biologie-, Chemie- und Physikfragen auf Doktorandenebene zeigt der o3-mini eine höhere Genauigkeit als sein Vorgänger bei niedrigeren Reasoning-Einstellungen.
Was die Kosten angeht, ist der o3-mini sehr wettbewerbsfähig. Mit einem Preis von 1,10 US-Dollar pro Million Token ist er 93 % günstiger als das o1-Modell - eine Preisstrategie, die offenbar darauf abzielt, dem Wettbewerbsdruck von DeepSeek zu begegnen. Zunächst steht die API einer ausgewählten Gruppe von Entwicklern in den Nutzungsstufen 3 bis 5 zur Verfügung und stellt damit die Weichen für eine breitere Akzeptanz in naher Zukunft.