OpenGPT X Teuken 7B (Bild © OpenGPT-X)
Europäische Alternative zu führenden KI-Modellen
Teuken-7B wurde als mehrsprachiges Large Language Model (LLM) entwickelt und bietet eine auf Europa ausgerichtete Alternative zum beliebten GPT-3-Modell. Seine Entwicklung begann vor fast drei Jahren und ist nun das Ergebnis einer umfassenden Zusammenarbeit unter der Leitung des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme (IAIS).
Trainiert auf europäischen Daten für eine mehrsprachige Zukunft
Einer der einzigartigen Aspekte von Teuken-7B ist seine umfassende mehrsprachige Ausbildung. Sie wurde auf dem Juwels-Supercomputer des Forschungszentrums Jülich mit einem Datensatz trainiert, der zur Hälfte aus nicht-englischen Inhalten bestand und alle 24 offiziellen EU-Sprachen umfasste. Damit ist es eines der wenigen mehrsprachigen Modelle, das von Grund auf mit so umfangreichen linguistischen Fähigkeiten entwickelt wurde.
Diese mehrsprachige Grundlage macht Teuken-7B zu einer idealen Lösung für internationale Unternehmen, die eine mehrsprachige Kommunikationsunterstützung benötigen. Der Open-Source-Charakter des Modells bedeutet, dass Unternehmen es frei herunterladen und an ihre Bedürfnisse anpassen können, was es besonders nützlich für den Umgang mit vertraulichen internen Daten ohne Beteiligung Dritter macht. Das LLM-Model ist wie gewohnt auf HuggingFace kostenlos erhältlich.
Wer ist OpenGPT-X?
Das Projekt OpenGPT-X, das bis März 2025 läuft, wird von Fraunhofer IAIS und dem Fraunhofer-Institut für Integrierte Schaltungen (IIS) geleitet. An der Zusammenarbeit beteiligen sich auch renommierte Forschungseinrichtungen wie die Technische Universität Dresden, das Forschungszentrum Jülich und das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) sowie führende Unternehmen der Branche wie der Westdeutsche Rundfunk (WDR), Aleph-Alpha und Ionos.
Diese Partnerschaften haben entscheidend dazu beigetragen, das Potenzial von Teuken-7B als anpassungsfähiges und transparentes KI-Tool auszuschöpfen, das sowohl die Forschung als auch geschäftliche Innovationen in einer Vielzahl von Branchen vorantreiben soll.
Die Open-Source-Zugänglichkeit von Teuken-7B unterstreicht den wachsenden Bedarf an anpassbaren KI-Werkzeugen, bei denen Transparenz und Anpassungsfähigkeit im Vordergrund stehen. Durch das Angebot eines in Europa entwickelten Modells will OpenGPT-X die weitere Entwicklung von KI in einer Weise fördern, die mit den europäischen Werten des Datenschutzes und der Transparenz übereinstimmt. Forscherinnen und Forscher, Entwicklerinnen und Entwickler sowie Unternehmen können Teuken-7B nutzen, um KI-Anwendungen zu entwickeln, die auf ihre individuellen Anforderungen zugeschnitten sind - von der Automatisierung des Kundenservice bis hin zu fortschrittlichen Datenanalysen.