Stable Diffusion XL in Version 1.0 (Bild © Stability AI)
Der Generierungsprozess der neuen Version basiert auf 3,5 Milliarden Parametern, aus denen die KI das neue Bild erstellt. Ältere Versionen von Stable Diffusion konnten zwar hochauflösende Bilder generieren, brauchten aber deutlich mehr Rechenleistung und Speicherplatz.
Der Fokus der Entwickler beim Training liegt auf der Verfeinerung von Bildinhalten, die aufgrund ihrer Ähnlichkeit keinen Sinn ergeben. Dabei wird versucht die Erstellung von pornografischen Inhalten zu verhindern, insbesondere Bildern, die Personen in unrealistischen Szenarien zeigen. Stability AI arbeitet kontinuierlich daran, so viele problematische Aufforderungen wie möglich zu blockieren und solche Inhalte nicht zu produzieren.
Stability AI plant außerdem die Einführung einer Beta-Funktion, mit der Nutzer ein Modell anhand weniger Bilder trainieren können. Damit wären sie in der Lage weitere Bilder dieses Typs zu erstellt, sofern sie keine fragwürdigen Inhalte enthalten. Diese Funktion soll es den Nutzern dabei helfen, das Modell auf bestimmte Personen oder Objekte zu trainieren, die dann in verschiedenen Szenarien in nachfolgenden Bildern dargestellt werden können.