
Googles Ambitionen im Bereich der offenen KI sind heute deutlich ernster geworden. Das Unternehmen hat Gemma 4 veröffentlicht, eine Familie von vier Open-Weight-Modellen, die auf derselben Forschung wie Gemini 3 basieren und unter der Apache 2.0-Lizenz stehen – eine deutliche Abkehr von den restriktiveren Bedingungen früherer Gemma-Versionen.
Entwickler haben frühere Gemma-Generationen über 400 Millionen Mal heruntergeladen, wodurch mehr als 100.000 Community-Varianten entstanden sind. Diese Veröffentlichung ist die bisher ambitionierteste.
Wir haben soeben Gemma 4 veröffentlicht – unsere intelligentesten offenen Modelle bis heute.
Aufbauend auf derselben erstklassigen Forschung wie Gemini 3, bringt Gemma 4 bahnbrechende Intelligenz direkt auf Ihre eigene Hardware für fortgeschrittene Denkprozesse und agentenbasierte Arbeitsabläufe.
Veröffentlicht unter einer kommerziellen… pic.twitter.com/W6Tvj9CuHW
— Google (@Google) April 2, 2026
Im vergangenen Jahr wurde die Rangliste der Open-Source-KI weitgehend von chinesischen Modellen dominiert. DeepSeek, Minimax, GLM und Qwen belegten die Spitzenplätze und ließen amerikanische Alternativen um Relevanz kämpfen. Wie Decrypt letztes Jahr berichtete, stieg die Nutzung chinesischer Open-Modelle von kaum 1,2 % der weltweiten Open-Modell-Nutzung Ende 2024 auf rund 30 % bis Ende 2025, wobei Alibabas Qwen sogar Metas Llama als meistgenutztes selbst gehostetes Modell weltweit überholte.
Metas Llama war einst die Standardwahl für Entwickler, die ein leistungsfähiges, lokal ausführbares Modell wünschten. Dieser Ruf hat gelitten – Metas Llama-Lizenz warf Fragen bezüglich seines wahren Open-Source-Status auf, und seine Leistung fiel hinter die chinesische Konkurrenz zurück. Die OLMo-Familie des Allen Institute versuchte, die Lücke zu füllen, konnte aber keine nennenswerte Akzeptanz erzielen. OpenAI veröffentlichte seine gpt-oss-Modelle im August 2025, was dem Ökosystem frischen Wind verlieh, aber sie waren nie als führende Konkurrenten konzipiert.
Und gestern veröffentlichte ein 30-köpfiges US-Startup namens Arcee AI Trinity, ein offenes Modell mit 400 Milliarden Parametern, das überzeugend zeigte, dass die amerikanische Szene nicht völlig tot ist. Gemma 4 knüpft an diesen Schwung an, diesmal mit der vollen Unterstützung von Google DeepMind, und entwickelt sich damit zum wohl besten amerikanischen Modell in der Open-Source-KI-Szene.
Das Modell basiert auf „derselben erstklassigen Forschung und Technologie wie Gemini 3“, so Google in seiner Ankündigung. Gemma 4 wird in vier Größen ausgeliefert: Effektive 2B und 4B für Telefone und Edge-Geräte, ein 26B Mixture of Experts-Modell, das auf Geschwindigkeit ausgerichtet ist, und ein 31B Dense-Modell, das für höchste Qualität optimiert wurde.
Das 31B Dense rangiert derzeit unter allen offenen Modellen auf Platz drei der Text-Bestenliste von Arena AI. Das 26B MoE liegt an sechster Stelle. Google behauptet, dass beide Modelle übertreffen, die 20-mal so groß sind – eine Behauptung, die sich zumindest angesichts der Arena AI-Zahlen bestätigt, wo chinesische Modelle immer noch die ersten beiden Plätze belegen.
Wir haben Gemma 4 getestet. Es ist leistungsfähig, hat aber einige Einschränkungen. Das Modell wendet logisches Denken auch bei Aufgaben an, die es nicht erfordern, was dazu führen kann, dass Antworten bei einfachen Prompts überkonstruiert wirken. Kreatives Schreiben ist anständig – brauchbar, nicht inspirierend – und verbessert sich wahrscheinlich mit präziseren Anweisungen und Prompt-Engineering.
Am deutlichsten überzeugte es beim Code. Als es aufgefordert wurde, ein Spiel zu generieren, war das Ergebnis nicht besonders auffällig oder aufwendig, aber es lief beim ersten Versuch fehlerfrei. Nicht schlecht für ein Modell mit 41 Milliarden Parametern. Diese Zero-Shot-Zuverlässigkeit ist wohl wertvoller als ein schöneres Ergebnis, das Debugging erfordert.
Sie können das (einfache, aber funktionale) Spiel hier ausprobieren.
Die vier Varianten decken das gesamte Hardwarespektrum ab. Die E2B- und E4B-Modelle sind für Android-Telefone, Raspberry Pi und Edge-Geräte konzipiert, laufen vollständig offline mit nahezu keiner Latenz, nativem Audio-Input und einem 128K-Kontextfenster. Die 26B- und 31B-Modelle zielen auf Workstations und Cloud-Bereitstellungen ab, erweitern den Kontext auf 256K und fügen native Funktionsaufrufe und strukturierte JSON-Ausgabe für den Aufbau autonomer Agenten hinzu. Alle vier Modelle verarbeiten Bilder und Videos nativ. Die Full-Precision-Gewichte der größeren Modelle passen auf eine einzige 80GB NVIDIA H100 GPU; quantisierte Versionen laufen auf Consumer-Hardware.
Die Apache 2.0-Lizenz ist die andere Schlagzeile. Googles frühere Gemma-Veröffentlichungen verwendeten eine benutzerdefinierte Lizenz, die rechtliche Unklarheiten für kommerzielle Produkte schuf. Apache 2.0 beseitigt diese Reibung vollständig – Entwickler können modifizieren, weiterverbreiten und kommerzialisieren, ohne sich Sorgen machen zu müssen, dass Google die Bedingungen später ändert. Clement Delangue, Mitbegründer von Hugging Face, lobte dies und sagte: „Lokale KI hat ihren Moment“, und sie sei die Zukunft der KI-Branche. Google DeepMind CEO Demis Hassabis ging noch weiter und nannte Gemma 4 „die besten offenen Modelle der Welt für ihre jeweiligen Größen.“
Wir freuen uns, Gemma 4 vorzustellen: die besten offenen Modelle der Welt für ihre jeweiligen Größen. Erhältlich in 4 Größen, die für Ihre spezifische Aufgabe feinabgestimmt werden können: 31B Dense für hervorragende Rohleistung, 26B MoE für geringe Latenz und effektive 2B & 4B für die Nutzung auf Edge-Geräten – viel Spaß beim Entwickeln! pic.twitter.com/Sjbe3ph8xr
— Demis Hassabis (@demishassabis) April 2, 2026
Das ist eine kühne Behauptung. Proprietäre Systeme von Anthropic, OpenAI und Googles eigenem Gemini führen immer noch bei den schwierigsten Benchmarks. Aber für Open-Weight-Modelle, die Sie lokal ausführen, frei modifizieren und auf Ihrer eigenen Infrastruktur bereitstellen können? Die Konkurrenz ist gerade erheblich kleiner geworden. Sie können Gemma 4 jetzt im Google AI Studio (31B und 26B) oder in der Google AI Edge Gallery (E2B und E4B) ausprobieren. Modellgewichte sind auch auf Hugging Face, Kaggle und Ollama verfügbar.