google-gemma-4-open-source-ai
Google reintră în cursa AI open source cu Gemma 4
Google lansează Gemma 4, o familie de modele deschise sub licența Apache 2.0, chiar în momentul în care scena open-source din SUA avea mare nevoie de un succes.
2026-04-02 Sursă:decrypt.co

Pe scurt

  • Google a lansat Gemma 4, o familie de modele deschise sub licența Apache 2.0.
  • Gama de patru modele acoperă de la telefoane la centre de date, modelul de 31B fiind deja pe locul 3 la nivel global.
  • Inteligența artificială open-source din SUA primește un impuls necesar, deoarece Gemma 4—susținută de DeepMind—se poziționează ca cel mai puternic concurent american împotriva DeepSeek, Qwen și a altor lideri chinezi.

Ambițiile Google în materie de inteligență artificială deschisă au devenit mult mai serioase astăzi. Compania a lansat Gemma 4, o familie de patru modele open-weight construite pe baza aceleiași cercetări ca Gemini 3 și licențiate sub Apache 2.0—o deviație semnificativă de la termenii mai restrictivi ai versiunilor anterioare Gemma.

Dezvoltatorii au descărcat generațiile anterioare Gemma de peste 400 de milioane de ori, dând naștere la peste 100.000 de variante comunitare. Această lansare este cea mai ambițioasă de până acum.

Tocmai am lansat Gemma 4 — cele mai inteligente modele deschise ale noastre de până acum.

Construite pe baza aceleiași cercetări de clasă mondială ca Gemini 3, Gemma 4 aduce inteligență revoluționară direct pe propriul hardware pentru raționamente avansate și fluxuri de lucru bazate pe agenți.

Lansat sub o licență comercială… pic.twitter.com/W6Tvj9CuHW

— Google (@Google) Aprilie 2, 2026

În ultimul an, clasamentul AI open-source a fost în mare parte o afacere chineză. DeepSeek, Minimax, GLM și Qwen au dominat primele locuri, lăsând alternativele americane să se zbată pentru relevanță. Așa cum a raportat Decrypt anul trecut, modelele deschise chineze au trecut de la abia 1,2% din utilizarea globală a modelelor deschise la sfârșitul anului 2024 la aproximativ 30% până la sfârșitul anului 2025, cu Qwen de la Alibaba depășind chiar și Llama de la Meta ca cel mai utilizat model self-hosted la nivel mondial.

Llama de la Meta era alegerea implicită pentru dezvoltatorii care doreau un model capabil, rulabil local. Această reputație s-a erodat—licența controlată de Meta a Llama a ridicat semne de întrebare cu privire la adevăratul său statut open-source, iar performanța sa a scăzut în spatele concurenței chineze. Familia OLMo de la Allen Institute a încercat să umple golul, dar nu a reușit să câștige tracțiune semnificativă. OpenAI a lansat modelele sale gpt-oss în august 2025, ceea ce a oferit ecosistemului o gură de aer proaspăt, dar acestea nu au fost niciodată concepute pentru a fi concurenți de vârf.

Și ieri, un startup american de 30 de persoane, numit Arcee AI, a lansat Trinity, un model deschis cu 400 de miliarde de parametri, care a demonstrat convingător că scena americană nu era complet moartă. Gemma 4 continuă acest impuls, de data aceasta cu întreaga greutate a Google DeepMind în spate, transformându-l, probabil, în cel mai bun model american din scena AI open-source.

Modelul este "construit pe baza aceleiași cercetări și tehnologii de clasă mondială ca Gemini 3", a declarat Google în anunțul său. Gemma 4 este livrat în patru dimensiuni: Effective 2B și 4B pentru telefoane și dispozitive edge, un model Mixture of Experts (MoE) de 26B axat pe viteză și un model Dense de 31B optimizat pentru calitate brută.

Modelul Dense de 31B se clasează în prezent pe locul trei printre toate modelele deschise din clasamentul de text al Arena AI. Modelul MoE de 26B ocupă locul șase. Google susține că ambele depășesc modele de 20 de ori mai mari—o afirmație care se susține, cel puțin în comparație cu cifrele Arena AI, unde modelele chineze dețin încă primele două locuri.

Am testat Gemma 4. Este capabil, cu unele rezerve. Modelul aplică raționamentul chiar și sarcinilor care nu o cer, ceea ce poate face ca răspunsurile să pară supratehnologizate pentru solicitări simple. Scrierea creativă este decentă—acceptabilă, nu inspirată—și, probabil, se îmbunătățește cu îndrumări mai specifice și prompt engineering.

Unde a excelat cel mai clar a fost în cod. Solicitat să genereze un joc, rezultatul nu a fost deosebit de spectaculos sau elaborat, dar a rulat fără erori de la prima încercare. Nu e rău pentru un model cu 41 de miliarde de parametri. Această fiabilitate "zero-shot" este, probabil, mai valoroasă decât un rezultat mai frumos care necesită depanare.

Puteți încerca jocul (simplu, dar funcțional) aici.

Cele patru variante acoperă întregul spectru hardware. Modelele E2B și E4B sunt construite pentru telefoane Android, Raspberry Pi și dispozitive edge, rulând complet offline cu latență aproape zero, intrare audio nativă și o fereastră de context de 128K. Modelele de 26B și 31B vizează stațiile de lucru și implementările în cloud, extinzând contextul la 256K și adăugând funcționalitate nativă de apelare a funcțiilor și ieșire JSON structurată pentru construirea agenților autonomi. Toate cele patru modele procesează imagini și video nativ. Ponderile de precizie completă ale modelelor mai mari încap pe un singur GPU NVIDIA H100 de 80GB; versiunile cuantificate rulează pe hardware-ul consumatorilor.

Licența Apache 2.0 este cealaltă noutate. Versiunile anterioare Gemma de la Google au folosit o licență personalizată care a creat ambiguitate legală pentru produsele comerciale. Apache 2.0 elimină complet această fricțiune—dezvoltatorii pot modifica, redistribui și comercializa fără să-și facă griji că Google va schimba termenii ulterior. Co-fondatorul Hugging Face, Clement Delangue, a lăudat-o, spunând că "AI-ul local își are momentul" și că este viitorul industriei AI. CEO-ul Google DeepMind, Demis Hassabis, a mers mai departe, numind Gemma 4 "cele mai bune modele deschise din lume pentru dimensiunile lor respective."

Suntem încântați să lansăm Gemma 4: cele mai bune modele deschise din lume pentru dimensiunile lor respective. Disponibile în 4 dimensiuni care pot fi ajustate pentru sarcina dvs. specifică: 31B dense pentru o performanță brută excelentă, 26B MoE pentru latență redusă și 2B & 4B eficiente pentru utilizarea pe dispozitive edge - construcție plăcută! pic.twitter.com/Sjbe3ph8xr

— Demis Hassabis (@demishassabis) Aprilie 2, 2026

Aceasta este o afirmație puternică. Sistemele proprietare de la Anthropic, OpenAI și propriul Gemini al Google sunt încă lideri la cele mai dificile benchmark-uri. Dar pentru modelele open-weight pe care le poți rula local, le poți modifica liber și le poți implementa pe propria infrastructură? Concurența tocmai a devenit semnificativ mai subțire. Puteți încerca Gemma 4 acum în Google AI Studio (31B și 26B) sau Google AI Edge Gallery (E2B și E4B). Ponderile modelului sunt, de asemenea, disponibile pe Hugging Face, Kaggle și Ollama.