AcasăCentrul de știri LBank
Internetul mort? O treime dintre noile site-uri sunt generate de AI, spune Stanford
one-third-new-websites-ai-generated-study
Internetul mort? O treime dintre noile site-uri sunt generate de AI, spune Stanford
Un studiu condus de Stanford a cuantificat ceea ce toată lumea bănuia deja—dar rezultatele nu sunt chiar ceea ce se așteptau oamenii.
2026-04-28 Sursă:decrypt.co

Pe scurt

  • Până la mijlocul anului 2025, 35% dintre site-urile web nou publicate au fost generate sau asistate de inteligența artificială (AI), o creștere de la zero înainte de lansarea ChatGPT în noiembrie 2022.
  • Efectele confirmate sunt contracția semantică și pozitivitatea artificială – nu dezinformarea sau omogenitatea stilistică, în ciuda a ceea ce cred majoritatea oamenilor.
  • La o prevalență AI de 35%, riscul de colaps al modelului se transformă dintr-o preocupare teoretică într-una empirică pentru următoarea generație de modele fundamentale.

Un nou studiu indică un procent pentru cât de mult din internet este acum generat de AI: 35%. Acesta este procentul de site-uri web nou publicate clasificate ca fiind generate sau asistate de AI până la mijlocul anului 2025, conform cercetărilor de la Universitatea Stanford, Imperial College London și Internet Archive. Cifra era practic zero înainte de lansarea ChatGPT în noiembrie 2022.

"Consider viteza pură a preluării web-ului de către AI destul de uimitoare", a declarat Jonáš Doležal, cercetător la Imperial College London și co-autor al lucrării, pentru 404 Media. "După decenii în care oamenii l-au modelat, o porțiune semnificativă a internetului a fost definită de AI în doar trei ani."

Studiul, intitulat „Impactul textului generat de AI asupra internetului”, s-a bazat pe instantanee de site-uri web din 33 de luni, preluate de la Wayback Machine a Internet Archive, și a folosit un detector de text AI numit Pangram v3 pentru a clasifica fiecare pagină.

Daunele confirmate: stări de spirit, nu fapte

Cercetătorii au testat șase ipoteze despre ce face conținutul AI pe web. Doar două s-au confirmat în urma analizei datelor.

Primul: Ne transformăm într-o hoardă de NPC-uri proaste care acționează la fel... Sau, mai științific spus, web-ul devine mai puțin divers din punct de vedere semantic.

Site-urile generate de AI au prezentat scoruri de similitudine semantică în perechi cu 33% mai mari decât cele scrise de oameni. Aceleași idei continuă să fie exprimate în aproape aceleași moduri.

Lucrarea sugerează că fereastra Overton online s-ar putea restrânge, nu prin cenzură sau campanii coordonate, ci pentru că modelele lingvistice optimizează rezultatele apropiate de distribuția lor de antrenament.

Al doilea: Web-ul devine agresiv de optimist.

Conținutul AI a prezentat scoruri de sentiment pozitiv cu peste 107% mai mari decât conținutul uman. Cercetătorii leagă acest lucru de tendințele sicofrantice bine documentate ale LLM-urilor – antrenate pe semnale de aprobare umană, acestea produc texte care par igienizate, fără fricțiuni și neobosit de optimiste.

Un internet inundat de conținut optimist și omogenizat ar putea marginaliza disidența umană la scară largă, fără ca nimeni să acționeze vreo pârghie.

În ciuda credinței publice larg răspândite, studiul nu a găsit dovezi semnificative statistic că conținutul AI face internetul mai puțin precis din punct de vedere faptic. Cercetătorii nu au găsit nicio corelație semnificativă între prevalența AI și rata erorilor factuale.

Ipoteza monoculturii stilistice – AI aplatizând vocile individuale într-un registru uniform generic – a fost convingerea cea mai puternic susținută de respondenți (83% au fost de acord). Datele nu au confirmat-o. Analiza la nivel de caracter nu a găsit o creștere semnificativă statistic a omogenității stilistice legată de prevalența AI.

Problema colapsului modelului tocmai a devenit reală

Mizele mai largi depășesc calitatea discursului. La o prevalență AI de 35%, riscul teoretic de colaps al modelului – unde modelele viitoare se degradează după antrenarea pe date generate de AI – se transformă dintr-o preocupare academică într-o realitate empirică. Modelele fundamentale viitoare antrenate pe parcurgeri web contemporane vor ingera inevitabil date care sunt substanțial generate de AI și măsurabil mai puțin diverse semantic.

Echipa lucrează acum cu Internet Archive pentru a transforma studiul într-un instrument de monitorizare continuă, în timp real, urmărind ponderea AI pe web în loc de un instantaneu singular.

Un sondaj american realizat în paralel cu studiul a constatat că majoritatea americanilor cred deja în toate cele șase ipoteze negative, inclusiv în cele pe care datele nu le susțin. Persoanele care utilizează AI rar au fost cu 12% mai predispuse să creadă în daune decât utilizatorii frecvenți. Adepți ai Teoriei Internetului Mort, faceți cunoștință cu datele: Internetul nu este mort, dar 35% din ceea ce este nou este probabil într-un fel conținut zombi.