Agregare de etichete de știri cripto și știri tematice

one-third-new-websites-ai-generated-study

Internetul mort? O treime dintre noile site-uri sunt generate de AI, spune Stanford

Un studiu condus de Stanford a cuantificat ceea ce toată lumea bănuia deja—dar rezultatele nu sunt chiar ceea ce se așteptau oamenii.

2026-04-28 Sursă:decrypt.co

Risc de prăbușire a modelului

Studiu Internet Archive

Site-uri web generate de AI

Pe scurt

Până la mijlocul anului 2025, 35% dintre site-urile web nou publicate au fost generate sau asistate de inteligența artificială (AI), o creștere de la zero înainte de lansarea ChatGPT în noiembrie 2022.
Efectele confirmate sunt contracția semantică și pozitivitatea artificială – nu dezinformarea sau omogenitatea stilistică, în ciuda a ceea ce cred majoritatea oamenilor.
La o prevalență AI de 35%, riscul de colaps al modelului se transformă dintr-o preocupare teoretică într-una empirică pentru următoarea generație de modele fundamentale.

Un nou studiu indică un procent pentru cât de mult din internet este acum generat de AI: 35%. Acesta este procentul de site-uri web nou publicate clasificate ca fiind generate sau asistate de AI până la mijlocul anului 2025, conform cercetărilor de la Universitatea Stanford, Imperial College London și Internet Archive. Cifra era practic zero înainte de lansarea ChatGPT în noiembrie 2022.

"Consider viteza pură a preluării web-ului de către AI destul de uimitoare", a declarat Jonáš Doležal, cercetător la Imperial College London și co-autor al lucrării, pentru 404 Media. "După decenii în care oamenii l-au modelat, o porțiune semnificativă a internetului a fost definită de AI în doar trei ani."

Studiul, intitulat „Impactul textului generat de AI asupra internetului”, s-a bazat pe instantanee de site-uri web din 33 de luni, preluate de la Wayback Machine a Internet Archive, și a folosit un detector de text AI numit Pangram v3 pentru a clasifica fiecare pagină.

Daunele confirmate: stări de spirit, nu fapte

Cercetătorii au testat șase ipoteze despre ce face conținutul AI pe web. Doar două s-au confirmat în urma analizei datelor.

Primul: Ne transformăm într-o hoardă de NPC-uri proaste care acționează la fel... Sau, mai științific spus, web-ul devine mai puțin divers din punct de vedere semantic.

Site-urile generate de AI au prezentat scoruri de similitudine semantică în perechi cu 33% mai mari decât cele scrise de oameni. Aceleași idei continuă să fie exprimate în aproape aceleași moduri.

Lucrarea sugerează că fereastra Overton online s-ar putea restrânge, nu prin cenzură sau campanii coordonate, ci pentru că modelele lingvistice optimizează rezultatele apropiate de distribuția lor de antrenament.

Al doilea: Web-ul devine agresiv de optimist.

Conținutul AI a prezentat scoruri de sentiment pozitiv cu peste 107% mai mari decât conținutul uman. Cercetătorii leagă acest lucru de tendințele sicofrantice bine documentate ale LLM-urilor – antrenate pe semnale de aprobare umană, acestea produc texte care par igienizate, fără fricțiuni și neobosit de optimiste.

Un internet inundat de conținut optimist și omogenizat ar putea marginaliza disidența umană la scară largă, fără ca nimeni să acționeze vreo pârghie.

În ciuda credinței publice larg răspândite, studiul nu a găsit dovezi semnificative statistic că conținutul AI face internetul mai puțin precis din punct de vedere faptic. Cercetătorii nu au găsit nicio corelație semnificativă între prevalența AI și rata erorilor factuale.

Ipoteza monoculturii stilistice – AI aplatizând vocile individuale într-un registru uniform generic – a fost convingerea cea mai puternic susținută de respondenți (83% au fost de acord). Datele nu au confirmat-o. Analiza la nivel de caracter nu a găsit o creștere semnificativă statistic a omogenității stilistice legată de prevalența AI.

Problema colapsului modelului tocmai a devenit reală

Mizele mai largi depășesc calitatea discursului. La o prevalență AI de 35%, riscul teoretic de colaps al modelului – unde modelele viitoare se degradează după antrenarea pe date generate de AI – se transformă dintr-o preocupare academică într-o realitate empirică. Modelele fundamentale viitoare antrenate pe parcurgeri web contemporane vor ingera inevitabil date care sunt substanțial generate de AI și măsurabil mai puțin diverse semantic.

Echipa lucrează acum cu Internet Archive pentru a transforma studiul într-un instrument de monitorizare continuă, în timp real, urmărind ponderea AI pe web în loc de un instantaneu singular.

Un sondaj american realizat în paralel cu studiul a constatat că majoritatea americanilor cred deja în toate cele șase ipoteze negative, inclusiv în cele pe care datele nu le susțin. Persoanele care utilizează AI rar au fost cu 12% mai predispuse să creadă în daune decât utilizatorii frecvenți. Adepți ai Teoriei Internetului Mort, faceți cunoștință cu datele: Internetul nu este mort, dar 35% din ceea ce este nou este probabil într-un fel conținut zombi.

Lecturi populare

Bitcoin și ETH se confruntă cu o scadență de 11 miliarde de dolari pe măsură ce vânzarea masivă de cripto se intensifică

Acum 18 ore

Senatul se grăbește să avanseze legislația cripto în iulie, în timp ce turbulențele proiectului de lege privind locuințele amenință calendarul

Acum 20 ore

Multicoin prognozează HYPE la $319 până în 2028, pe măsură ce Hyperliquid devine un „everything exchange”

Acum 23 ore

Alte articole

Portofelele OG Ethereum se vând în cele din urmă după 8 ani, asigurând un profit estimat de 27 milioane $ după un vârf nerealizat de 150 milioane $: analiști on-chain

Acum 3 ore

Framework Ventures strânge 400 de milioane de dolari pentru al patrulea fond, destinat investițiilor în crypto, AI și robotică

Acum 4 ore