Site-uri de știri, precum New York Times, CNN, Reuters și Australian Broadcasting Corporation (ABC) au blocat un instrument OpenAI, limitând capacitatea companiei de a continua să acceseze conținutul lor.

OpenAI se află în spatele unuia dintre cei mai cunoscuți chatbots de inteligență artificială, ChatGPT. Crawler-ul lor web – cunoscut sub numele de GPTBot – poate scana pagini pentru a ajuta la îmbunătățirea modelelor sale AI.

The Verge a fost prima publicație care a raportat că New York Times a blocat GPTBot pe site-ul său. The Guardian a constatat ulterior că alte site-uri web de știri importante, inclusiv CNN, Reuters, Chicago Tribune, ABC și mărcile Australian Community Media (ACM), precum Canberra Times și Newcastle Herald, par să fi interzis, de asemenea, crawler-ul web.

Așa-numitele modele de limbaj mari, cum ar fi ChatGPT, necesită cantități mari de informații pentru a-și antrena sistemele și le permite să răspundă la întrebările utilizatorilor în moduri care seamănă cu modelele limbajului uman. Dar companiile din spatele lor sunt adesea neglijente cu privire la prezența materialelor protejate prin drepturi de autor în seturile lor de date.

Blocarea GPTBot poate fi văzută în fișierele robots.txt ale editorilor, care transmit crawlerilor din motoarele de căutare și altor entități ce pagini au voie să viziteze.

„Permiterea GPTBot să acceseze site-ul poate ajuta modelele AI să devină mai precise și să își îmbunătățească capacitățile generale și siguranța”, a transmis OpenAI într-o postare pe blog care include instrucțiuni despre cum poate fi interzis accesul crawlerul-ui.

Toate site-urile de presă examinate au blocat accesul în august. Unii au interzis, de asemenea, CCBot, crawler-ul web pentru un depozit deschis de date web cunoscut sub numele de Common Crawl, care a fost folosit și pentru proiecte AI.

CNN a confirmat pentru Guardian Australia că a blocat recent GPTBot în toate titlurile sale, dar nu a comentat dacă marca intenționează să ia măsuri suplimentare cu privire la utilizarea conținutului său în sistemele AI.

Un purtător de cuvânt al Reuters a declarat că agenția de presă revizuiește în mod regulat termenii și condițiile site-ului. „Deoarece proprietatea intelectuală este componenta vitală a afacerii noastre, este imperativ să protejăm drepturile de autor asupra conținutului nostru”, a spus ea.

Termenii și condițiile New York Times au trecut recent printr-o actualizare pentru a face interzicerea „răzuirii conținutului nostru pentru instruirea și dezvoltarea AI ... și mai clară”, potrivit unui purtător de cuvânt.

Începând cu 3 august, regulile site-ului web interzic în mod explicit ca articolele să fie utilizate pentru „dezvoltarea oricărui program software, inclusiv, dar fără a se limita la, formarea unui sistem de învățare automată sau inteligență artificială (AI)” fără consimțământ.

Organismele de știri la nivel global se confruntă cu decizii cu privire la utilizarea AI ca parte a culegerii de știri și, de asemenea, cu privire la modul în care conținutul lor poate fi absorbit de grupurile de instruire de către companiile care dezvoltă sisteme AI.

