Apple, Nvidia şi alţii au folosit transcrierile clipurilor de YouTube, fără permisiune, pentru a-şi antrena sistemele de inteligenţă artificială, arată o investigaţie citată de News.ro.
Conform investigaţiei realizate de Proof News, mai multe mari companii care dezvoltă tehnologii de inteligenţă artificială, printre care Apple, Nvidia şi Anthropic şi-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube.
Acestea au ajuns în posesia datelor prin intermediul unui nonprofit, numit EleutherAI, care a preluat transcrierile a peste 48.000 de canale de YouTube.
Şi asta fără a avea vreun fel de permisiune din partea creatorilor de conţinut şi fără a-i compensa pe aceştia în vreun fel.
Setul de date folosit de aceste companii nu conţine imagini sau filmările propriu-zise, dar include transcrierile şi subtitrările clipurilor postate de unii dintre cei mai importanţi creatori, precum Marques Brownlee şi MrBeast.
Companiile de AI evită să fie transparente în privinţa datelor pe care le folosesc pentru a-şi antrena modelele lingvistice. Unele dintre acestea, însă, recunosc tacit că preiau toate textele pe care le găsesc gratuit pe internet.
În acelaşi timp, cu excepţia câtorva înţelegeri făcute cu unele dintre marile publicaţii americane, proprietarii textelor nu sunt compensaţi în niciun fel.