Apple, Nvidia ja Salesforce kasutavad YouTube’i sisu oma tehisintellekti koolitamiseks.
“Näiteks oled sa loonud Youtubes koolituse kanali, kulutanud oma raha ja aega, teadmisi selleks, siis sinu loomingut kasutab Big Tech oma AI arendamiseks ilma sinu teadmata ja sa ei saa mingit tasu. Inimesed, kes kasutavad tasuta info otsimisel AI abi, võivad saada nüüd sinu koolitusinfo tasuta…” – Veiko Huuse
Proof Newsi ja Wiredi andmetel kasutasid need ettevõtted koolitusandmetena 173 536 YouTube’i video subtiitreid, mis on levinud 48 000 YouTube’i kanalis .
Andmekogum, mida nimetatakse YouTube’i subtiitriteks, sisaldab ärakirju hariduskanalitest, nagu Khan Academy, MIT ja Harvard, aga ka meediaväljaannetest, nagu The Wall Street Journal, NPR ja BBC.
Kasutati ka hilisõhtuseid saateid, nagu The Late Show, Last Week Tonight ja Jimmy Kimmel Live, öeldakse raportis.
Lisaks leidis Proof News, et populaarsed YouTube’i kasutajad, nagu MrBeast, Marques Brownlee, Jacksepticeye ja PewDiePie, lisasid oma videod.
Rohkem kui 2 miljoni tellija ja enam kui 2 miljardi vaatamise arvuga The David Pakman Show saatejuht David Pakman kommenteeris: “Keegi ei tulnud minu juurde ega öelnud:” Tahaksime seda kasutada.
“See on minu elatis ja ma panen selle sisu loomisse aega, ressursse, raha ja töötajate aega. Tööst tõesti puudust pole,” lisas ta, väites, et kui tehisintellektifirmadele makstakse, tuleks talle oma andmed hüvitada.
Nebula tegevjuht Dave Wiskus ei peenunud sõnu : „See on vargus. Kas seda kasutatakse kunstnike ärakasutamiseks ja kahjustamiseks? Jah, absoluutselt.”
Andmed olid osa The Pile’ist, avaldatud andmete kogumist, mis sisaldab sisu YouTube’ist, Euroopa Parlamendist, ingliskeelsest Vikipeediast ja ettevõtete e-kirjadest.
Apple kasutas OpenELM-i jaoks Pile’i enne oma toodetele uute tehisintellekti funktsioonide lisamist. Bloomberg ja Databricks kasutasid oma väljaannete kohaselt ka Pile’i. 4 miljardi dollari suuruse Amazoni investeeringuga toetatud tehisintellektiettevõte Anthropic kinnitas, et kasutab Pile’i oma tehisintellekti abilise Claude’i jaoks, rõhutades samas YouTube’i tingimuste järgimist, kirjutas Wired .
Salesforce kasutas Pile’i akadeemiliseks ja teadustööks mõeldud tehisintellekti mudeli jaoks, avaldades selle avalikult 2022. aastal. Seda mudelit on alla laaditud üle 86 000 korra.
Käimas on kohtuvaidlused ettevõtete vastu, kes kasutavad tehisintellekti koolituseks volitamata andmeid. Autorid on kaevanud kohtusse teoste kasutamise sellistes andmekogumites nagu Books3, teine Pile’i komponent. Tehnikaettevõtted väidavad, et nende tegevus kuulub õiglase kasutamise alla, kuid juriidilised lahingud jätkuvad.
Loe Wiredi täispikka lugu siit .