Furto di Dati per Addestrare l’Intelligenza Artificiale

Apple, Nvidia e Anthropic hanno utilizzato migliaia di video di YouTube per addestrare l’IA

 Cari Amici di TuttoYouTube ben trovati! Il mondo dell’Intelligenza Artificiale e in forte crescita e oggi parleremo del lato oscuro che si cela dietro il motore che alimenta l’IA, ossia il machine learning. Le aziende tecnologiche stanno adottando tattiche controverse per nutrire i loro modelli di intelligenza artificiale, spesso a spese dei creatori di contenuti. In particolare, l’uso di materiale proveniente da migliaia di video di YouTube è diventato una pratica comune, nonostante le regole della piattaforma contro la raccolta non autorizzata.

L’intelligenza artificiale è sempre più presente nella nostra vita quotidiana, ma cosa c’è dietro il suo addestramento? Un’indagine di Proof News ha rivelato che alcune delle aziende di IA più potenti al mondo si affidano ai sottotitoli dei video di YouTube per nutrire i loro algoritmi. In questo articolo, esploreremo come YouTube Subtitles, un vasto set di dati, sta alimentando l’IA e quali implicazioni ciò comporta.

Il Segreto dell’Addestramento dell’IA

Il set di dati YouTube Subtitles contiene trascrizioni di 173.536 video provenienti da oltre 48.000 canali. Questi sottotitoli sono stati utilizzati da giganti della Silicon Valley come Anthropic, Nvidia, Apple e Salesforce per addestrare i loro modelli di IA. Ma come è possibile che materiale proveniente da video educativi, talk show e persino da celebrità di YouTube stia finendo nei laboratori di IA? 

LEGGI ANCHE:  YouTube e la Rivoluzione Pubblicitaria

Nel Mirino Anche le Celebrità

 Persino le celebrità di YouTube sono coinvolte. MrBeast, con i suoi 289 milioni di abbonati, ha fornito materiale per l’allenamento dell’IA, così come Marques Brownlee (19 milioni di abbonati) e Jacksepticeye (quasi 31 milioni di abbonati). Questi creatori di contenuti potrebbero non essere consapevoli del ruolo che i loro video giocano nell’addestramento delle macchine.

Una Miniera d’Oro Chiamata YouTube

Le aziende di intelligenza artificiale competono l’una contro l’altra, in parte procurandosi dati di qualità superiore, ha affermato Jai Vipra, ricercatore di politiche sull’intelligenza artificiale e borsista CyberBRICS presso la Fundação Getulio Vargas Law School, a Rio de Janeiro, in Brasile. È uno dei motivi per cui le aziende tengono le fonti di dati a portata di mano.

All’inizio di quest’anno, il New York Times ha riferito che Google, che possiede YouTube, ha sfruttato i video sulla piattaforma per il testo per addestrare i suoi modelli. In risposta, un portavoce ha detto al giornale che il suo uso era consentito in base agli accordi con i creatori di YouTube. L’indagine del Times ha anche scoperto che OpenAI ha utilizzato i video di YouTube senza autorizzazione.

LEGGI ANCHE:  YouTube, come rendere privato il tuo canale

I rappresentanti dell’azienda non hanno né confermato né smentito i risultati del documento. I dirigenti di OpenAI hanno ripetutamente rifiutato di rispondere pubblicamente alle domande sull’utilizzo dei video di YouTube per addestrare il suo prodotto di intelligenza artificiale Sora, che crea video da prompt di testo. All’inizio di quest’anno, un giornalista del Wall Street Journal ha posto la domanda a Mira Murati, Chief Technology Officer di OpenAI.

Conclusione

L’Intelligenza Artificiale (IA) è sempre più presente nella nostra vita quotidiana, ma spesso ci sfugge il processo di addestramento che sta dietro a queste tecnologie. Ma come è possibile che materiale proveniente da video educativi, talk show e persino da celebrità di YouTube stia finendo nei laboratori di IA? Le aziende di IA spesso mantengono segrete le loro fonti di dati di addestramento. Nonostante le regole di YouTube contro la raccolta non autorizzata, sembra che le aziende ignorino tali restrizioni. I sottotitoli, che contengono trascrizioni accurate dei video, rappresentano un’opportunità preziosa per l’addestramento dell’IA. Rimanete sintonizzati su TuttoYouTube per ulteriori sviluppi sulla vicenda!

Lascia un commento

Your email address will not be published.