Per addestrare l’intelligenza artificiale generativa, le aziende tecnologiche possono attingere a due pool di dati: pubblici e privati. I dati pubblici sono disponibili sul Web e chiunque può usufruirne, mentre i dati privati includono messaggi di testo, e-mail e post sui social media creati da account privati.
Le fonti pubbliche però si stanno esaurendo rapidamente e le aziende stanno ricorrendo a database privati protetti dalle leggi sulla privacy per addestrare la propria intelligenza artificiale. Ovviamente la novità doveva passare in sordina, e per non avere problemi legali in questi mesi le aziende hanno cambiato i termini della privacy inserendo piccole modifiche nelle loro dichiarazioni al fine di permettergli l’utilizzo dei dati.
All’inizio di quest’anno, la Federal Trade Commission aveva avvertito che le aziende avrebbero potuto modificare i termini e le condizioni delle loro dichiarazioni sulla privacy per permettergli di utilizzare i dati dei clienti per addestrare modelli di AI. Al fine di evitare problemi con gli utenti, le aziende potrebbero apportare queste modifiche in modo silenzioso, ha affermato la commissione. Tuttavia, tali azioni sarebbero illegali e qualsiasi azienda rinunci ai suoi impegni sulla privacy degli utenti rischia grosse sanzioni. Secondo un’analisi del New York Times questo, però, è esattamente ciò che sta accadendo.
Le aziende per addestrare i propri modelli di AI hanno bisogno di un maggior numero di fonti, e per risolvere il problema stanno ricorrendo ai dati protetti dalle leggi sulla privacy. Per darsi una copertura legale, stanno riscrivendo con attenzione i loro termini e condizioni per includere parole come “intelligenza artificiale,” “apprendimento automatico,” e “AI generativa”.
Google, Adobe e Meta
Google è solo un esempio. Lo scorso luglio, ha apportato diverse modifiche chiave alla sua politica sulla privacy. Google ha spiegato al Times che “ha aggiunto alcuni servizi più recenti come Bard (ora Gemini). Non abbiamo iniziato ad addestrare modelli su ulteriori tipi di dati”.
Stessa cosa è accaduta lo scorso mese con Adobe, azione che gli si è ritorta contro come un boomerang. Un popup ha notificato agli utenti l’aggiornamento, affermando in modo non chiaro che l’azienda potrebbe accedere e rivendicare la proprietà dei contenuti creati con il suo Creative Suite per addestrare modelli di AI.
Molti utenti furiosi hanno cancellato il proprio abbonamento, soprattutto dopo aver realizzato che non potevano accedere al proprio account senza accettare i nuovi termini. La cosa ha costretto Adobe a rilasciare una dichiarazione sui termini aggiornati.
Anche Meta a maggio ha informato i suoi utenti di Facebook e Instagram in Europa che avrebbe utilizzato post pubblicamente disponibili per addestrare la sua AI. Tuttavia, dopo le lamentele del Centro Europeo per i Diritti Digitali in 11 paesi europei, Meta ha sospeso questi piani. Per Meta però non è stato un grosso problema perché può continuare ad attingere dai suoi utenti negli Stati Uniti dove la protezione dei dati personali e le politiche sulla privacy sono meno stringenti.
Leggi anche: Il negli USA si avvicina ma TikTok fa finta di niente