Wayback Machine, archivio digitale gestito da Internet Archive, è una risorsa unica e preziosa che permette di visionare le versioni passate di siti web. Questo sistema, avviato nel 2001, fotografa regolarmente tutte le pagine web accessibili in rete, condividendo online uno storico che può essere consultato da chiunque.
Reddit ha deciso di bloccare questo archivio impedendo al sistema di archiviare la maggior parte di pagine e contenuti della piattaforma: Wayback Machine potrà indicizzare solo l’homepage. Una decisione presa in seguito all’identificazione di numerose attività di scraping dei suoi dati: Reddit afferma di aver scoperto che alcune aziende di intelligenza artificiale hanno effettuato scraping dei suoi dati dall’Internet Archive e, in particolare, dalla Wayback Machine. Per questo, Wayback Machine non potrà più eseguire la scansione delle pagine con i dettagli dei post, dei commenti o dei profili.
“Internet Archive fornisce un servizio al web aperto, ma siamo venuti a conoscenza di casi in cui aziende di AI violano le politiche delle piattaforme, incluse le nostre, e fanno scraping dei dati dalla Wayback Machine” ha dichiarato il portavoce Tim Rathschmidt a The Verge. “Finché non saranno in grado di proteggere il loro sito e di rispettare le politiche delle piattaforme limiteremo parte del loro accesso ai dati di Reddit per proteggere i redditor”, ha aggiunto Rathschmidt.
Lo scorso ottobre Internet Archive è stato protagonista di un attacco hacker, un attacco DDos rivendicato da un utente di X, che si fa chiamare SN_Blackmeta. Questo attacco potrebbe aver compromessi i dati degli utenti della piattaforma: infatti, sul web, sono comparsi indizi che hanno confermato l’ipotesi di una violazione del database contenenti le informazioni personali degli utenti registrati al portale. Un furto che potrebbe aver coinvolto 31 milioni di utenti che utilizzano i servizi dell’organizzazione per accedere alla sua gigantesca collezione di libri, video e documenti.