Seleziona una pagina
sabato, Ott 30

Internet archive, da 25 anni salva la rete dal suo stesso oblio



Da Wired.it :

A questi potremmo aggiungere lo smarrimento di un enorme archivio socioculturale come Yahoo Answer, la cancellazione di centinaia di migliaia di foto presenti su Flickr (alcune salvate proprio sull’Archive), la scomparsa di 50 milioni di canzoni su Myspace o dei blog di Splinder. A cadere vittima della fragilità di internet sono anche contenuti di particolare importanza: inchieste giornalistiche finaliste del Pulitzer o ricerche accademiche contenute in riviste specializzate (che sempre più spesso vengono pubblicate solamente online). Tra siti, riviste e piattaforme che hanno chiuso i battenti o pagine che hanno cambiato url e non sono più raggiungibili, la quantità di link “rotti” e di contenuti del web non più esistenti sta raggiungendo i livelli di guardia.

Da questo punto di vista, il fatto che già nel 1996 (quando soltanto 45 milioni di persone in tutto il mondo erano connesse a internet) qualcuno abbia pensato a costruire uno strumento in grado di archiviare il web – e anche libri, video, audio, software e altro – ha davvero del profetico. Nei suoi 25 anni di esistenza, l’Internet Archive ha salvato oltre 600 miliardi di pagine, che occupano qualcosa come 70 petabytes di dati. Tutti noi, inoltre, possiamo contribuire alla causa. Usando il tasto Save della Wayback Machine è infatti possibile inserire la url di una pagina che vogliamo conservare e archiviare per il futuro. È quello che ho appena fatto per salvare la vecchissima pagina Myspace del gruppo musicale in cui militavo fino a qualche anno fa ed evitare che alcuni ricordi conservati da questo social network andassero perduti.

I limiti dell’Internet Archive

Pur nella sua importanza, però, l’Internet Archive ha dei limiti: le pagine sono spesso salvate in maniera parziale (per esempio mancano gif, immagini o banner), consultarlo per scopi differenti dal vedere l’homepage di qualche famosa piattaforma come appariva nel passato non è sempre semplice e fare una ricerca per trovare qualche specifico vecchio contenuto di Geocities sarebbe quasi impossibile. È anche per questo che, ispirandosi a quanto creato 25 anni fa da Brewster Kahle e Bruce Giliat, sono sorte altre realtà che integrano il lavoro fatto dall’Archive.

Un esempio è quello di Perma, associazione che ha l’obiettivo di creare una “forma permanente di internet”, si concentra sui contenuti online di maggior valore ed è gestito da oltre 150 biblioteche che, su richiesta degli autori di articoli accademici o di reportage giornalistici, si occupano della loro conservazione a tempo indefinito. Ci sono poi i progetti decentralizzati come Ipfs (interplanetary file system), che – tra le altre cose – consente di distribuire ai computer connessi a questo network un’istantanea della pagina web salvata, ricercabile tramite un apposito motore di ricerca (un sistema, volendo, molto simile a quello peer-to-peer di BitTorrent).

Al di là delle singole soluzioni – e come dimostra il fatto che l’Internet Archive abbia salvato oltre 600 miliardi di pagine – il lavoro che deve affrontare chi si occupa di archiviare i contenuti di internet è pieno di ostacoli tecnici e legati alla mole immensa dell’impresa. Per quanto riguarda i primi, come faremo a selezionare e salvare i contenuti di valore presenti sui social il giorno in cui, per esempio, Facebook dovesse fare la fine di Myspace? 



[Fonte Wired.it]