Silicon Valley draait om innoveren, verbeteren, vooruit kijken. Midden in die omgeving, onder de rook van San Francisco, kijkt Brewster Kahle juist naar het verleden. 

Hij wil bewaren wat het internet vandaag bevat, zodat het niet verloren gaat. 

Kahle is de oprichter van het Internet Archive, een nonprofit-instelling die met name bekend is om zijn Wayback Machine, een manier om oude versies van websites op te roepen.

Dat archief bevat inmiddels ruim 400 miljard gearchiveerde websites. Weten hoe het deze week 15-jarige NU.nl er in den beginne uitzag? Het internetarchief van Kahle heeft het antwoord.

Medium in gevaar

Kahle richtte zijn archief op in 1996, toen het wereldwijde web nog in zijn kinderschoenen stond. "We begonnen met het medium dat het meest in gevaar was", vertelt hij. "Het web kwam eerst, want de gemiddelde webpagina staat maar honderd dagen online voordat hij wordt gewijzigd of verwijderd."

Sinds 1996 is het archief flink uitgebreid, bijvoorbeeld met constante opnames van zeventig verschillende tv-zenders, waaronder CNN, BBC en al-Jazeera. Het Amerikaanse televisienieuws wordt ook als tekst opgeslagen en doorzoekbaar gemaakt. 

Het Internet Archive scant ook boeken van verschillende bibliotheken en leent deze online uit. Vanwege auteursrechtenkwesties gaat het voorlopig enkel om boeken uit de twintigste eeuw en eerder, die maar door één persoon tegelijk kunnen worden gelezen. De Open Library bevat ruim 300.000 boeken.

Bibliotheken zijn ook een belangrijke inkomstenbron voor het Internet Archive, want zij betalen om hun boeken door het archief te laten inscannen. Dat is goed voor ongeveer 60 procent van de inkomsten van de organisatie, terwijl de overige 40 procent uit subsidies en donaties komt.

Hoe is dit project ontstaan?

"We dachten: als we een nieuw publicatiesysteem krijgen, dan moeten we ook een bibliotheek hebben. Die bibliotheek kan ook meer doen dan oude bibliotheken, want hij kan berekeningen maken, en beschikbaar zijn voor iedereen ter wereld."

"Ik had gedacht dat het vooral een onderzoekscollectie zou zijn, waar mensen eigen instrumenten als zoekmachines voor zouden bouwen. Maar er was zo veel data dat weinig mensen snapten hoe je daarmee om moest gaan. Toen hebben we in 2001 zelf de Wayback Machine gemaakt."

"Die is erg populair gebleken, met zo'n 600.000 gebruikers per dag. In totaal benutten 2 miljoen mensen per dag de diensten van het Internet Archive. Mensen willen dit dus echt graag gebruiken."

Is opslag wel eens een probleem?

"Dat is een groot probleem. In de afgelopen twee jaar is een terabyte opslag niet goedkoper geworden. Er zijn nog maar weinig fabrikanten van harde schijven over, omdat steeds meer consumentenelektronica flashopslag gebruiken. Er is dus weinig concurrentie, zoals we ook in de telecomwereld hebben gezien. Dat is een uitdaging."

In Silicon Valley wordt vooral vooruit gekeken. Waarom richtte u zich op het bewaren van wat er al is?

"Mijn achtergrond is in kunstmatige intelligentie en in de jaren tachtig leek het alsof er een groot gebrek aan data was. We dachten: als computers onze nieuwe meesters worden, laten we er dan in ieder geval voor zorgen dat de meester goede boeken leest. Laten we ervoor zorgen dat hij weet wat wij weten."

"Natuurlijk zijn computer en mens uiteindelijk veel minder gescheiden gebleken, de relatie is veel symbiotischer. Apparaten als je telefoon zitten tegen je hoofd geplakt, computers en mensen smelten min of meer samen."

Is het web heel anders geworden dan u had verwacht?

"Ja, het ontwikkelt zich veel langzamer. Ik had gedacht dat alle bibliotheken ter wereld in het jaar 2000 al online beschikbaar zouden zijn."

Hoe gaan jullie om met pagina's in apps?

"Dat is een heel groot probleem, de afsluiting van het web. Het web is een heel open omgeving, met zoekmachines als onderdeel van het ecosysteem. Maar bedrijven als Apple werken met een afgesloten besturingssysteem, afgesloten apps, een afgesloten netwerk. Dat zal het in de toekomst heel moeilijk maken om bibliotheken op te bouwen."

"Wij bieden daarom boeken aan in browsers, niet in apps. Dus toen wij boeken online gingen zetten deden we dat in webbrowsers. Als ze vrij nieuw zijn kan één iemand ze daar tegelijk lezen."

Is dat geen rare beperking op het internet?

"Het is absoluut raar. We zitten onszelf in de weg. Maar we proberen dingen beschikbaar te maken, terwijl we ook houders van auteursrecht respecteren. Ik vind dat zij zich hier veel meer bij moeten betrekken. De boekenindustrie heeft nu te maken met dezelfde strijd als de muziekindustrie, en voor hen is dat niet heel goed geëindigd."

"Veel uitgevers hebben geen interesse om aan bibliotheken te verkopen. Ze verkopen e-books niet op dezelfde manier als ze fysieke boeken verkopen, ze maken licentiedeals."

"Ik ben zelf meer voorstander van het royaltysysteem, waar je iets koopt en royalty's betaalt aan de uitgever, de auteur of de drukker. Dan houd je zelf het bezit en ben je er niet afhankelijk van dat mensen hun bestand online houden. Dat kun je niet zomaar aannemen."

"Kijk naar prominente websites van prominente bedrijven, die hebben wij vaak moeten bewaren. Geocities door Yahoo, Yahoo Video, Google Video. Herinnert iemand zich dat nog? Dat was echt groot voordat ze Youtube kochten. Verdwenen, ze hebben het gewoon uitgezet. Mobileme van Apple, daar stonden miljoenen websites van mensen en ze zeiden gewoon: 'Sorry, we zetten het allemaal uit.' Daarom heb je permanente structuren als een bibliotheek nodig."