AMSTERDAM – Binnen het Target project, het grootste publiek-private ICT-project van Nederland, is een testbed ontwikkeld dat 1,5 petabytes (1.500.000 gigabytes) aan data kan opslaan en verwerken.

Dat heeft de Rijksuniversiteit Groningen dinsdag bekendgemaakt.

Uiteindelijk zal een capaciteit van tien petabytes gerealiseerd worden. Volgens de universiteit komt dat neer op een hoeveelheid data gelijk aan een stapel dvd’s met een hoogte van dertig keer de Martinitoren.

Bijzonder

Het testbed bestaat uit een grote hoeveelheid harde schijven en tapes die samen een groot opslagsysteem vormen. Het bijzondere aan het project is dat de opslagruimtes zich op vier verschillende locaties in verschillende systemen bevinden.

Het nieuwe systeem zal voor het eerst gebruikt worden bij het project Monk. Dat is een samenwerking tussen onderzoekers van de universiteitsafdeling Kunstmatige Intelligentie en het Nationaal Archief.

Sneller

Het testbed zal historische handgeschreven teksten helpen te ontcijferen met behulp van herkenningsalgoritmes en de teksten vervolgens digitaal toegankelijk maken. Op die manier worden het proefschrift van Ubbo Emmius en het Archief der Kabinet der Koningin (KdK) gedigitaliseerd.

Op het nieuwe testbed kunnen volgens de universiteit zo’n 2.500 duizend pagina’s per seconde worden doorzocht, dat is ongeveer honderd keer sneller dan voorheen.