Digitaalisen aineiston määrä kasvaa koko ajan. Kansalliskirjaston, CSC:n ja Kansallisarkiston yhteinen High Performance Digitisation -hanke tarttuu tähän kasvavan aineistomäärän käsittelyn haasteeseen. Tarkoituksena on luoda muistiorganisaatioiden käyttöön palvelu, joka helpottaa aineiston käsittelyä. Tarkemmin sanottuna hankkeen tavoite on luoda älykäs annotaatioputki arkistoitujen aineistojen puoliautomaattiseen käsittelyyn. Annotaatioputken on tarkoitus toimia CSC:n supertietokoneympäristössä, mitä kautta sitä voidaan tarjota muistiorganisaatioille. Automaattisen asiasanoituksen ja luokittelun työkaluna tässä tapauksessa on Kansalliskirjastossa kehitetty Annif. HPD-hankkeessa Kansalliskirjasto ja CSC ovat tehneet hedelmällistä yhteistyötä Annifin tiimoilta: Annifiin on löytynyt uusia algoritmeja, kun CSC on tässä projektissa tehnyt suurteholaskentaa vaatineita testejä Annifilla. 

Hanke jatkuu vuoden 2020 loppuun, ja tekeillä olevien raporttien lisäksi olemme tuottaneet HPD:sta blogikirjoituksen. Kirjoitus on luettavissa suomeksi Digimen sivuilla ja englanniksi CSC:n blogissa