Blog – Als op een zomerdag een algoritme
Mochten we de pandemie als een oorlog willen zien, dan is het duidelijk wie er nu al aan het winnen is: de computer. De faculteit Geesteswetenschappen draait op dit moment volledig digitaal. De vergadercarrousel is vervangen door een gletsjer aan Teams-bijeenkomsten die alles op zijn pad vermorzelt. In plaats van memorabele borrels en de wandelgangen op conferenties hebben we Zoom-vierkantjes gekregen, waar het aanvullende vertier moet komen van merkwaardige achtergronden en vreemde interieurkeuzes. Geen enkel college vindt meer plaats buiten de nieuwe, gepixelde leeromgeving. Toch is dit volgens voorstanders van verdere vernieuwing nog lang niet digitaal genoeg. Zo werd er onlangs in de DUB, de Utrechtse universiteitskrant, gewaarschuwd dat het onderwijsprogramma snel moet veranderen. Zonder programmeerkunsten en diepe kennis over algoritmen zouden ook geschiedwetenschappers de boot gaan missen. Dat klinkt alarmistisch, maar is het vertrek van die digitale boot wel zo definitief? En waarom zou een plek aan boord zo belangrijk zijn? Machines kunnen in de eerste plaats namelijk niet zonder historici.
Frequenties en bulkdata
Uiteindelijk draait de roep om digitalisering in de geschiedwetenschap om een vermeende minderwaardigheid. Computers zouden ons werk veel beter kunnen doen dan wij, met onze beperkte hersencapaciteit, feilbare aandachtspanne en dichtgetimmerde werkroosters. Die overtuiging speelt niet alleen bij Geschiedenis, maar over de hele breedte van de geesteswetenschappen, waar ons de ‘digital humanities’ als noodzakelijke innovatie voorgehouden worden. Sterker nog, hij speelt in de gehele samenleving, met de voortdenderende ‘digitale revolutie’. De huidige tijd zou uniek zijn omdat de mens op het punt staat definitief voorbijgestreefd te worden door machines en kunstmatige intelligentie. In een nieuwe era die je gloedvol of grauw kan vinden, maar die overduidelijk onafwendbaar is, gaan computers daarom ook kunst voor ons maken en aan geesteswetenschappen doen.
Iets meer dan veertig jaar geleden, in het retro-futuristische jaar 1979, voorzag de auteur Italo Calvino al hoe zo’n digitale literatuuranalyse zou werken. Ergens in zijn ingenieuze puzzelroman Als op een winternacht een reiziger vertelt Calvino over een schrijver die tegenover een computer komt te staan. De wetenschapster die de computer bedient legt hem uit dat de machine razendsnel boeken kan lezen en dan gelijk met een lijst van woordfrequenties komt waaruit alles af te lezen valt, van thematiek tot vorm en betekenis. Ze voert de machine een boek. De belangrijkste woorden, met een frequentie van negentien, zijn: bloed, officier, meteen, schoten, spin, tanden. ‘Overduidelijk een oorlogsroman’, concludeert de wetenschapster: alleen maar actie en een narratief dat volledig aan de oppervlakte blijft. Dan geeft de computer de woorden die slechts één keer voorkomen: onderarm, ondervoed, ondergaan, ondergronds, onderhemd, ondergoed, ondergewicht. ‘Onee, toch niet helemaal oppervlakkig’, zegt de wetenschapster: ‘er moet toch nog iets verborgen zitten.’
Stel dat we op een zomerdag een algoritme naar het archief sturen. Daar laten we het een onafzienlijke berg bronnen doorploegen, miljarden gedigitaliseerde woorden, meer dan een hele faculteit in een mensenleven kan verzetten. Dan komt het algoritme nog steeds in de eerste plaats terug met frequenties. De techniek is zeker gevorderd sinds de dagen van Italo Calvino, met nieuwe mogelijkheden als het oproepen van woordvelden en ‘context-mining’, maar de essentie is hetzelfde: er wordt een bulk data verwerkt op onmenselijke snelheid. Nog los van de vraag of bulkdata per se handig zijn wanneer je wat wilt weten over diplomatieke onderhandelingen, het verloop van een veldslag of de reis van een slavenhandelaar, blijft vooral het onderliggende begrip een cruciaal probleem. Snapt een algoritme iets van het materiaal dat-ie leest, of over hoe een archief werkt?
Kunstmatige slimmigheid
Computers hebben voor zulke dingen geen begrip. Laatst toonde de Engelse wiskundige Roger Penrose dat nog aan in een aflevering van Tegenlicht. Hij zette op een schaakbord een vrij simpel probleem neer waaruit de meest gehaaide schaakcomputer ter wereld desondanks niet af kon leiden dat het ontegenzeggelijk remise was. Een computer kan onvermoeibaar zetten tellen en in een milliseconde eindeloze reeksen vooruit- en weer terugschuiven, maar van schaken begrijpt ie helemaal niks. Dit is geen kunstmatige intelligentie, stelde Penrose daarom, maar kunstmatige slimmigheid.
En is het bij geschiedschrijving niet net zo? Kan een computer ooit uit allerlei aantallen en verbanden een werkelijk vernieuwend narratief maken? Nee, daar hebben we mensen voor nodig; mensen zoals Nathalie Zemon Davis, Gayatri Spivak, Michel Foucault of Edward Said – allemaal geestenwetenschappers die door hun begrip voor bekend, veelgebruikt bronmateriaal tot nieuwe, opzienbarende conclusies kwamen. De digitalisering verandert vooral het handwerk van historici. We kunnen nieuwe soorten vragen stellen, met een grotere spanwijdte dan ooit. Daarom is het inderdaad belangrijk dat we kennis opdoen over digitale middelen en iets begrijpen van onderliggende technologieën. Toch betekent een verandering van het historische handwerk niet automatisch een fundamentele verandering van de historische wetenschap. De zoekmethoden die we gebruiken sturen weliswaar onze vondsten, maar bij het geven van verklaringen, het onderstrepen van relevantie en het schrijven van een narratief blijft begrip van cruciaal belang. Daar komt het nog steeds aan op menselijke intelligentie. Zo definitief is het vertrek van de digitale boot dus niet.
Google-archeologie
Hiernaast speelt ook nog eens de kwestie van de digitale input zelf. Lang niet al het bronmateriaal dat in archieven en verzamelingen over de hele wereld verspreid ligt is gedigitaliseerd, eerder het tegenovergestelde. Alleen al in het Nationaal Archief in Den Haag is minder dan tien procent van de hele collectie ingescand. Wanneer we volledig op digitale onderzoeksmethoden overstappen delven we dus in een behoorlijk kleine mijn. Alles wat niet onder de scanner is geweest ligt in de duisternis verborgen, wachtend op iemand die een aanvraagbriefje invult, de doos uit de rekken pakt en het papier zelf beroert.
Bovendien zijn zat instellingen een stuk minder kapitaalkrachtig dan het Nederlandse staatsarchief. Zij moeten met private partijen in zee als ze de digitale boot niet willen missen. De ‘bewust digibete burger’ Olaf Tempelman had het in een recente column ironisch over een toekomst met ‘Google Archeology’, maar zoiets bestaat al lang. Het heet Google Books en is met Google Ngram te doorzoeken. Misschien is het aardig de machine aan wat zelfreflectie te onderwerpen en naar de historische frequentie van ‘Google Books’ en ‘Ngram’ te vragen. Dan krijg je een mooie grafiek. Wie alleen meer zou willen weten over de achterliggende monopolievorming en schending van auteursrechten, kan beter even de documentaire Google and the World Brain kijken.
Computer concludes…
Alle bedenkingen ten spijt, zouden alfa’s zogezegd maatschappelijk irrelevant worden wanneer ze niet met alle digitale nieuwigheden mee gaan doen. De oplossing zou daarom liggen in een geschiedenisopleiding waar studenten leren programmeren en zich zo digitaal ontpoppen. Alleen gaat er vrijwel niemand geschiedenis studeren om een algoritme te leren schrijven. Studenten kiezen juist voor die studie om iets over het verleden te leren, om het heden vanuit geschiedkundig perspectief te zien en ook om zelf aardig te leren schrijven – proza, welteverstaan. Het aanvullen van ons onderwijs met meer ‘digital humanities’ is natuurlijk altijd een goed idee. Maar om daarmee gelijk te stellen dat het hele vakgebied op de schop moet, dat lijkt me nou precies de conclusie die een computer zou trekken.
Erik de Lange is verbonden aan de Universiteit Utrecht als junior universitair docent. Hij werkt momenteel aan nieuw onderzoek naar militaire aanwezigheid en internationale samenwerking op de Middellandse Zee. Behalve mediterrane geschiedenis in het algemeen is hij geïnteresseerd in maritieme veiligheid, imperialisme, diplomatie en wetenschapsgeschiedenis.