CIDOC CRM

Ik was er tijdens mijn opleiding tot documentalist best goed in. Ik kon enorm lange UDC (Universele Decimale Classificatie) codes maken die precies aangaven waarover een tekst ging. Een voor leken onbegrijpelijke combinatie van letters, cijfers en leestekens die ik samenstelde  op basis van het voorgeschreven standaardwerk. Mijn docent vertelde trots dat hij op de vakantiekaart altijd een rebus in UDC schreef die alleen door slimme collega’s en studenten kon worden opgelost. Die konden dan ontcijferen dat hij in de zomer een fietstocht langs de kastelen aan de Loire maakte.

We leerden dat de UDC was ontwikkeld door Paul Otlet die aan het begin van de twintigste eeuw was begonnen met het systematisch in kaart brengen van zo’n beetje alle onderwerpen in de wereld. Een prachtig megalomaan idee dat natuurlijk gedoemd was te mislukken. Er is nog een museum in België (het Mundaneum) waar het resultaat van dit monnikenwerk wordt bewaard. Eindeloze rijen van kaartenbakken met systematisch gerangschikte termen op fiches.

Telkens als ik iets hoor of lees over het CIDOC Conceptual Reference Model (CRM)  moet ik onweerstaanbaar denken aan zowel Paul Otlet als de vakantiekaart van mijn docent.

The CIDOC CRM is intended to promote a shared understanding of cultural heritage information by providing a common and extensible semantic framework that any cultural heritage information can be mapped to. It is intended to be a common language for domain experts and implementers to formulate requirements for information systems and to serve as a guide for good practice of conceptual modelling. In this way, it can provide the “semantic glue” needed to mediate between different sources of cultural heritage information, such as that published by museums, libraries and archives. [ www.cidoc-crm.org ]

Ik zie weer lange lijsten met systematisch ingedeelde begrippen en verwonder me over de blijkbaar onuitroeibare wens om de wereld overzichtelijk in kaart te brengen.

Natuurlijk herken ik de aantrekkingskracht van een briljant uitgedachte structuur en een keurig schone verzameling van gegevens. Ik heb echter geleerd dat de dagelijkse werkelijkheid waarbinnen mijn systemen moeten werken per definitie vervuild, chaotisch en inconsequent is.  Schone databases bestaan niet. Handleidingen voor invoer zijn of ontoereikend of onwerkbaar. En het merendeel van mijn gebruikers heeft absoluut geen boodschap aan mijn streven naar volmaaktheid.

In een promotievideo van het ResearchSpace project wordt een fantastische demo gegeven van een op CIDOC CRM gebaseerd zoeksysteem. Je zoekt op Rembrandt maar dan alleen Rembrandt als vervaardiger, niet als onderwerp en vervolgens wil je alleen de afbeeldingen van dieren.

created/modified by Rembrandt and is/has/about mammal

Het is allemaal zeer overtuigend, maar gaat wel heel opzichtig voorbij aan het feit dat een dergelijk systeem alleen maar zo mooi werkt als de doorzochte database heel erg systematisch en consequent is opgebouwd en ingevuld. Natuurlijk wil iedereen zo kunnen zoeken, maar wie heeft de middelen en het uithoudingsvermogen om grote verzamelingen informatie op een dergelijke manier voor te bewerken? Systemen als CIDOC CRM en UDC zijn gebaseerd op het idee dat je volledige precisie kan bereiken in een query…als de hele database vanaf de oorsprong systematisch is gevuld en gecorrigeerd; …als alle invoerders zich heel consequent houden aan vaste invoersinstructies; …als die instructies geen enkele ruimte tot eigen interpretatie laten… etc. etc.

De database over Rembrandt die in de demo wordt gebruikt is hoog specialistisch en betrekkelijk klein. Ik wil graag geloven dat het op deze schaal en met zoveel verantwoorde datainvoer perfect werkt. Maar dat geldt niet voor de databases die ik onder mijn hoede heb. Die zijn vervuild, inconsequent en onvolledig en dat blijven ze voorlopig. Ik heb behoefte aan een zoeksysteem dat met deze werkelijkheid rekening houdt en daar het beste van maakt.

Wat is er eigenlijk mis met onze taal voor het benoemen van begrippen en relaties? Waarom voldoen standaard zinnen met een onderwerp, werkwoord en gezegde niet? Waarom moet er een onbegrijpelijke metataal worden geconstrueerd die alleen voor ingevoerden is te begrijpen. Ik snap het wel. Onze taal is net zo chaotisch, inconsequent en vervuild als het dagelijkse leven. Te onvolmaakt voor idealisten.