Als data-architect krijg je op enig moment de vraag om een indeling te maken van een bepaald informatiecluster. Dat kan zijn vanwege een technische insteek maar ook vanuit een functionele vraag. Bij het ontsluiten van informatie is het classificeren van deze informatie een belangrijk aspect. Zeker als het om grote hoeveelheden informatie gaat wordt de classificatie een belangrijke voorwaarde om deze informatie toegankelijk te houden.
Voor het maken van dergelijke indeling zijn er allerlei mogelijkheden. In onderstaande afbeelding zie je een willekeurige lijst van termen die allemaal betrekking hebben op het indelen van onderwerpen
Classificeren is natuurlijk een werkwijze die niet nieuw is. Tijdens mijn landbouwkundige studie heb ik ruimschoots kennis kunnen maken met verschillende vormen van classificatie, bijvoorbeeld voor plantennamen. Ook in de bibliotheekwereld is classificatie een bekend gegeven. Zo is er de UDC (Universal Decimal Classification) die je in de bibliotheek nog wel terugvindt voor de non-fictie literatuur.
Voor het classificeren van onderwerpen zijn verschillende technieken te gebruiken. Denk hierbij aan:
- Lijsten (tagcloud)
- Matrices (negenvlaksmodel)
- Boomstructuren (doelenboom)
- Gebalanceerde boom (autotab)
Allemaal voorbeelden om de indeling toegankelijk te houden voor de eindgebruiker.
Een tweede indeling die vermeldingswaardig is is de taxonomie en de folksonomie. Een taxonomie is een indeling van onderwerpen die op enigerlei wijze beheerd en geautoriseerd wordt. Een folksonomie (zoals de tagcloud van deze site) legt het beheer veel meer bij de gebruikerspopulatie neer. Men vraagt de gebruiker om bij een bepaalde tekst of onderwerp om daaraan trefwoorden toe te voegen. Deze termen worden vervolgens gebruikt om de informatie te ontsluiten.
Beide werkwijzen kennen een aantal nadelen. De taxonomie vraagt een behoorlijke beheerinspanning maar biedt meestal wel een goed uitgebalanceerde boom. Bijkomend nadeel van een taxonomie is dat deze moeilijk actueel te houden is. Folksonomie is dynamischer en sluit meer aan op de actualiteit. Nadeel van deze opzet is dat het al snel een wirwar wodt van homoniemen en synoniemen wordt waarbij de eindgebruikers de weg kwijt kunnen raken.
Onderstaande aandachtspunten bieden hulp bij het kiezen van de uitwerking:
- Kan er gekozen worden voor een taxonomie, een folksonomie of een combinatie van beide indelingsvormen.
- Is het beheer van de indeling gerealiseerd, dat geldt zowel bij een taxonomie als een folksonomie
- Zijn er in het werkveld reeds taxonomieen aanwezig die als uitgangspunt kunnen dienen
- Is de behoefte ontstaan vanuit een technische of een functionele vraag. In het eerste geval is een folksonomie geen optie maar kan de axonomie mogelijk eenvoudig blijven
- Maak gebruik van bestaande hulpmiddelen zoals open source methoden en tools of van modules in betaalde toepassingen (managed metadata in SharePoint)
- Valideer de uitwerking regelmatig bij de direct betrokkenen (betrek je stakeholders!)
- Wees niet bang om onderwerpen te verwijderen, te splitsen of samen te voegen als ze heel weinig kinderen hebben, uitbreiden later kan altijd.