Uitwerking van het algemene Big Data procesmodel naar het specifieke T2T model. In dit diagram valt op dat de functionaliteiten met name koppelen aan de data analyse. Dat is verklaarbaar omdat in deze pilot hierop de focus ligt. Bij het uitwerken van een productieopstelling zal ook bij de data opslag en de vergaring een meer gedetailleerde uitwerking ontstaan.
Versie | 1.0 | Creatie datum | 25-02-2016 |
Kies voor een opslag medium, wijze (zoals nosql, newsql of polyglot etc).
Opbouw van de boomstructuur naar een graaf of boom waarbij op basis van de transformatie regels en de interactie met de experts bepaald wordt welke associaties er horen bij de verschillende termen.
De boom of graaf dient beheerd te worden omdat we uitgaan van een semi supervised platform waarbij op basis van de voorbeeld documenten bepaald wordt wat kern- en stopwoorden zijn. Dit wordt bij een grotere set aan training data steeds nauwkeuriger. Hiervoor wordt een userterface ontwikkeld waarmee een expert op eenvoudige wijze kan bepalen wat kern- of stopwoorden zijn.
Expertise in de graaf kan nader geanalyseerd worden en eventueel gekoppeld worden bepaalde experts
Voor de transformatie van woorden naar tref- en of stopwoorden kunnen transformatieregels ingezet worden. Denk hierbij bijvoorbeeld aan het herleiden van woorden naar een stam waarvoor geautomatiseerde transformatieregels opgesteld kunnen worden.
Rond de opbouw van de onderwerpen graaf of -boom kunnen de experts van mening verschillen. Dit platform maakt het mogelijk om over deze verschillen in inzicht een discussie te voeren.
Applicatie functie die geautomatiseerd een document omzet naar een lijst van termen inclusief de juiste vulling van de koppeltabel voor termen en documenten
Zichtbaar maken van de expertise en presenteren aan de diverse betrokkenen. Dit zal veelal in een grafische weergave zijn zoals boom, graaf of heatmap weergaven.