T2T Proces

Uitwerking van het algemene Big Data procesmodel naar het specifieke T2T model. In dit diagram valt op dat de functionaliteiten met name koppelen aan de data analyse. Dat is verklaarbaar omdat in deze pilot hierop de focus ligt. Bij het uitwerken van een productieopstelling zal ook bij de data opslag en de vergaring een meer gedetailleerde uitwerking ontstaan.

Diagram in standaardweergave

Extractie

Extraheren van patronen in de data om inzichten te krijgen die wenselijk zijn om de toepassing succesvol te realiseren.


Details van Extractie

Analyseer de databehoefte

Op basis van de business case kan er een inschatting gemaakt worden van de data behoefte. Dat wordt veelal gedaan door een eenvoudig datamodel op te stellen van de databehoefte voor de business case. Bijvoorbeeld een combinatie van een conceptueel en logisch datamodel van de databehoefte


Details van Analyseer de databehoefte

Boom/graaf constructie

Opbouw van de boomstructuur naar een graaf of boom waarbij op basis van de transformatie regels en de interactie met de experts bepaald wordt welke associaties er horen bij de verschillende termen.


Details van Boom/graaf constructie

Weergeven

Visualisaties voor analisten.


Details van Weergeven

Verzamelen

Verzamelen van verschillende datasets die aanwezig zijn en invulling kunnen geven aan de data analyse.


Details van Verzamelen

Boom of graafbeheer

De boom of graaf dient beheerd te worden omdat we uitgaan van een semi supervised platform waarbij op basis van de voorbeeld documenten bepaald wordt wat kern- en stopwoorden zijn. Dit wordt bij een grotere set aan training data steeds nauwkeuriger. Hiervoor wordt een userterface ontwikkeld waarmee een expert op eenvoudige wijze kan bepalen wat kern- of stopwoorden zijn.


Details van Boom of graafbeheer

Bepalen en beschrijven business case

Deze stap beschrijft de business case. Dit is de eerste stap in het proces en heeft een belangrijke relatie met de data gedreven toepassing die ontwikkeld gaat worden. Meestal wordt de business case opgesteld door de data governance rollen in nauwe samenwerking met de data-architect.


Details van Bepalen en beschrijven business case

Filtering

Filteren van die data elementen die in de databronnen aanwezig zijn maar niet nodig zijn voor deze datagedreven toepassing.


Details van Filtering

Expertise analyse

Expertise in de graaf kan nader geanalyseerd worden en eventueel gekoppeld worden bepaalde experts


Details van Expertise analyse

Data visualisatie

Visualiseren van de data analyse bijvoorbeeld in de vorm van rapportages, dashboards met grafieken en combinaties daarvan. Als laatste kunnen bij de visualisaties ook user interfaces horen voor de gebruikers van de data gedreven toepassing die in het project ontwikkeld wordt. Bijvoorbeeld in apps en websites ter ondersteuning van eindgebruikers.


Details van Data visualisatie

Selecteer databronnen

Databronnen maken feitelijk geen onderdeel uit van een Data gedreven toepassing. Databronnen zijn de grondstof waaruit de structurering tot informatie plaatsvindt. Daarom is het van belang om goed na te denken wat de juiste bron is. Dit wordt gebaseerd op de analyse van de databehoefte voor deze business case.


Details van Selecteer databronnen

Beheer transformatieregels

Voor de transformatie van woorden naar tref- en of stopwoorden kunnen transformatieregels ingezet worden. Denk hierbij bijvoorbeeld aan het herleiden van woorden naar een stam waarvoor geautomatiseerde transformatieregels opgesteld kunnen worden.


Details van Beheer transformatieregels

Interne databronnen

Voor data gedreven toepassingen zal een deel van de data afkomstig zijn vanuit de eigen organisatie. Bijvoorbeeld over de activiteiten van de organisatie en hoe de organisatie de waarde levert binnen het vervaardigen van hun producten en diensten.


Details van Interne databronnen

Selecteer dataopslag

Kies voor een opslag medium, wijze (zoals rdbms, nosql, newsql of polyglot etc).


Details van Selecteer dataopslag

Discussieplatform

Rond de opbouw van de onderwerpen graaf of -boom kunnen de experts van mening verschillen. Dit platform maakt het mogelijk om over deze verschillen in inzicht een discussie te voeren.


Details van Discussieplatform

Expertise visualisatie

Zichtbaar maken van de expertise en presenteren aan de diverse betrokkenen. Dit zal veelal in een grafische weergave zijn zoals boom, graaf of heatmap weergaven.


Details van Expertise visualisatie

Tekst Transformatie

Applicatie functie die geautomatiseerd een document omzet naar een lijst van termen inclusief de juiste vulling van de koppeltabel voor termen en documenten


Details van Tekst Transformatie

Data gedreven toepassing in business activiteiten

Introduceren van een oplossing waarmee de data gedreven toepassing ingezet kan worden binnen de organisatie. Het introduceren en begeleiding van het gebruik van de toepassing van de business case binnen de organisatie.


Details van Data gedreven toepassing in business activiteiten

Data analyse en analytics

Data-analyse is het gericht zoeken naar (statistische) verbanden in gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Zo'n verzameling gegevens kan gevormd worden door gebeurtenissen in een praktijksituatie te registreren (aankoopgedrag van consumenten, symptomen bij patiƫnten, et cetera) of door de resultaten van eerder uitgevoerde wetenschappelijke onderzoeken met elkaar te vergelijken en te herinterpreteren.


Details van Data analyse en analytics

Implementeer datavergaring

Als bronnen zijn geselecteerd en gefilterd dient de verwerking plaats te vinden. Verwerking is het omzetten van de ruwe data naar een structuur waarop data analyse mogelijk is. Vanwege het volume en de velocity is bij big data gedistribueerde verwerking veelal noodzakelijk Er is een nauwe relatie met data opslag en data integratie.


Details van Implementeer datavergaring

Verrijken

Verrijken van de data door het uitbreiden van de data entiteiten zodat meer zeggenskracht ontstaat in de data.


Details van Verrijken

Externe databronnen

Als er intern geen databronnen zijn of als de interne datasets onvoldoende kwaliteit hebben voor de databehoefte kan gekozen worden voor externe (betaalde) databronnen


Details van Externe databronnen

Combineren

Combineren van verschillende datasets om analyse mogelijk te maken


Details van Combineren