Project processtappen

Dit diagram toont de stappen die ingezet kunnen worden om een data gedreven project in projectstappen in te delen.

Diagram in standaardweergave

Extractie

Extraheren van patronen in de data om inzichten te krijgen die wenselijk zijn om de toepassing succesvol te realiseren.


Details van Extractie

Analyseer de databehoefte

Op basis van de business case kan er een inschatting gemaakt worden van de data behoefte. Dat wordt veelal gedaan door een eenvoudig datamodel op te stellen van de databehoefte voor de business case. Bijvoorbeeld een combinatie van een conceptueel en logisch datamodel van de databehoefte


Details van Analyseer de databehoefte

Weergeven

Visualisaties voor analisten.


Details van Weergeven

Verzamelen

Verzamelen van verschillende datasets die aanwezig zijn en invulling kunnen geven aan de data analyse.


Details van Verzamelen

Bepalen en beschrijven business case

Deze stap beschrijft de business case. Dit is de eerste stap in het proces en heeft een belangrijke relatie met de data gedreven toepassing die ontwikkeld gaat worden. Meestal wordt de business case opgesteld door de data governance rollen in nauwe samenwerking met de data-architect.


Details van Bepalen en beschrijven business case

Filtering

Filteren van die data elementen die in de databronnen aanwezig zijn maar niet nodig zijn voor deze datagedreven toepassing.


Details van Filtering

Data visualisatie

Visualiseren van de data analyse bijvoorbeeld in de vorm van rapportages, dashboards met grafieken en combinaties daarvan. Als laatste kunnen bij de visualisaties ook user interfaces horen voor de gebruikers van de data gedreven toepassing die in het project ontwikkeld wordt. Bijvoorbeeld in apps en websites ter ondersteuning van eindgebruikers.


Details van Data visualisatie

Selecteer databronnen

Databronnen maken feitelijk geen onderdeel uit van een Data gedreven toepassing. Databronnen zijn de grondstof waaruit de structurering tot informatie plaatsvindt. Daarom is het van belang om goed na te denken wat de juiste bron is. Dit wordt gebaseerd op de analyse van de databehoefte voor deze business case.


Details van Selecteer databronnen

Interne databronnen

Voor data gedreven toepassingen zal een deel van de data afkomstig zijn vanuit de eigen organisatie. Bijvoorbeeld over de activiteiten van de organisatie en hoe de organisatie de waarde levert binnen het vervaardigen van hun producten en diensten.


Details van Interne databronnen

Selecteer dataopslag

Kies voor een opslag medium, wijze (zoals rdbms, nosql, newsql of polyglot etc).


Details van Selecteer dataopslag

Data gedreven toepassing in business activiteiten

Introduceren van een oplossing waarmee de data gedreven toepassing ingezet kan worden binnen de organisatie. Het introduceren en begeleiding van het gebruik van de toepassing van de business case binnen de organisatie.


Details van Data gedreven toepassing in business activiteiten

Data analyse en analytics

Data-analyse is het gericht zoeken naar (statistische) verbanden in gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Zo'n verzameling gegevens kan gevormd worden door gebeurtenissen in een praktijksituatie te registreren (aankoopgedrag van consumenten, symptomen bij patiƫnten, et cetera) of door de resultaten van eerder uitgevoerde wetenschappelijke onderzoeken met elkaar te vergelijken en te herinterpreteren.


Details van Data analyse en analytics

Implementeer datavergaring

Als bronnen zijn geselecteerd en gefilterd dient de verwerking plaats te vinden. Verwerking is het omzetten van de ruwe data naar een structuur waarop data analyse mogelijk is. Vanwege het volume en de velocity is bij big data gedistribueerde verwerking veelal noodzakelijk Er is een nauwe relatie met data opslag en data integratie.


Details van Implementeer datavergaring

Verrijken

Verrijken van de data door het uitbreiden van de data entiteiten zodat meer zeggenskracht ontstaat in de data.


Details van Verrijken

Externe databronnen

Als er intern geen databronnen zijn of als de interne datasets onvoldoende kwaliteit hebben voor de databehoefte kan gekozen worden voor externe (betaalde) databronnen


Details van Externe databronnen

Combineren

Combineren van verschillende datasets om analyse mogelijk te maken


Details van Combineren