Kaderstellende architectuur data kwaliteiten

Modelleren van data kwaliteiten kan met een score matrix. Dit is een bijzondere vorm van data modelleren, omdat het zowel voor de vraag- als aanbodkant van datasets gebruikt kan worden. Het doel is om kwaliteiten (gemodelleerd als requirements) in relatie te brengen met data entiteiten en daar vervolgens numerieke- of ordinale waarden aan toe te kennen. Score matrices zijn voor verschillende doeleinden te gebruiken, waarbij opvallend is, dat dit zowel in de ontwikkelfase als in de beheerfase hulp biedt, hierbij komt wederom zowel de vraag- als aanbodzijde aan bod.

Diagram in standaardweergave

Privacy

Voor sommige data entiteiten is toegangscontrole (autorisatie en authenticatie) of monitoring van gebruik nodig. Denk hierbij aan eisen die gesteld worden aan de ontsluiting van (privacy) vertrouwelijke gegevens. Voor sommige data entiteiten is toegangscontrole (autorisatie en authenticatie) of monitoring van gebruik nodig. Denk hierbij aan eisen die gesteld worden aan de ontsluiting van vertrouwelijke gegevens. In het GBA kent men bijvoorbeeld meerdere niveaus van vertrouwelijkheid. Zo worden bevragingen van ambtenaren wel gelogd en weergegeven aan de burger maar voor opsporingsambtenaren worden wel gelogd maar niet getoond.


Details van Privacy

Validiteit

Dit is de mate waarin een data entiteit bij opslag en uitwisseling voldoet aan het gewenste formaat. Denk hierbij bijvoorbeeld aan het domein maar ook het datatype van de attributen van een data entiteit. Binnen ketenuitwisseling is dit bijvoorbeeld van het grootste belang. Dit is de mate waarin een data entiteit bij opslag en uitwisseling voldoet aan het gewenste formaat. Denk hierbij bijvoorbeeld aan het domein maar ook het datatype van de attributen van een data entiteit. Binnen ketenuitwisseling is dit bijvoorbeeld van het grootste belang. Men wil niet dat aan het einde van de keten blijkt dat de gegevens niet valide zijn. Dit dient in een vroeg stadium geconstateerd te worden. Iedereen kent de voorbeelden uit het verleden waarbij bij webapplicaties na verzenden een melding van invalide data terugkwam zonder verdere toelichting


Details van Validiteit

Tijdigheid

Is een dataset tijdig beschikbaar binnen de gestelde verwachtingen. Het is het verschil tussen het moment van behoefte en beschikbaarheid. Is een dataset tijdig beschikbaar binnen de gestelde verwachtingen. Het is het verschil tussen het moment van behoefte en beschikbaarheid. Bijvoorbeeld het opvragen van gegevens in een KCC stelt hoge eisen. Vijf minuten wachten op een response van de gegevensopslag is dan niet acceptabel.


Details van Tijdigheid

Precisie

Mate van detail waarin een data entiteit de werkelijkheid weergeeft. Dit heeft bijvoorbeeld betrekking op de precisie van getallen e.d. Opslag van getallen en datums kunnen onvoldoende nauwkeurig zijn omdat afronding bij opslag of integratie nodig is. Mate van detail waarin een data entiteit de werkelijkheid weergeeft. Dit heeft bijvoorbeeld betrekking op de precisie van getallen e.d. Opslag van getallen en datums kunnen onvoldoende nauwkeurig zijn omdat afronding bij opslag nodig is. Ook domeinen op eigenschappen kunnen onvoldoende precisie hebben (denk aan een Nederlandse postcode in een internationale data-opslag)


Details van Precisie

Consistentie

Dit heeft betrekking op het feit dat de ene data set van een bepaalde entiteit gelijk is aan een andere dataset. Met andere woorden is een data entiteit onafhankelijk van de bron altijd dezelfde. Dit heeft betrekking op het feit dat de ene data set van een bepaalde entiteit gelijk is aan een andere dataset. Met andere woorden is een data entiteit onafhankelijk van de bron altijd dezelfde. Een voorbeeld van een lage consistentie is als er verschillen zitten tussen datasets van dezelfde entiteiten afkomstig uit verschillende bronnen. Replicatie van gegevens is vaak een oorzaak van lage consistentie.


Details van Consistentie

Referentiele integriteit

Dit is de situatie waarbij verwijzingen vanuit de ene data entiteit altijd correct verwijzen naar de gerelateerde data entiteiten. Dit is de situatie waarbij verwijzingen vanuit de ene data entiteit altijd correct verwijzen naar de gerelateerde data entiteiten. Voorbeelden zijn dubbele sleutels in een dataset waardoor de gekoppelde entiteiten niet kunnen bepalen wat de ouder entiteit is. Ook dangling references of zwevende referenties waarbij de ouder niet meer bestaat hoort hiertoe


Details van Referentiele integriteit

Uniekheid

Uniekheid van een data entiteit is gericht op het feit dat er geen andere entiteiten zijn met dezelfde gegevens. Ook bekend als duplicaten probleem. Uniekheid van een data entiteit is gericht op het feit dat er geen andere entiteiten zijn met dezelfde gegevens. Voorbeeld uit de praktijk was een tweeling met dezelfde voorletters, achternaam en geboortedatum. Het onderscheid was daardoor niet te maken door een te lage uniekheid. Toevoeging van de roepnaam bewerkstelligde dit wel.


Details van Uniekheid

Actualiteit

Mate waarin een data entiteit de actuele situatie van de werkelijkheid weergeeft. Mate waarin een data entiteit de actuele situatie van de werkelijkheid weergeeft. Veelzeggende voorbeelden zijn overleden mensen die een brief krijgen op basis van een verouderde dataset. Replicatie van gegevens is vaak een oorzaak van lage actualiteit.


Details van Actualiteit

Data kwaliteit

Generieke term voor het beschrijven van datakwaliteiten. Deze datakwaliteit kent een aantal specialisaties op basis van het DMBoK model van data kwaliteiten.


Details van Data kwaliteit

Compleetheid

Dit heeft betrekking op de mate waarin bepaalde attributen binnen een data entiteit aanwezig zijn. Daarnaast geldt de compleetheid ook voor het altijd voorkomen van een bepaalde set van entiteiten (rijen) in een data set. Dit heeft betrekking op de mate waarin bepaalde attributen binnen een data entiteit aanwezig zijn. Daarnaast geldt de compleetheid ook voor het altijd voorkomen van een bepaalde set van entiteiten (rijen) in een data set. Bijvoorbeeld een persoon kan enkel de eigenschap naam hebben, maar ook bestaan uit roepnaam, voornamen, tussenvoegsel, achternaam en meisjesnaam. In het laatste geval is er sprake van een hogere compleetheid


Details van Compleetheid

Redelijkheid

Heeft vooral betrekking op verwachtingen van data entiteiten binnen een bepaalde operationele context. Heeft vooral betrekking op verwachtingen binnen een bepaalde operationele context. Denk bijvoorbeeld aan het accepteren van een lagere performance bij piekbelasting of aan het langer moeten wachten op een resultaat-set van gearchiveerde data-entiteiten


Details van Redelijkheid

Accuraatheid

Accuraatheid heeft betrekking op de mate waarin een data entiteit de werkelijkheid weergeeft. Accuraatheid kan bepaald worden door een data entiteit te vergelijken met de entiteit in de werkelijkheid. Accuraatheid heeft betrekking op de mate waarin een data entiteit de werkelijkheid weergeeft. Accuraatheid kan bepaald worden door een data entiteit te vergelijken met de entiteit in de werkelijkheid. Voorbeeld uit het verleden waarbij een baby een stemkaart ontving op basis van een lage accuraatheid binnen de GBA.


Details van Accuraatheid