Page tree
Skip to end of metadata
Go to start of metadata

Datakwaliteit is de mate waarin data geschikt is voor het doel waarvoor ze gebruikt wordt. De afspraken die tussen de actoren worden gemaakt om de datakwaliteit te waarborgen worden vastgelegd in het dataprotocol. De volgende kwaliteitsaspecten komen daarin voor de data aan bod:

  1. Tijdigheid
    Dit is de mate waarin data op tijd aanwezig is. In het WVP is dit weliswaar een belangrijk aspect i.v.m. wettelijke termijnen, maar er is geen noodzaak voor een hoge mate van tijdigheid (bv. dagelijkse updates);
  2. Volledigheid
    Dit geeft aan dat de volledige verwachte dataset aanwezig moet zijn. Bij consolideren van data uit verschillende bronnen (en verschillende bronhouders), zoals in het WVP het geval is, kan dit wel eens een uitdaging
    zijn.
  3. Nauwkeurigheid
    Dit geeft aan in hoeverre de data de werkelijkheid weergeeft. Per gegevensstroom in WVP:
    - Referentiegegevens: Alle referentiegegevens, van alle keringbeheerders, moeten een zelfde nauwkeurigheid hebben zodat de gegevens landelijk vergelijkbaar zijn.
    - Normen: Een norm is geen weergave van de werkelijkheid maar de kans maal het gevolg, dus risico, op een bepaalde situatie (zoals een overstroming of een bepaald waterpeil). Deze is vastgelegd in de Waterwet. Het is wel van belang dat de informatie in het WVP volledig overeen komt met wat in de wet is beschreven.
    - Beoordelingsgegevens: Het is moeilijk te bepalen in hoeverre de beoordeling van de geschematiseerde toestand van de waterkering, zoals bepaald in het beoordelingsinstrumentarium, de werkelijke toestand van de kering weergeeft. En dit is ook niet het grootste belang van de beoordeling, waarbij de   uitkomst vooral dient voor de prioritering van de versterkingsmaatregelen. Maar om deze prioritering landelijk te kunnen bepalen, dient de nauwkeurigheid wel bij elke beoordeling hetzelfde te zijn.
    - Projectgegevens: de projectgegevens dienen accuraat te zijn (bv. klopt de planning in het WVP met de daadwerkelijke stand van zaken, klopt de kostenraming)
  4. Consistentie
    Consistentie heeft ermee te maken dat door het hele systeem gegevens consistent (gestandaardiseerd) zijn.
  5. Begrijpelijkheid
    Dit is een veelvoorkomende vorm van slechte datakwaliteit, die vreemd genoeg slechts weinig aandacht krijgt. Soms zijn de gehanteerde definities, die in een rapportagesysteem gebruikt worden, zo omslachtig of ingewikkeld dat niemand echt begrijpt wat het getal precies inhoud. In zo'n geval zou het een goed idee kunnen zijn om deze definities eens te herzien, omdat het lastig is om beslissingen te nemen op basis van cijfers die men niet begrijpt. Het kan ook voorkomen dat de gehanteerde definities gewoon onbekend zijn, omdat er geen goede documentatie aanwezig is. Goede metadata en een begrippenhandboek is dan ook een vereiste voor goede datakwaliteit. Synoniemen dienen vermeden te worden. Aquo-lex is daarvoor een hulpmiddel.
  6. Enigheid
    Enigheid wil zeggen dat elke 'entiteit' (bv. een waterkering) uit de werkelijkheid (dus afgezien van historie) ook slechts als één record voorkomt in de database.

Verder naar Impact (gegevens)

  • No labels