Gemeentelijke data: wat heb je eigenlijk?

Les 1 · 25 minuten · Gratis preview

Welke data heeft uw gemeente eigenlijk?

Stel je voor: een journalist belt je kantoor. Ze onderzoekt hoe gemeenten data over hun burgers verzamelen en gebruiken. Haar eerste vraag is simpel: welke data heeft uw gemeente over haar inwoners?

Kunt u dat antwoorden? De meeste bestuurders niet. Niet uit onwil, maar uit onwetendheid. Het datalandschap van een gemiddelde gemeente is een wildgroei van systemen, bestanden en koppelingen die over twintig jaar organisch is gegroeid. Niemand heeft het complete overzicht.

In deze les gaan we dat overzicht maken. Want je kunt pas verantwoord sturen op data als je weet wat je hebt.

      Wat leer je in deze les
      De hoofdcategorieën van gemeentelijke data en hun gevoeligheid
Waarom datakwaliteit een bestuurlijk probleem is, geen IT-probleem
De drie rollen die elke gemeente nodig heeft voor goed databeheer
Hoe data de grondstof is voor AI — en waarom kwaliteit alles bepaalt

    

Een gemiddelde gemeente: 150 tot 400 systemen

Een gemiddelde Nederlandse gemeente gebruikt tussen de 150 en 400 verschillende softwaresystemen. Elk systeem verzamelt en bewaart data. Veel systemen wisselen onderling data uit — soms via gestructureerde koppelingen, soms via handmatige exports in Excel.

      De zes hoofdcategorieën gemeentelijke data
      Basisregistraties — BRP (personen), BAG (adressen), BRK (kadaster): hoge gevoeligheid
Sociaal domein — WMO, jeugdzorg, schuldhulpverlening: zeer hoge gevoeligheid (bijzondere categorieën)
Vergunningen & handhaving — omgevingsvergunningen, BIBOB-dossiers: hoge gevoeligheid
Openbare ruimte — meldingen, sensordata, verkeerstellingen: lage tot middelhoge gevoeligheid
Financiën — belastingaanslagen, WOZ-waarden, subsidies: hoge gevoeligheid
Communicatie & dienstverlening — klantcontactsystemen, chatbot-logs: middelhoge gevoeligheid

    

Bovendien zijn er kopieën. Data uit de BRP wordt gekopieerd naar het sociaal domein-systeem, naar het belastingsysteem, naar de burgerzakenmodule. Elke kopie is een extra risico: als het origineel wordt bijgewerkt, loopt de kopie soms maanden achter.

Kernbegrippen — klik de kaart om te draaien

Klik op een kaart om de uitleg te zien.

Basisregistraties

Wettelijk fundament

🔄 Klik om te draaien

De officiële landelijke registers waaruit gemeenten verplicht putten: BRP (personen), BAG (adressen), BRK (kadaster), BGT (topografie). Ze vormen het fundament van gemeentelijke gegevensverstrekking. Data hieruit wordt doorgekopieerd naar honderden gemeentelijke systemen — elke kopie is een potentieel datakwaliteitsrisico.

Datakwaliteit

Juist, actueel, volledig

🔄 Klik om te draaien

De mate waarin data juist, actueel en volledig is. In de praktijk kampen gemeenten met verouderde adressen, dubbele registraties en onvolledige dossiers. Datakwaliteit is geen IT-probleem — het is een bestuurlijk probleem. Want een AI-systeem is nooit beter dan de data die erin gaat: garbage in, garbage out.

Data-eigenaar

Inhoudelijke verantwoordelijkheid

🔄 Klik om te draaien

De rol die inhoudelijk verantwoordelijk is voor een dataset: bepaalt welke data wordt verzameld, wie er toegang toe heeft, en wanneer data wordt vernietigd. Typisch een afdelingshoofd of directeur. Zonder formeel belegd eigenaarschap ontstaat de "data-nobody's-child"-situatie: iedereen gebruikt de data, niemand voelt zich verantwoordelijk voor de kwaliteit.

Data-inventaris

Actueel overzicht

🔄 Klik om te draaien

Een systematisch overzicht van alle data-assets van de gemeente: welke systemen zijn in gebruik, welke data bevatten ze, wie heeft er toegang, hoe lang wordt data bewaard, en hoe wisselen systemen data uit. De basis voor verantwoord AI-gebruik — want je kunt alleen sturen op data als je weet wat je hebt.

Wie is eigenaar van de data?

In de meeste gemeenten is er geen eenduidig antwoord op de vraag: wie is verantwoordelijk voor onze data? De IT-afdeling beheert de systemen, maar niet de inhoud. Vakafdelingen vullen de data in, maar voelen zich niet verantwoordelijk voor de kwaliteit. Dit leidt tot de "data-nobody's-child"-situatie.

      Drie onmisbare rollen voor goed databeheer
      Data-eigenaar (inhoudelijk): Bepaalt wat wordt verzameld, wie toegang heeft, wanneer data wordt vernietigd. Typisch: afdelingshoofd of directeur.
Databeheerder (operationeel): Zorgt dat data juist, actueel en veilig is opgeslagen. Typisch: medewerker informatievoorziening.
Data-gebruiker (functioneel): Gebruikt data voor dagelijks werk en meldt fouten of hiaten. Typisch: medewerkers op de werkvloer.

    

Praktijkcase: De gemeente met twee waarheden

Een middelgrote gemeente implementeerde een AI-systeem voor vroegsignalering van schulden. Het systeem combineerde data uit drie bronnen. Na drie maanden bleek dat 23% van de signaleringen onjuist was — niet omdat het algoritme slecht was, maar omdat adreswijzigingen in het ene systeem maanden eerder waren verwerkt dan in het andere. Burgers kregen brieven over schulden die ze allang hadden afgelost. De les: een AI-systeem is nooit beter dan de data die erin gaat. Datakwaliteit is een bestuurlijk probleem.

Kennischeck — data en databeheer

Beantwoord de vragen om je begrip te toetsen.

Je gemeente wil een AI-systeem implementeren voor vroegsignalering van schuldenproblematiek. Wat is de eerste stap die je als bestuurder moet zetten?

✓ Precies! Garbage in, garbage out. Een AI-systeem is zo goed als de data waarop het draait. Controleer eerst of de brondata juist, actueel en volledig is. Een systeem bouwen op slechte data produceert slechte uitkomsten, hoe goed de technologie ook is. Het juiste antwoord is B. Het principe "garbage in, garbage out" geldt letterlijk bij AI. Controleer eerst de datakwaliteit voordat je een leverancier selecteert of budget aanvraagt — anders investeer je in een systeem dat onjuiste uitkomsten produceert.

In welke situatie is er sprake van de "data-nobody's-child"-situatie?

✓ Correct! De "data-nobody's-child"-situatie ontstaat als het eigenaarschap niet formeel is belegd. IT beheert de systemen maar niet de inhoud. Vakafdelingen vullen data in maar voelen zich niet verantwoordelijk voor kwaliteit. Het resultaat: niemand is verantwoordelijk, de kwaliteit daalt, en AI-systemen produceren onbetrouwbare uitkomsten. Het juiste antwoord is C. De "data-nobody's-child"-situatie beschrijft het gebrek aan eigenaarschap: iedereen gebruikt de data, maar niemand voelt zich verantwoordelijk voor de kwaliteit. De oplossing is het formeel beleggen van drie rollen: data-eigenaar, databeheerder, en data-gebruiker.

Data als grondstof voor AI

Elk AI-systeem draait op data. De kwaliteit van die data bepaalt direct de kwaliteit van de uitkomsten. Drie directe verbanden:

      Onvolledige data → onbetrouwbare voorspellingen. Als 30% van je schuldsignaleringen op verouderde data is gebaseerd, is het voorspelmodel onbetrouwbaar voor die 30%.
Niet-representatieve data → discriminerende uitkomsten. Als bepaalde bevolkingsgroepen ondervertegenwoordigd zijn in de data, "ziet" het AI-systeem hen niet goed.
Verkeerd gelabelde data → verkeerde conclusies. Als een dossier ten onrechte als "fraude" is gelabeld en het AI-systeem daarop traint, leert het de fouten van het verleden te herhalen.

    

Praktijkcase: Rotterdam en de WMO-voorspellingen

Rotterdam experimenteerde met een model dat kon voorspellen welke WMO-cliënten een herindicatie nodig zouden hebben. Het model presteerde goed — maar alleen voor cliënten boven de 65 jaar. Voor jongere cliënten waren de voorspellingen onbetrouwbaar. De reden: het model was getraind op vijf jaar historische data, en in die periode was het overgrote deel van de WMO-aanvragen van ouderen. De les: historische data weerspiegelt historische patronen. Vraag altijd: is de trainingsdata representatief voor de populatie die het systeem nu bedient?

Een AI-model voor WMO-indicaties presteert uitstekend voor cliënten boven de 65 jaar, maar onbetrouwbaar voor jongere cliënten. Wat is de meest waarschijnlijke oorzaak?

✓ Goed! Dit is een klassiek geval van niet-representatieve trainingsdata. Het model "ziet" ouderen goed omdat het op veel gevallen van ouderen heeft getraind. Jongeren zijn ondervertegenwoordigd in de historische data, dus het model heeft weinig voorbeelden om van te leren. Het juiste antwoord is A. Het probleem is de samenstelling van de trainingsdata, niet een technische beperking. Historische data weerspiegelt historische patronen — als jongere cliënten ondervertegenwoordigd zijn in de historische data, presteert het model slecht voor die groep.

Scenario: De data-inventarisatie

Bestuurlijk scenario

Je bent wethouder Digitalisering. In een collegevergadering stelt een collega voor om dit jaar een AI-systeem te implementeren voor vroegsignalering van overlast in de openbare ruimte. Het systeem combineert meldingen, camerabeelden en sociale media-data.

Je informatiemanager geeft aan: "We hebben geen actueel overzicht van welke data we hebben en hoe betrouwbaar die is." De leverancier zegt: "Dat hoeft niet — ons systeem zorgt zelf voor datakwaliteit."

Wat doe je?

Samenvatting: data als bestuurlijke verantwoordelijkheid

Je hoeft het datalandschap van je gemeente niet zelf te kennen — maar je moet weten welke vragen je moet stellen. Want jij beslist of AI-systemen worden ingezet die op die data draaien.

      Vijf vragen die je als bestuurder moet stellen
      Hoeveel softwaresystemen gebruiken we? Is er een actuele applicatieportfolio?
Welke systemen bevatten persoonsgegevens, en welke categorieën?
Hoe actueel is onze data? Wanneer is voor het laatst gecontroleerd of BRP-data in andere systemen klopt?
Wie is de data-eigenaar per domein? Is dat formeel belegd?
Wat is ons retentiebeleid? Hoe lang bewaren we data, en wordt dat actief gehandhaafd?

    

      📝 Reflectievragen
      Zou jij op dit moment de vijf bovenstaande vragen kunnen beantwoorden voor jouw gemeente?
Wie is in jouw gemeente de data-eigenaar van het sociaal domein?
Als je morgen een AI-systeem wilt inzetten: weet je of de brondata betrouwbaar genoeg is?

    

1 / 8

Kennistoets — Les 16

Test je kennis van gemeentelijke data en databeheer. Beantwoord alle 5 vragen.

Vraag 1 van 5

Wat bedoelt men met de "data-nobody's-child"-situatie in een gemeente?

Vraag 2 van 5

Welke datacategorie heeft de HOOGSTE gevoeligheidsclassificatie in een gemeente?

Vraag 3 van 5

Wat is het principe "garbage in, garbage out" in de context van AI?

Vraag 4 van 5

Welke rol is inhoudelijk verantwoordelijk voor een dataset: bepaalt wat wordt verzameld, wie toegang heeft en wanneer data wordt vernietigd?

Vraag 5 van 5

Een gemeente wil een AI-model inzetten. Het model is getraind op vijf jaar historische data waarbij ouderen de overgrote meerderheid van de cliënten vormen. Welk risico is het grootst?

Wil je meer lessen zoals deze?

De volledige cursus bevat 20 interactieve lessen over AI in het lokaal bestuur. Werkbladen, dilemma-oefeningen en een AI Act compliance checklist.

Schrijf je in voor €999 — volledige cursus

Eenmalige betaling · 12 maanden toegang · Alle 4 modules

Gemeentelijke data: wat heb je eigenlijk?

Welke data heeft uw gemeente eigenlijk?

Wat leer je in deze les

Een gemiddelde gemeente: 150 tot 400 systemen

De zes hoofdcategorieën gemeentelijke data

Kernbegrippen — klik de kaart om te draaien

Basisregistraties

Datakwaliteit

Data-eigenaar

Data-inventaris

Wie is eigenaar van de data?

Drie onmisbare rollen voor goed databeheer

Praktijkcase: De gemeente met twee waarheden

Kennischeck — data en databeheer

Data als grondstof voor AI

Praktijkcase: Rotterdam en de WMO-voorspellingen

Scenario: De data-inventarisatie

Samenvatting: data als bestuurlijke verantwoordelijkheid

Vijf vragen die je als bestuurder moet stellen

📝 Reflectievragen

Kennistoets — Les 16

Wil je meer lessen zoals deze?

Ontvang gratis AI-updates voor lokaal bestuur