‘Bestanden overheid deugen niet’- zo kopte De Volkskrant op woensdag 6 november. En dat is eigenlijk nog eufemistisch gesteld: bijna eenderde van de adressenbestanden die overheden gezamenlijk willen gebruiken (voor de zo gewenste koppeling om bijvoorbeeld fraude uit te sluiten), klopt niet. De directe maatschappelijke gevolgen van deze situatie zijn echter niet minder schrijnend: ‘door de adresvervuiling rijden ambulances soms naar de verkeerde plek en krijgen wijken soms geen of verkeerde voorzieningen, omdat de gemeente geen juist beeld heeft van de bevolkingssamenstelling’ – aldus hetzelfde ochtendblad .

Laten we eerst eens even de bestandskoppeling op de snijtafel leggen. Volgens de overheid is dat probleem onoplosbaar, zolang de bestanden niet opgeschoond zijn. Je kan natuurlijk als uitgangspunt nemen dat koppeling pas mogelijk is als de gegevens in de te koppelen bestanden actueel, correct, compleet en uniek (ACCU) zijn. Dat is echter een illusie – althans als je ervan uit gaat dat mensen de gegevens bewerken en opslaan. Mensen maken nu eenmaal fouten en vergissen zich. Om de gegevens ACCU te maken kan intelligente software ingezet worden. Daarna kan dan desgewenst gekoppeld worden. Een andere optie is – want het gaat om het koppelen – het inzetten van intelligente software die fouttolerant gegevens vergelijkt. Beide typen software zijn al vele jaren op de Nederlandse markt te verkrijgen, maar worden door de overheid nog maar mondjesmaat ingezet.

Maar daar ligt de kern van het probleem niet. De waarheid is dat de overheid een verzameling van gemeentelijke, provinciale en rijksinstanties is, die alle bestanden met gegevens over rechts- en natuurlijke personen hebben. Elk van die instanties kent een bepaalde autoriteit en elk bestand heeft een eigenaar/beheerder. Kennis is macht geldt ook binnen de overheid. “Kom niet aan mijn bestand!” – hoor je ze bij wijze van spreken al roepen. En als uiteindelijk tijdens een proces discrepanties aan het licht komen, is het de vraag wie van de instanties zijn bestandsstructuur dan wel gegevens moet aanpassen. Het antwoord moge duidelijk zijn – zeker als genoegzaam bekend is dat de GBA weliswaar de bron is, maar niet 100 procent schoon. Om het probleem werkelijk op te lossen, moet het probleem van de machtspolitiek en eilandvorming opgelost worden.

Foute invoer, foute uitvoer

Doordat de overheid deze situatie tot nu toe niet lijkt te willen onderkennen, laat het kansen liggen om bijvoorbeeld fraude op effectieve wijze te bestrijden. Bij de koppeling van bestanden loopt de overheid tegen het probleem aan – of gaat daar tegen aan lopen – dat gegevens in verschillende bestanden afwijken als gevolg van fouten bij invoer. De conclusie die men dan trekt, is dat alle bestanden gestandaardiseerd moeten zijn om goed te kunnen koppelen. Natuurlijk helpt het als gegevens eenduidig en gelijkvormig zijn, maar het echte probleem ligt dieper, namelijk in het gebruik van traditionele vergelijkmethoden. Die vergelijken gegevens op exacte wijze. Het grote nadeel daarbij is dat een minimale afwijking in een gegevenselement tot een mismatch of non-identificatie leidt. De ‘frauderende’ of ‘sjoemelende’ burger die zich voordoet als ‘P. Keizer aan de Velperweg 12 in Arnhem’ wordt niet herkend als deze in het overheidsbestand bekend staat als ‘P.J. de Keijzer aan de Oude Velperweg 12 in Arnhem’.

Met andere woorden: standaardisatie lost niets op. Of je schoont de bestanden tot in de perfectie op – dan werkt een één-op-één-koppeling – of je koppelt bestanden met behulp van intelligente software die vervolgens de imperfecties elimineren. Het enige dat de overheden absoluut niet moeten doen, is imperfecte bestanden vergelijken met exacte middelen, zoals bijvoorbeeld (een combinatie van) trefwoord, postcode-huisnummer, geboortedatum, matchcode. En dat is nu precies wat er aan de hand is: een baaierd aan ad-hoc-oplossingen, omdat de beheerders van bestanden weigeren te erkennen dat hun bestanden niet 100 procent zijn, laat staan dat ze hun bestanden uit handen willen geven.

Roffelen op de politieke trom

De oplossing voor deze problematiek is niet – zoals de overheid beweert – het streven naar een volledige aansluiting van bestanden maar de toepassing van een andere koppelingsmethode. Door gebruik te maken van kennis en principes van natuurlijke taalverwerking kan software omgaan met notatieverschillen en daardoor schijnbaar andere gegevens. Het aloude proces van op het oog vergelijken van twee persoonskaarten voert intelligente programmatuur snel en automatisch uit. Daardoor is het wel degelijk mogelijk omvangrijke bestanden in kort tijdsbestek met elkaar te vergelijken en de juiste verbanden te leggen. Binnen een aantal departementen, zoals Justitie, Financiën en Economische Zaken wordt al jaren met succes gebruik van gemaakt van zo’n methode, maar met name gemeentelijke overheden blijven halsstarrig vasthouden aan hun zelf ontwikkelde klassieke koppelingsmethodieken. Frauderen blijft daarom simpel en leidt zeker tot verspilling van gemeenschapsgeld.

Waar het natuurlijk echt om gaat, is dat de overheid zijn taak verzaakt: de overheid weigert (in tegenstelling tot het bedrijfsleven) te investeren in de kwaliteit van relatiegegevens. Als hoedster van de Gemeentelijke Basisadministratie dan wel Bevolkingsadministratie – niet minder dan hét bronbestand van Nederland – is diezelfde overheid natuurlijk minstens moreel verplicht om dat bestand in optimale conditie te houden. Maar in plaats daarvan wordt de aandacht voor relatiegegevens slechts ingegeven door politieke opportunisme, bijvoorbeeld fraude met sociale zekerheid. En dat maakt die aandacht periodiek en ad-hoc. Sterker: er wordt even op de politieke trom geroffeld, en men gaat weer over op de orde van de dag. Neem de Bijlmerramp: tijdens die ramp gaf een woordvoerder van de gemeente Amsterdam aan dat het moeilijk is om goede gegevens bij te houden, resulterend in behoorlijk uiteenlopende getallen aangaande doden dan wel vermisten. Je zou verwachten dat zo’n crisis vele politieke handen uit de mouwen zou doen steken. Naar nu blijkt is dit dus niet het geval. In elk geval is er veel te weinig gedaan.
Maar ook minder ernstige situaties wijzen erop dat de overheid de kwaliteit van relatiegegevens nog altijd niet erg serieus neemt. In de maand juli kregen duizenden mensen hun huursubsidie niet uitbetaald – ongeveer 3000 volgens het ministerie van Volkshuisvesting. Reden: adres- of inkomensgegevens bleken onvolledig of onjuist! (bron: NRC)

Koppelen wast niet wit

De overheid verleent allerlei diensten en verstrekt burgers en bedrijven financiële voorzieningen. Uiteenlopend van individuele huursubsidie en premies voor startende bedrijven tot bijstandsuitkeringen en bijdrageregelingen voor bodemsanering. Om te zorgen dat de juiste bedragen bij de juiste personen komen, of omgekeerd dat niemand onterecht meerdere malen profiteert van een toewijzing, is de overheid verplicht een kwalitatief hoogwaardig relatiebestand te hebben en te beheren. Dus niet alleen om een koppeling tot stand te kunnen brengen! Bovendien is het idee dat een koppeling automatisch de uitwassen ‘wit wast’ bezijden de waarheid: in alle bronbestanden is de primaire gegevensvastlegging een manueel proces, en daarbij worden nu eenmaal fouten gemaakt. Ondanks overlegging van bijvoorbeeld paspoort of uittreksel van de KvK. Dus controle op basis van koppeling werkt pas als de verschillende bronbestanden schoon zijn, en niet als ze zijn gestandaardiseerd.

Waar het bedrijfsleven, aangejaagd door economische en imago-motieven, steeds meer het belang inziet van investeringen in de kwaliteit van relatiegegevens, is het schokkend om te moeten constateren dat het de overheid ontbeert aan elke vorm van maatschappelijke drive om datzelfde te doen. Het is hoog tijd voor de roep om BRM: Burger Relationship Management.

(Pierre Pieterse is freelance journalist/redacteur)

Deze column werd ingezonden door Pierre Pieterse. Heeft u ook iets wat u bezig houdt? Plaats uw eigen column ›