Geen CRM maar BRM !!

‘Bestanden overheid deugen niet’- zo kopte De Volkskrant op woensdag 6 november. En dat is eigenlijk nog eufemistisch gesteld: bijna eenderde van de adressenbestanden die overheden gezamenlijk willen gebruiken (voor de zo gewenste koppeling om bijvoorbeeld fraude uit te sluiten), klopt niet. De directe maatschappelijke gevolgen van deze situatie zijn echter niet minder schrijnend: ‘door de adresvervuiling rijden ambulances soms naar de verkeerde plek en krijgen wijken soms geen of verkeerde voorzieningen, omdat de gemeente geen juist beeld heeft van de bevolkingssamenstelling’ – aldus hetzelfde ochtendblad .

Laten we eerst eens even de bestandskoppeling op de snijtafel leggen. Volgens de overheid is dat probleem onoplosbaar, zolang de bestanden niet opgeschoond zijn. Je kan natuurlijk als uitgangspunt nemen dat koppeling pas mogelijk is als de gegevens in de te koppelen bestanden actueel, correct, compleet en uniek (ACCU) zijn. Dat is echter een illusie - althans als je ervan uit gaat dat mensen de gegevens bewerken en opslaan. Mensen maken nu eenmaal fouten en vergissen zich. Om de gegevens ACCU te maken kan intelligente software ingezet worden. Daarna kan dan desgewenst gekoppeld worden. Een andere optie is - want het gaat om het koppelen - het inzetten van intelligente software die fouttolerant gegevens vergelijkt. Beide typen software zijn al vele jaren op de Nederlandse markt te verkrijgen, maar worden door de overheid nog maar mondjesmaat ingezet.

Maar daar ligt de kern van het probleem niet. De waarheid is dat de overheid een verzameling van gemeentelijke, provinciale en rijksinstanties is, die alle bestanden met gegevens over rechts- en natuurlijke personen hebben. Elk van die instanties kent een bepaalde autoriteit en elk bestand heeft een eigenaar/beheerder. Kennis is macht geldt ook binnen de overheid. “Kom niet aan mijn bestand!” – hoor je ze bij wijze van spreken al roepen. En als uiteindelijk tijdens een proces discrepanties aan het licht komen, is het de vraag wie van de instanties zijn bestandsstructuur dan wel gegevens moet aanpassen. Het antwoord moge duidelijk zijn – zeker als genoegzaam bekend is dat de GBA weliswaar de bron is, maar niet 100 procent schoon. Om het probleem werkelijk op te lossen, moet het probleem van de machtspolitiek en eilandvorming opgelost worden.

Foute invoer, foute uitvoer

Doordat de overheid deze situatie tot nu toe niet lijkt te willen onderkennen, laat het kansen liggen om bijvoorbeeld fraude op effectieve wijze te bestrijden. Bij de koppeling van bestanden loopt de overheid tegen het probleem aan – of gaat daar tegen aan lopen - dat gegevens in verschillende bestanden afwijken als gevolg van fouten bij invoer. De conclusie die men dan trekt, is dat alle bestanden gestandaardiseerd moeten zijn om goed te kunnen koppelen. Natuurlijk helpt het als gegevens eenduidig en gelijkvormig zijn, maar het echte probleem ligt dieper, namelijk in het gebruik van traditionele vergelijkmethoden. Die vergelijken gegevens op exacte wijze. Het grote nadeel daarbij is dat een minimale afwijking in een gegevenselement tot een mismatch of non-identificatie leidt. De ‘frauderende’ of ‘sjoemelende’ burger die zich voordoet als ‘P. Keizer aan de Velperweg 12 in Arnhem’ wordt niet herkend als deze in het overheidsbestand bekend staat als ‘P.J. de Keijzer aan de Oude Velperweg 12 in Arnhem’.

Met andere woorden: standaardisatie lost niets op. Of je schoont de bestanden tot in de perfectie op – dan werkt een één-op-één-koppeling – of je koppelt bestanden met behulp van intelligente software die vervolgens de imperfecties elimineren. Het enige dat de overheden absoluut niet moeten doen, is imperfecte bestanden vergelijken met exacte middelen, zoals bijvoorbeeld (een combinatie van) trefwoord, postcode-huisnummer, geboortedatum, matchcode. En dat is nu precies wat er aan de hand is: een baaierd aan ad-hoc-oplossingen, omdat de beheerders van bestanden weigeren te erkennen dat hun bestanden niet 100 procent zijn, laat staan dat ze hun bestanden uit handen willen geven.

Roffelen op de politieke trom

De oplossing voor deze problematiek is niet - zoals de overheid beweert - het streven naar een volledige aansluiting van bestanden maar de toepassing van een andere koppelingsmethode. Door gebruik te maken van kennis en principes van natuurlijke taalverwerking kan software omgaan met notatieverschillen en daardoor schijnbaar andere gegevens. Het aloude proces van op het oog vergelijken van twee persoonskaarten voert intelligente programmatuur snel en automatisch uit. Daardoor is het wel degelijk mogelijk omvangrijke bestanden in kort tijdsbestek met elkaar te vergelijken en de juiste verbanden te leggen. Binnen een aantal departementen, zoals Justitie, Financiën en Economische Zaken wordt al jaren met succes gebruik van gemaakt van zo’n methode, maar met name gemeentelijke overheden blijven halsstarrig vasthouden aan hun zelf ontwikkelde klassieke koppelingsmethodieken. Frauderen blijft daarom simpel en leidt zeker tot verspilling van gemeenschapsgeld.

Waar het natuurlijk echt om gaat, is dat de overheid zijn taak verzaakt: de overheid weigert (in tegenstelling tot het bedrijfsleven) te investeren in de kwaliteit van relatiegegevens. Als hoedster van de Gemeentelijke Basisadministratie dan wel Bevolkingsadministratie – niet minder dan hét bronbestand van Nederland – is diezelfde overheid natuurlijk minstens moreel verplicht om dat bestand in optimale conditie te houden. Maar in plaats daarvan wordt de aandacht voor relatiegegevens slechts ingegeven door politieke opportunisme, bijvoorbeeld fraude met sociale zekerheid. En dat maakt die aandacht periodiek en ad-hoc. Sterker: er wordt even op de politieke trom geroffeld, en men gaat weer over op de orde van de dag. Neem de Bijlmerramp: tijdens die ramp gaf een woordvoerder van de gemeente Amsterdam aan dat het moeilijk is om goede gegevens bij te houden, resulterend in behoorlijk uiteenlopende getallen aangaande doden dan wel vermisten. Je zou verwachten dat zo’n crisis vele politieke handen uit de mouwen zou doen steken. Naar nu blijkt is dit dus niet het geval. In elk geval is er veel te weinig gedaan.
Maar ook minder ernstige situaties wijzen erop dat de overheid de kwaliteit van relatiegegevens nog altijd niet erg serieus neemt. In de maand juli kregen duizenden mensen hun huursubsidie niet uitbetaald – ongeveer 3000 volgens het ministerie van Volkshuisvesting. Reden: adres- of inkomensgegevens bleken onvolledig of onjuist! (bron: NRC)

Koppelen wast niet wit

De overheid verleent allerlei diensten en verstrekt burgers en bedrijven financiële voorzieningen. Uiteenlopend van individuele huursubsidie en premies voor startende bedrijven tot bijstandsuitkeringen en bijdrageregelingen voor bodemsanering. Om te zorgen dat de juiste bedragen bij de juiste personen komen, of omgekeerd dat niemand onterecht meerdere malen profiteert van een toewijzing, is de overheid verplicht een kwalitatief hoogwaardig relatiebestand te hebben en te beheren. Dus niet alleen om een koppeling tot stand te kunnen brengen! Bovendien is het idee dat een koppeling automatisch de uitwassen ‘wit wast’ bezijden de waarheid: in alle bronbestanden is de primaire gegevensvastlegging een manueel proces, en daarbij worden nu eenmaal fouten gemaakt. Ondanks overlegging van bijvoorbeeld paspoort of uittreksel van de KvK. Dus controle op basis van koppeling werkt pas als de verschillende bronbestanden schoon zijn, en niet als ze zijn gestandaardiseerd.

Waar het bedrijfsleven, aangejaagd door economische en imago-motieven, steeds meer het belang inziet van investeringen in de kwaliteit van relatiegegevens, is het schokkend om te moeten constateren dat het de overheid ontbeert aan elke vorm van maatschappelijke drive om datzelfde te doen. Het is hoog tijd voor de roep om BRM: Burger Relationship Management.

(Pierre Pieterse is freelance journalist/redacteur)

Kom met uw praktijkervaringen op het terrein van managen en organiseren

Deel uw kennis, schrijf 3 columns of artikelen en ontvang een gratis pro-abonnement (twv €200)

Word een pro!

SCHRIJF MEE >>

Justus Broeckenaere
BRM is helemaal geen oplossing in mijn optiek. Robuuste relationele databases zijn dat echter wel. Ik stoor mij al geruime tijd aan de term 'opschonen' als het data in een database betreft. Volgens de theorieen waarop relationele databases (relationele logica) zijn gebaseerd is een correct datamodel een garantie voor consistente gegevens. Ik heb nogal wat databases van dichtbij gezien en over het algemeen waren de datamodellen niet sluitend, en dus was er ook sprake van opschoonacties.

Hoe lossen wij dit probleem op? De overheid huurt enkele goed opgeleide en ervaren database-deskundigen in (en dus niet mensen van Cap Gemini o.i.d. die onlangs nog een cursus hebben gehad) en deze mensen ontwerpen nieuwe datamodellen en conversie scripts om de huidige database te importeren in de correcte database. Als deze zaken klaar zijn wordt de huidige database op slot gezet en worden nieuwe gegevens slechts ingevoerd in de nieuwe database. Vanaf dit moment kan de beschikbare data ingelezen worden in de nieuwe database en vallen de corrupte records al snel door de mand.

Wat koppeling van databases betreft, stel ik voor dat de verschillende overheidsinstellingen gebruik maken van een grote database waarin alle gegevens staan. Als primary key wordt voor een persoon het SoFi-nummer gebruikt en niets anders. Of iemand dan in de ene database Janssen en in de andere Jansen heet, is dan niet meer relevant. De conversie scripts pakken gewoon een van beiden en als het niet klopt kan de persoon in kwestie later altijd nog naar een callcenter (zie vorige column) bellen en vragen of dit aangepast kan worden.

Norbert Mergen
Als je de reactie van Justs leest, zijn er twee opties:
a) Justs snapt het allemaal wel maar is een cynicus pur sang of
b) Justs weet niet waarover hij spreekt.

Ik zou in beide gevallen niet moeten reageren, maar in geval iemand wel zijn raad opvolgt, doe ik het toch. Zekerheid boven alles. Een goed relationeel bestand is inderdaad de garantie voor consistentie - maar ook de garantie voor consistentie in fouten. Het is echter ondenkbaar dat alle overheden en overheidsinstellingen van een grote relationele database gebruik gaan maken. Dream on - zou ik zeggen! De grootste fout die de meeste IT’ers maken, is dat zij verwachten dat de gebruikers van een systeem de database vullen met waarden, zoals die in het conceptuele model zijn voorzien. Dream on - zou ik wederom zeggen.

Het beste bewijs dat Justs een cynicus is, is dat hij zijn naam opzettelijk fout heeft ingegeven. Hiermee toont hij feilloos aan dat de ontwerper van deze site er geen rekening mee heeft gehouden dat er ook fouten dan wel niet-namen in de rubriek ‘uw naam’ kunnen worden ingevoerd. Erg subtiel Justus. Chapeau!

Norbert Mergen, Human Inference
www.humaninference.nl

PS Human Inference heeft software die in staat is namen te valideren.
Norbert Mergen
Net als klanten van (commerciële) bedrijven niet als nummer wensen te worden behandeld, zo moet de overheid ook de burger niet als nummer behandelen. Als de overheid de kloof met de burger wil dichten, zal zij zich klantvriendelijk moeten opstellen.

In feite spelen binnen de overheid meerdere aspecten een rol:
1) er is geen commerciële drive
2) de politieke opportuniteit en daarmee gepaard gaande actualiteit
3) mensen maken nu eenmaal fouten en ook ambtenaren zijn mensen

Om met de laatste te beginnen: het is een illusie te veronderstellen dat ambtenaren foutloos werken. Nu reeds kennen we een scala aan namen die zijn ontstaan in het papieren tijdperk: er bestaan zowaar 32 schrijfwijzen voor de naam die klinkt als Mathijssen. Dit soort vergissingen zijn weliswaar door o.a. het GBA-netwerk te verminderen – aan de andere kant heeft een fout verstrekkende gevolgen.

Bij de overheid is geen commerciële drive, zoals in het bedrijfsleven. Door klantgericht te handelen, komen er geen klanten (burgers) bij – door niet-klantgericht te handelen verhuizen burgers ook niet. Ze mopperen en keren zich hoogstens van de overheid af. Want welke burger reageert als hij of zij ziet dat er een fout in de bevolkingsadministratie staat? Hoogstens als het tot direct nadeel leidt. En om ervoor te zorgen dat een fout in de bevolkingsadministratie wordt aangepast, vergt nogal wat doorzettingsvermogen. Een database is een afbeelding van de werkelijkheid. De Gemeentelijke Basisadministratie moet dat ook zijn.

Human Inference houdt zich sinds 1986 bezig met de kwaliteit van relatiegegevens. Bijna alle grote bedrijven en andere organisaties gebruiken software van Human Inference. Ook de Rijksoverheid, o.a. IBG, Belastingdienst, Centrale Justiële Documentatie en Ministerie van Justitie (Vreemdelingenketen). Als je er goed over nadenkt, is het ten hemel schreiend dat een bedrijf als bijvoorbeeld Spaarbeleg er veel aan gelegen is om de gegevens van haar (potentiële) klanten correct te verwerken en dat bij alle gemeentelijke overheden de minste of geringste tikfout als waarheid in de basisadministratie c.q. bevolkingsadministratie wordt opgeslagen. Ooit heb ik gesproken met een leverancier van software voor gemeenten. Hij zei: “Waarom zou een gemeente meer geld uitgeven om de kwaliteit te verbeteren? Ze winnen er niets voor terug.” Dat was een jaar of acht geleden. Nu voert het begrip CRM de boventoon bij het bedrijfsleven. Inderdaad, tijd voor BRM!

Norbert Mergen, Human Inference, Arnhem (www.humaninference.nl)
Justus Broeckenaere
Ik ben het volstrekt niet eens met de stelling dat een goed relationeel bestand, naast een garantie voor consistente data ook een garantie voor consistentie in fouten. Natuurlijk kunnen de meeste IT'ers geen relationele databases in elkaar zetten, maar er zijn er genoeg die dit wel kunnen. Om terug te komen op de stelling dat een goed relationeel bestand garant staat voor consistentie in fouten, kan ik alleen maar zeggen, dat als een database niet waterdicht is er geen foute data in terecht kan komen. De IT'ers waar meneer Mergen over spreekt kunnen blijkbaar geen database-implementatie maken als zij niet in staat zijn het conceptuele model waarin de regels nog wel kloppen niet om kunnen zetten in een relationeel implementatiemodel.
Natuurlijk zal een database niet controleren of de schrijfwijze van de achternaam De Broeckenaere met 'ae' of met 'aa' geschreven wordt. Dit is mijns inziens ook niet relevant, want ik voerde aan dat als primaire sleutel het SoFi-nummer van de burger gebruikt kan worden. Dit is immers een uniek nummer. Bovendien bevat een goede database slechts een keer de naam van een persoon.

Het opstellen van een datamodel en bijbehorende constraints (regels waaraan de relaties en de records moeten voldoen) is een van de weinige zaken op gebied van software-ontwikkeling, die zeer goed in samenwerking met de opdrachtgever gedaan kunnen worden. Bij het ontwerp van een database zijn de regels namelijk strikt. Tabellen hebben relaties met elkaar en in de tabellen kunnen slechts bepaalde soorten gegevens opgeslagen worden. Bij het ontwerp van een database is in eerste instantie sprake van een conceptueel model, maar meneer Mergen zou veel betere reclame maken voor zijn bedrijf als hij ook nog weet te melden dat naast een conceptueel model ook een relationeel en een implementatiemodel gemaakt dient te worden. Het implementatiemodel kan vrijwel in een keer omgezet worden in een werkende database, waarin elke foutiefe invoer in deze kern van het systeem wordt afgevangen (de database garandeert de consistentie van de gegevens). Een veel gemaakte fout is om integriteitsregels slecths in de abovenliggende pplicaties in te bouwen. Dit levert weliswaar gebruiksvriendelijkere foutmeldingen op, maar kan tot gevolg hebben dat de data in de database niet meer consistent is. (Waanzin als XML in de database en het gebruik van Enterprise Java Beans dragen tot dit laatste bij bij).

Aangezien een database de kern is van menig applicatie, dienen hier op het laagste niveau zo veel mogelijk business rules (in de vorm van constraints en triggers) geimplementeerd te worden. De overheid doet er goed aan om een algemeen datamodel (niet per se een enkele fysieke database zoals ik wellicht eerder suggereerde) voor persoonsgegevens op te stellen. Dit datamodel kan gemakkelijk binnen een week geimplementeerd worden en hiervoor zijn geen dure Enterprise Solution Integration Deployments nodig (de overheid moet overigens maar eens luisteren naar Groen Links en al die dure software niet meer kopen, maar gewoon degelijke goedkope spullen gebruiken).
Justus Broeckenaere
Natuurlijk moet de overheid klanten niet als nummer behandelen, maar in een database dient dit wel te gebeuren. Overheden doen er wellicht goed aan om 'klanten' (ja, zij noemen ons klanten) duidelijk te maken hoe hun gegevens zijn opgeslagen en wat hun primaire sleutels zijn. Zo kunnen de burgers wellicht een steentje bijdragen aan de controle van de consistentie als de overheid weer eens een steekje laat vallen.
Als de overheid die blauwe enveloppen nou eens een keer achterwege laat en in plaats daarvan de uitdraaien stuurt van een paar database-queries.....
Norbert Mergen
Het lijkt erop dat De Broekenaare in zijn betoog de aansluiting met de realiteit mist. Op zijn verhaal over databases is weinig aan te merken, anders dan dat dit zuiver vanuit de technologie is beredeneerd. Waar Pieterse het over heeft, is dat in systemen al dan niet opzettelijk fouten worden ingegeven en dat eerst maar eens moet worden toegegeven dat databases niet schoon zijn, voordat men het probleem kan oplossen. Dat een probleem van een andere orde.

Een uniek nummer als primaire sleutel gebruiken is al jaren gangbaar; bij overheid en in het bedrijfsleven. Maar het bedrijfsleven weet (a) dat mensen meestal niet hun unieke nummer bij de hand hebben en (b) dat door vergissingen en fouten klanten meer dan eens worden ingevoerd.

Deze feiten gelden 1:1 voor de overheid. En zoals ik al aangaf, ook bij de overheid worden fouten gemaakt: bij een uniek SoFi-nummer worden de gegevens van een persoon verminkt vastgelegd. Maar het kan ook zijn dat een SoFi-nummer niet bij de juiste persoon is gebruikt. Soms moedwillig (witwerken); soms abusievelijk. Het is genoegzaam bekend dat er SoFi-nummers meer dan eens zijn toegekend, of door (externe) bronnen, de nummers en personen zijn verwisseld. Hoe goed het conceptuele model dan ook mag zijn, en hoe goed dat dan ook is geïmplementeerd in een rdbms en hoe diep de controles en validaties daar dan ook mogen zijn ingebouwd (stored procedures, etc.), de werkelijkheid is weerbarstiger. Er moet rekening gehouden worden met menselijk feilen.

Het probleem, heer De Broekenaare is dus niet de techniek. En in zekere zin ben ik het dan ook niet met uw betoog oneens. Sterker nog: sommige meningen over nieuwerwetse zaken deel ik van harte. Maar uw betoog is rigide en enigszins naïef.

Wat mij betreft: discussie gesloten. Tenzij de heer Pieterse of een ander nieuw inzicht heeft..

Norbert Mergen, Human Inference, Arnhem
Justus Broeckenaere
Als een database al dan niet opzettelijk ingegeven data bevat en dus niet 'schoon' is, primary keys in database voor andere doeleinden dan waarborging der relationele integriteit misbruikt kunnen worden, er nog steeds vergissingen gemaakt kunnen worden bij de invoer en de techniek hier geen rol in de oplossing mag spelen en er dus maar weer met de huidige kapotte databases verder gewerkt moet worden, dan moet zal BRM vast wel een goede oplossing zijn.
Succes hiermee.
W.J.Th. van Nijssel
Volgens mij is XML de oplossing van deze problematiek.
Ortwin Verreck
10% van de nederlanders verhuist jaarlijks(CBS). Als dit niet tijdig wordt doorgegeven dan loopt de administratie bijvoorbeeld al achter. De uitdaging is dan ook om de administratie actueel te houden maar ook juist en volledig en dat tegen een gunstige prijs/kwaliteit verhouding. 100% correcte administraties zijn een utopie.. Maar hoe ver moet je gaan?.

Hoe bepaal je de kwaliteit van de huidige gegevens en de businesscase om er wat aan te doen?

De norm die de overheid stelt aan haar bestanden is hoog. Het rechtsgelijkheidsbeginsel, moderne dienstverlening vormen daar o.a. de basis voor. De overheid investeert hier ook nadrukkelijk in. Op het internet zijn diverse publicaties te vinden over de diverse basisregistraties die worden opgezet (denk aan het basis bedrijvenregister).

Ook in de moderne onderneming speelt het gegevenskwaliteitsvraagstuk. Inmiddels zijn een aantal onderzoeksresultaten bekend: 55% van de CRM implementaties en 70% van de DWH implementaties falen door de slechte gegevenskwaliteit(Gartner e.a.) In het verleden werd de kwaliteit van de gegevens met name aangepakt tijdens een nieuwe systeemimplementatie. Nu zie je overal structureel aandacht ontstaan voor de kwaliteit van de gegevens.

De aanpak om de kwaliteit van de gegevens vereist wel een samengesteld pakket van maatregelen. Zo kan men denken aan maatregelen on de gegens te schonen en maatregelen om te voorkomen dat vervuiling gaat optreden. Maar vaak begint het met een meting van de huidige kwaliteit en een goede businesscase zelfs voor een moderne overheid.

Ortwin Verreck
www.arvix.nl
"ARVIX is gespecialiseerd in gegevenskwaliteitsoplossingen"