Met een AI-gedreven oplossing het toenemend probleem van identiteitsfraude onder de knie krijgen.
De strijd tussen orde en criminaliteit is een voortdurend fenomeen in de maatschappij waarbij innovatie een cruciale rol speelt voor beide kanten. Uit onderzoek van Europol1 in 2020 blijkt dat criminelen al langer gebruik maken van AI om aan geld of andere voordelen te komen.
Identiteitsdocumenten zijn de belangrijkste documenten die mensen bezitten en iedereen boven de veertien jaar is verplicht om over tenminste één identiteitsdocument te beschikken. Deze documenten bevatten de basisinformatie over het individu en zijn van belang tijdens officiële acties of evenementen zoals reizen, een bankrekening openen, een verzekering afsluiten, een politiecontrole, etc.
Het is daarom bijzonder verontrustend dat de ontwikkeling en beschikbaarheid van geavanceerde beeldbewerking-technologieën en printtechnieken voor een toename aan identiteitsfraude zorgt. In de afgelopen zes jaar is deze criminaliteitsvorm binnen Nederland met meer dan 500% toegenomen.
Figuur 1: Aantal meldingen van identiteitsfraude bij het Centraal Meldpunt2.

Dit betekent niet dat identiteitsdocumenten niet veilig genoeg zijn. Landen introduceren regelmatig nieuwe en ingewikkeldere echtheidskenmerken op de identiteitsdocumenten, juist om het fraudeurs zo moeilijk mogelijk te maken.
Echter, het probleem ligt aan de kant van de controlerende instanties. Overheidsinstanties zoals de politie of de Koninklijke marechaussee, maar ook instituten zoals banken of verzekeraars, moeten steeds ingewikkeldere en specifiekere controles uitvoeren om de echtheid van een identiteitsdocument te valideren. Hierbij is het belangrijk dat de middelen die men kan gebruiken meegaan met de tijd en dat deze controles dus goed ondersteund kunnen worden.
Uitdagingen op het gebied van documenten controle
Op het gebied van documentcontrole kunnen drie grote uitdagingen worden geïdentificeerd, waarmee tijdens het ontwikkelen van een applicatie rekening moet worden gehouden.
Complexiteit van identiteitsdocumenten
Een van de grootste uitdagingen bij de controle van identiteitsdocumenten is de document-complexiteit. Er zijn rond de tweehonderd landen op de wereld waarvan eenieder eigen identiteitsdocumenten heeft. Per land kom je vaak meer dan tien verschillende geldige typen en modellen tegen3. Voorbeelden daarvan zijn gewone en dienstpaspoorten, ID-kaarten en verblijfsvergunningen. Elk document heeft tussen de vijftig en honderd echtheidskenmerken. Deze kunnen worden gecategoriseerd in gestandaardiseerde afspraken4 in de structuur van een document en land- en of model-specifieke echtheidskenmerken op het document. Bijvoorbeeld het standaard controlegetal in een MRZ (Machine-Readable-Zone, onderaan op het paspoort) of een land-specifiek hologram5.
De complexiteit van documenten is dusdanig dat forensische documentexperts nodig zijn met gespecialiseerde apparatuur om alles te kunnen onderzoeken. Deze kennis en middelen zijn bij veel mensen en bedrijven niet of onvoldoende beschikbaar. Bovendien zijn er ook echtheidskenmerken die niet bij iedereen bekend (mogen) zijn. Tenslotte zijn er ook processen te bedenken waar het aan voldoende tijd ontbreekt om diepgaande controles uit te voeren.
De complexiteit van vorm en structuur van identiteitsdocumenten is duidelijk een uitdaging voor geautomatiseerde processen. Naast de vorm levert ook de inhoud van de documenten problemen op.
Privacygevoelige gegevens
Een tweede uitdaging bij het ontwikkelen van een applicatie ter validatie van identiteitsdocumenten is het gebrek aan data. Identiteitsdocumenten bevatten persoonlijke en gevoelige gegevens over de houder, waardoor de scans niet opgeslagen en bewaard mogen worden voor de ontwikkeling van een AI-model. Echter, voor een volledige AI-oplossing zijn grote hoeveelheden documenten nodig. Hierbij zou het niet voldoende zijn om alleen authentieke documenten in de dataset te hebben, maar is het juist belangrijk om ook tientallen voorbeelden van (realistisch) vervalste echtheidskenmerken voor elk document te gebruiken. Dit is praktisch niet haalbaar, omdat voor elk echtheidskenmerk niet zo veel vervalsingen bekend of te vinden zijn.
Overigens worden documenten ook door landen uitgegeven die zich niet goed aan de normen houden of waar productiefouten zijn ontstaan. Dit betekent dat ook daarvan voorbeelden aan het AI-model moeten worden gevoerd, zodat deze leert dat afwijkingen kunnen bestaan en deze geen vervalsingen zijn.
De gevoeligheid van de gegevens en menselijke fouten in het productieproces zorgen ervoor dat een volledige AI-oplossing niet van toepassing kan zijn op de controle van identiteitsdocumenten. Dat komt niet alleen door de documenten zelf v, ook de bron van de data zorgt voor beperkingen in de applicatie.
Technische limieten van de scanapparatuur
Als derde uitdaging zijn er technische limieten van de huidige scanners en controleprocessen. Ondanks dat er regelmatig nieuwe scanners op de markt komen6 met hogere resoluties en extra functionaliteiten, waardoor heel kleine tekst (zogenaamde microprints) kan worden herkend, zullen altijd echtheidskenmerken bestaan, die niet via scans kunnen worden gecontroleerd. Landen ontwikkelen bewust echtheidskenmerken die alleen op het fysieke identiteitsdocument en met behulp van specialistische forensische apparatuur kunnen worden gecontroleerd. Gangbare documentscanners kunnen dus bepaalde echtheidskenmerken niet zien. Daarnaast hebben sommige controle-instanties, zoals bijvoorbeeld de politie, niet altijd de mogelijkheid om deze geavanceerde scanners te gebruiken, omdat deze scanners op straat niet mee kunnen worden genomen.
Dit heeft als gevolg, dat de applicatie, die wordt gebruikt voor een automatische controle beperkt is door de technische limieten en de beschikbaarheid van de scanners.
Hybride AI-oplossingen als toekomstbestendige applicatie
Hoe kan het best gebruik gemaakt worden van bestaande technologieën om deze uitdagingen aan te gaan?
De toegevoegde waarde van documentsjablonen
In eerste instantie is het belangrijk om op een slimme manier de informatie over de verschillende echtheidskenmerken en documenten te verzamelen en op te slaan. Er zijn meerdere verzamelingen van deze informatie, zoals PRADO7 en Edison8, publiek beschikbaar. Met deze informatie kunnen voor elk type en model van een identiteitsdocument aparte documentsjablonen worden aangemaakt, die als basis voor de applicatie dienen. Hierbij is het aan te raden om rekening te houden met herhalende elementen of structuur eigenschappen, zoals bijvoorbeeld de ICAO standaarden om de benodigde opslag in de database en de hoeveelheid werk van de invoerende mensen te minimaliseren.
Op die manier kan een database worden gecreëerd, die sjablonen voor ieder bekend identiteitsdocument bevat met de bijhorende echtheidskenmerken, variaties en controles. Deze documentsjablonen maken de complexiteit van de identiteitsdocumenten beheersbaar en stellen de applicatie in staat naast de standaard ICAO controles ook land- en model-specifieke controles toe te passen.
De uitdaging met betrekking tot de vorm van de documenten kan aldus worden verholpen door het gebruik van documentsjablonen, maar hoe staat de uitdaging rondom de gevoeligheid van de gegevens?
Toegepaste generieke AI
Het gebrek aan data voor een volledige AI-oplossing betekent niet dat de kracht van AI niet alsnog kan worden gebruikt voor de validatie van identiteitsdocumenten. Het is mogelijk om het validatieproces op te knippen in zodanig generieke stappen, waarvoor gespecialiseerde AI-componenten kunnen worden ontwikkeld. Deze AI-componenten zouden dan met minder data of niet privacygevoelige data uit kunnen komen.
Figuur 2: Validatieproces opgeknipt in generieke stappen met gespecialiseerde AI-componenten.

Zo kan voor het herkennen van het juiste documentsjabloon (classificatie van het documenten) een Deep Learning model worden gebruikt, welke nieuwe gescande documenten kan vergelijken met een database bestaande uit maar één voorbeeld (specimen-)document per documentsjabloon. Deze stap is belangrijk om de land- en model-specifieke informatie voor een gescand document uit de database op te halen.
Daarnaast kan voor het uitsnijden van het document uit de scan object herkenning worden gebruikt. De AI hiervoor kan worden getraind op alle soorten documenten en scans, waardoor de gevoelige data kan worden omzeild. Gezichtsherkenning, zoals degene op mobiele telefoons, maakt het mogelijk om de foto van het document te vergelijken met een live-opname van de houder. De tekst van het document kan worden uitgelezen door de nieuwste OCR (Optical Character Recognition) technieken, om deze in een latere processtap verder te verifiëren.
Voor al deze gespecialiseerde AI-componenten zijn geen gevoelige identiteitsdocumenten en gegevens nodig. In plaats van een volledige AI-oplossing kan het data probleem dus worden verholpen door slim gebruik te maken van meerdere en specifiekere AI componenten. Bovendien is er controle over welke stappen op welke manier worden uitgevoerd en kan een ‘black box’ fenomeen worden voorkomen. Deze aanpak levert betrouwbaardere en beheerbaardere resultaten op en maakt tegelijkertijd gebruik van de nieuwste vooruitgang op het gebied van AI.
Omgang met technische limieten
Het probleem van de technische limieten van de scanners en het scanproces kan niet door een applicatie worden opgelost. Om een volledige documentinspectie toe te passen is en blijft het noodzakelijk het fysieke identiteitsdocument handmatig te controleren. Hierbij is een door technologie ondersteunde handmatige controle aan te raden, om het eerder geconstateerde probleem van de complexiteit te verhelpen en menselijke fouten te minimaliseren.
In eerste instantie kan de classificatie uit de applicatie worden (her-)gebruikt om het juiste documentsjabloon voor de handmatige inspectie te tonen. Dit bespaart tijd. Daarnaast kan het overzicht van het documentsjabloon zo worden ingericht, dat de controleur stap voor stap door de handmatige inspectie, die bij dit specifiek document hoort, wordt geleid. Hierdoor wordt ervoor gezorgd dat alle te controleren echtheidskenmerken op de juiste manier worden gecontroleerd. Daarnaast biedt een overzicht nog de mogelijkheid om aanvullende informatie aan de controleur te tonen. Zo kan bijvoorbeeld een alert voor bekende vervalsingen voor het getoonde document verschijnen, zodat hier extra aandacht aan wordt besteed.
Deze aanpak kan ook bij de politie worden gebruikt om het gebrek aan documentenscanners op straat te verhelpen. Via hun mobiele telefoon zouden zij naast de automatische controle via de camera ook toegang kunnen krijgen naar de handmatige inspectie, om grondigere controles uit te kunnen voeren.
De toevoeging van een stapsgewijze handmatige inspectie omzeilt de technische limieten van scanners door de overige echtheidskenmerken door een mens handmatig te laten controleren.
Samen tegen identiteitsfraude
Identiteitsfraude is een steeds groter wordend risico voor de veiligheid van ons land en systemen. Landen zullen steeds meer en complexere echtheidskenmerken in hun identiteitsdocumenten gaan verwerken om het fraudeurs zo moeilijk mogelijk te maken. Hierdoor hebben overheidsinstanties en andere instituten slimme, schaalbare en toekomstbestendige tools nodig om deze kenmerken te kunnen blijven controleren.
De gevoeligheid van de persoonsgegevens houdt de implementatie van volledige AI-oplossingen, zoals we deze op andere gebieden zien, tegen. Daardoor moeten controle-instanties overstappen naar gespecialiseerde AI-componenten om met de technologische vooruitgang mee te gaan en de kracht van AI in de toekomst alsnog te gebruiken.