Misdaden oplossen met een algoritme

October 31, 2017

Share this article:

Wanneer een moord of terroristische aanslag wordt gepleegd, is het aan de rechercheurs en politieagenten de taak in een zo kort mogelijke tijd zoveel mogelijk scenario’s af te gaan. Hierbij wordt rekening gehouden met onder andere het motief van de dader, de plaats delict en het moordwapen. Al gauw kunnen veel verhaallijnen worden weggestreept, omdat deze niet hetzelfde patroon vertonen als eerder vertoonde gevallen of simpelweg geen logische link bevatten. Vervolgens worden de mogelijke gebeurtenissen één voor één gecontroleerd. Stel je nu voor dat deze selectie niet door het brein van een rechercheur wordt uitgevoerd, die enkel kan vertrouwen op zijn geheugen en ervaring, maar door een programma dat beschikt over data van honderdduizenden scenario’s, en dat bovenal dit systeem ook nog eens blijkt te werken.
Peter De Kock was degene die dit idee voor ogen kreeg. Voordat hij aan zijn carrière bij de politie begon, waren verhaallijnen al een groot onderdeel van zijn leven door zijn ervaring in de filmindustrie. Hier was hij tien jaar het hoofd van de afdeling Afgeschermde Zaken. Deze afdeling houdt zich bezig met onder andere de georganiseerde criminaliteit en terrorisme. Bij de politie heeft hij in het kader van zijn master onderzoek gedaan naar de vraag of je vanuit bestaande scenario’s nieuwe scenario’s kunt ontwikkelen. Niet alleen hij was zich hiervan bewust; na de terroristische aanslag van 9/11 vroegen rechercheurs aan regisseurs in Hollywood of zij een script van de aanslag konden schrijven, zoals een terrorist dit zelf ook van tevoren zou doen. Een terrorist is in zijn eigen ogen vaak de held van zijn verhaal. Door deze creatieve manier van denken toe te passen, konden ze verschillende motieven langsgaan die een terrorist zelf ook zou kunnen hebben gehad.
De terroristische database die naar aanleiding van deze vragen en ideeën werd ontwikkeld bij het bedrijf Pandora Intelligence, bevat op dit moment meer dan een half miljoen scenario’s. Peter De Kock, eigenaar van dit bedrijf en bedenker van deze database, is gepromoveerd met zijn proefschrift Anticipating Criminal Behaviour aan de universiteit van Tilburg. Op dit moment maken veiligheidsinstanties en bedrijven over de hele wereld gebruik van deze terrorisme database, om op deze manier terroristische aanslagen te kunnen voorspellen en te voorkomen.
In samenwerking met studenten van de Saxion Hogeschool wordt op dit moment hard gewerkt aan niet alleen de terrorisme database, maar sinds kort ook aan een tweede database, de moord database. Deze database werd in eerste instantie alleen met Nederlandse moorden gevuld, maar is daarna verder uitgebreid met verzonnen scenario’s en buitenlandse data. Door middel van deze database wordt een groot deel van het denkwerk geautomatiseerd voor de politie. Door de grote hoeveelheid aan informatie kunnen patronen worden ontdekt die niet alleen moorden, maar ook zogeheten cold cases kunnen oplossen. Het mooie aan het programma is dat er geen sprake is van privacyschending. De informatie die namelijk wordt verwerkt geeft niks weer over de slachtoffers of daders, maar enkel de objectieve informatie over de gebeurtenissen. Dat deze database wordt geconstrueerd, is ook nog voordelig voor analyse. Dossiers van moordzaken moeten namelijk volgens de privacywet vijf jaar na dato vernietigd worden. Door de database kan een heleboel informatie wel gebruikt blijven worden en kunnen we deze vervolgens gebruiken voor meer inzichten in criminaliteit zonder de privacy van daders en slachtoffers te schenden.
In zijn proefschrift legt De Kock uit dat verhaallijnen, los van welke cultuur of tijd dan ook, altijd kunnen worden teruggebracht naar twaalf elementen. Zo worden ook moorden en terroristische aanslagen omschreven door deze twaalf samenhangende elementen. Een moordwapen zegt bijvoorbeeld al gauw wat over het motief van de dader. Door bij een moordzaak in een korte tijd deze twaalf variabelen te verzamelen, zal het dataprogramma de scenario’s weergeven die wellicht hebben plaatsgevonden. Dit is niet alleen sneller dan het menselijk brein, maar ook een stuk nauwkeuriger en uitgebreider.
De database van de terroristische aanslagen werd in eerste instantie alleen gevuld met waargebeurde incidenten. Echter werden deze en de moord database later aangevuld met verzonnen verhalen uit boeken en films. Dit lijkt op het eerste gezicht misschien vreemd, maar al deze verzonnen verhalen zijn potentiële scenario’s die terroristen zelf ook bedacht zouden kunnen hebben. Daarbij baseren daders die een moord of aanslag plegen hun eigen aanval vaak op verhalen die zij zelf hebben gelezen of gezien en laten zich op deze manier inspireren door verhalen uit de database. Door op deze manier de database nog verder uit te breiden, wordt een nog nauwkeurigere output gecreëerd. Door de combinatie van zowel fictieve als non-fictieve data ontstaat een verhaal, zoals voor De Kock een filmscenario ontstaat, met de terrorist of moordenaar in de hoofdrol. Het wordt zo steeds moeilijker voor een terrorist een aanslag te plegen die niet al is gepleegd of niet is bedacht.
Pandora Intelligence is bezig met het verbeteren van het gebruiksgemak van het IT-systeem en daarnaast ook een model aan het ontwikkelen waarbij bedrijven zelf scenario’s uit kunnen werken. Het bedrijf haalde een kapitaal op van 1,5 miljoen euro,  afkomstig van investeerders die werden bijeengebracht door Brooklyn Ventures. Verder werd Ard Jol aangedragen als operationeel directeur en houdt De Kock een klein meerderheidsaandeel in het bedrijf. De complexiteit die de wereld sinds een aantal decennia kent vraagt om een database zoals die door De Kock ontwikkeld en dit is meteen al terug te zien in de praktijk. Bij een oefening georganiseerd door Pandora Intelligence bij een eenpersoons beveiligingsbedrijf werden door de ontwikkelde scenario’s van de database de aanslagen die op het leven van een proefpersoon waren beraamd, ruim van te voor ingeschat. Daarom kan ook wel de vergelijking met een schaakcomputer worden gemaakt, die de complexiteit van alle denkbare zetten snel kan verwerken. Door als het ware de computer nu tegen zichzelf te laten schaken, en dus zelf scenario’s te laten ontwikkelen, zou de database verder verbeterd kunnen worden.  De omzetverwachting voor dit jaar is enkele miljoenen. Dit wordt onder meer mogelijk gemaakt door nieuw groeigeld en een ervaren directeur die het bedrijf klaarstoomt voor de volgende fase. In deze fase is de prioriteit te vinden in het verbeteren van het gebruiksgemak van het IT-systeem.
Wanneer een bedrijf Pandora Intelligence inschakelt, kunnen zij de geheime informatie van dit bedrijf alleen gebruiken op het terrein van de klant. Dit is iets wat natuurlijk liever anders wordt gezien. Net zoals de moord database wordt ontwikkeld door zoveel mogelijk data samen te voegen, zou de combinatie van data van verschillende instanties ook een robuuster systeem creëren. Veel verhaallijnen hebben een logische opbouw en een opvallend grote samenhang tussen de verschillende elementen die een verhaal maken.
Het model van De Kock werkt niet op basis van analytische logica, maar met machine learning. Het model vergelijkt niet analytisch de verschillende data-componenten met elkaar om er verbanden tussen te kunnen leggen, maar de computer simuleert een machine die zijn eigen verbindingen steeds opnieuw verandert. Een voorspelling die klopt, leert de machine dat de verbanden die hij legt juist zijn. Op dezelfde manier past hij zijn verbindingen aan wanneer de output ongewenst blijkt te zijn. Met dit predictive policing algoritme begrijp je door de hoeveelheid data waarop de voorspelling gebaseerd is en de enorme complexiteit  niet meer waar de output vandaan komt. Toch blijken deze algoritmes te werken; negentig procent van de gevallen bevat namelijk de juiste output. De twaalf elementaire componenten die De Kock onderscheidt zijn de arena, tijd(bereik), context, protagonist, antagonist, motief, voornamelijk doel, wijze, modus, operandi, afwering, symboliek en red herring (valse aanwijzing) van het verhaal. Dit scenario model, ook wel ESC12 (Elementary Scenario Components) genoemd, bestaat uit een verzameling van modules en processen die ongestructureerde data verwerkt, die vervolgens door de ESC12 worden gestructureerd en verschillende scenario’s als output geeft. Via een Data Cruncher worden de ongelijksoortige data omgezet in gelijksoortige componenten. Deze ESC12’s worden vervolgens in een scenario matrix geselecteerd op categorie. Op deze manier worden de data beschikbaar gesteld voor de analyse. De volgende stap is dan ook Data Warehousing. Hier worden de gegevens zo verwerkt dat verschillende verhaallijnen makkelijk vergeleken kunnen worden en de relaties tussen verschillende componenten worden weergegeven. Daarna is de Controller ontwikkelt voor het invoeren van input en het linken van deze input met het ESC12 scenario model. Als laatst kan de Scenario Generator geïnstrueerd worden door de Controller en gebaseerd op de instellingen van de gebruiker een gewenste output geven.
Juridisch gezien kun je iemand niet veroordelen op basis van de output van de database. Echter, de inlichtingendienst kan met deze informatie wel een terroristische aanslag voorkomen of verstoren. Hiermee zou een terrorist nog wel steeds vrij rondlopen, omdat die in werkelijkheid nog niks heeft gedaan. Om deze reden zijn er nieuwe anti-terrorismewetten gekomen die ook het voorbereiden van een aanslag strafbaar maken. De nuance tussen veiligheid en onterecht veroordelen die vervolgens ontstaat moet daarom nauwkeurig gecontroleerd worden. De programma’s van De Kock mogen niet mensen veroordelen voordat ze iets gedaan hebben, hoe verleidelijk dit misschien ook is. Echter, met programma’s als de moord database en terrorisme database kan de groep fout negatieven, mensen waarvan de kans heel groot is dat ze een terroristische aanslag gaan plegen, maar waarvan we het nog niet weten, kleiner worden gemaakt. Het gevaar is daarbij wel dat de groep fout positieven, mensen van wie ten onrechte wordt gedacht dat het terroristen zijn, te groot worden. Al met al zijn de databases die De Kock heeft ontwikkeld van groot belang en doen we hier nu al ons voordeel mee.


Dit artikel is geschreven door Anne Dumoulin.

Read more

The Seven Bridges of Königsberg

The Seven Bridges of Königsberg

Imagine you are taking a stroll around the 18th century Prussian city of Königsberg (currently Kaliningrad, Russia). The river Pregel runs through Königsberg and there are two large islands in this river. The islands are connected to each other and to the mainland by...