[expand title = “Dan Ariely“] Professor of Psychology and Behavioral Economics, Duke University, Durham, North Carolina, VS. [/expand] zei het al in 2013: “Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it…”.
De wereld is in rap tempo aan het veranderen en dat geldt uiteraard ook voor het actuariële werkveld. In het afgelopen decennium is de verzekerings- en pensioenwereld sterk geconsolideerd. Met de komst van Solvency II, het risicogebaseerde toezichtraamwerk voor verzekeraars, is de wettelijke positie van de certificerend actuaris bij verzekeringsmaatschappijen komen te vervallen. Ook aan de poorten van de pensioenwereld wordt op dat terrein inmiddels gerammeld. Daarbovenop buitelen de technologische innovaties in de financiële dienstverlening, kortweg FinTech genoemd, over elkaar heen. De ontwikkelingen in de hardware (kleinere en snellere chips, glasvezelnetwerken) en software maken het mogelijk dat grote hoeveelheden beschikbare data kunnen worden geprocessed. En ten aanzien van die data geldt al jaren, dat 90 procent van alle data ter wereld in de twee voorafgaande jaren wordt gegenereerd. Dit is het landschap waarin wij leven. En het biedt ongekende mogelijkheden.
“Data Science is er, en er gebeuren al heel veel dingen mee”
Waarom krijgt u, als u bijvoorbeeld Amazon of Bol opent, een aanbieding in de rechterbovenhoek van uw scherm te zien die verdacht veel lijkt op datgene wat u onlangs heeft aangeschaft of online heeft bekeken? En, waarom stelt Netflix vaak een programma voor waarvan u denkt: “hee, dat past bij mij”? Om het exotischer te maken: in India speelt momenteel een Data Science project om olifantengeluiden te kunnen onderscheiden van ‘surrounding sounds’. Waarom zou je dat willen weten? Omdat die olifanten tegenwoordig steeds vaker lokale en afgelegen dorpjes binnenvallen aangezien daar makkelijk voedsel te halen is. En dat geeft overlast. Dus is het handig wanneer je snel weet wanneer er olifanten in de buurt zijn, zodat je die vroegtijdig kan verjagen. Of het meest beruchte verhaal: hoe zou Trump toch de presidentsverkiezingen hebben gewonnen. Spannend tot op de dag van vandaag, en we zullen er wel nooit achter komen. Kortom: Data Science is er, en er gebeuren al heel veel dingen mee.
Wat betekent de ontwikkeling van Data Science nu voor de financiële sector, en vooral ook voor mijn wereld, de actuariële wereld? Steeds vaker creëren marktpartijen een voorsprong ten opzichte van hun concurrenten doordat ze nuttige informatie uit data weten te halen, of door data te combineren. Niet alleen met soortgelijke data, maar steeds vaker met totaal andere vormen van data. Statische data versus dynamische data. Beeldmateriaal ten opzichte van the Internet of Things. Traditionele verzekeraars die hun traditionele verdienmodellen, mede door de lage rente en door lagere beleggingsopbrengsten, zien kantelen van schadeherstel naar schadepreventie. Of, nieuwkomers op de verzekeringsmarkt die hun producten aanbieden zonder al te veel administratieve rompslomp voor de eindgebruiker. Een mooi voorbeeld van een dergelijke toepassing, wordt aangeboden door de Amerikaanse verzekeraar ‘Lemonade (lemonade.com)’. Binnen 90 seconden ontvang je, op basis van minder dan tien vragen, een offerte voor een complete levensverzekering. Hoe dan? Via een chatbot in een app. Geen gedoe met 14 kantjes aanvraagformulier invullen… Het is 2017…
“Data Science: het slim ontginnen van bruikbare informatie uit beschikbare data”
Terug naar Data Science. Wat is dat nou eigenlijk precies? Ik zal er een paar aspecten uithalen die ik van belang vind voor de actuariële beroepsgroep. In mijn optiek is de enge betekenis van Data Science: het slim ontginnen van bruikbare informatie uit beschikbare data. Op de brede definitie kom ik later terug.
De enge definitie bestaat – en ik benadruk dat dit mijn mening is – eruit dat via de stappen descriptive – predictive – prescriptive modelling, bruikbare informatie uit beschikbare data wordt gewonnen. Het descriptive deel is wat voorheen ‘beschrijvende statistiek’ werd genoemd: het weergeven van statistische eigenschappen van data, via cijfers, plots of dashboards. In het predictive deel worden de scenario’s geschetst en komen de technieken Machine Learning en deep learning om de hoek kijken. Uiteindelijk resulteert het definitieve model onder de noemer ‘prescriptive modeling’. De meeste tijd gaat zitten in het prepareren van de data. Dit maakt dat data engineering en data analytics het meeste tijd kost: met passen en meten wordt de meeste tijd versleten.
Ik zou nog terugkomen op de bredere definitie van Data Science. In mijn opleiding tot data scientist, stelde een van de professoren dat in het veld van Data Science twee verschillende soorten professionals rondliepen: data scientists en statistici. Hij maakte de vergelijking met piraten: een data scientist zonder bredere kennis is wel in staat snel informatie boven water te halen, maar is niet in staat de informatie die hij uit die data haalt adequaat te verklaren. Is de informatie legally useful? en/of ethisch verantwoord? En impliceert correlatie niet meteen causaliteit. Immers, er zijn talloze toevallige correlaties te vinden, zoals op de website ‘tylervigen.com’, waar toevallige correlaties – zoals de US-uitgaven aan wetenschap, ruimte en technologie met het aantal zelfmoorden door verstikking, wurging of verhanging – zomaar ineens als causaal kunnen worden geïnterpreteerd.
“Toevallige correlaties die zomaar ineens als causaal kunnen worden geïnterpreteerd”
Daarnaast speelt voor de actuariële beroepsgroep nog een ander zeer belangrijk aspect. Hoewel Data Science een nog niet volledig ontgonnen terrein is, wordt er een stevig beroep gedaan op ondernemerschap. Het draaien van een algoritme en het tonen van een correlation plot is niet meer voldoende om de klant te overtuigen. De actuariële professional zal zich steeds meer moeten kunnen inleven in de belevingswereld van de klant en zich de taal van de klant eigen moeten maken. De tijd van het verschuilen achter vakjargon is echt voorbij.
Alle ontwikkelingen, containerbegrippen en ‘buzz words’ ten spijt, actuarissen hebben in principe alle skills in huis om op het domein van Data Science hun rol te pakken, naast uiteraard andere goede kanshebbers, zoals bijvoorbeeld IT’ers die al actief zijn op dit domein. De wiskundige en statistische technieken zijn niet anders dan voorheen. Termen als R-square, SVD en linear programming worden veelvuldig onder de ‘motorkap’ van Data Science gebruikt, en dat maakt dat een actuaris inzicht heeft in de gehanteerde theorie, wat hem een voorsprong geeft op die data scientists die wel handig zijn in het genereren van resultaten, maar niet of slecht kunnen duiden of het onderliggende algoritme geschikt is voor het probleem van de klant. Wat wel anders is dan voorheen, zijn de beschikbare tools zoals hardware en software en de manier waarop ermee wordt omgegaan. Veel van de gebruikte software is ‘freeware’, wat zoveel wil zeggen dat de software vrij verkrijgbaar is. Bekende voorbeelden hiervan zijn ‘R’ en ‘Python’, programmeertalen die veelvuldig worden gebruikt. Een bijkomend aspect van deze freeware is dat vrijwel dagelijks nieuwe packages vrijelijk beschikbaar komen. Een verdienmodel ligt hieraan niet ten grondslag, het is immers de hedendaagse gedachte dat kennis gedeeld moet worden.
“Het is de hedendaagse gedachte dat kennis gedeeld moet worden”
Kortom, wat betekent Data Science voor (aankomende) actuarissen? Het is mijns inziens belangrijk dat het bestaande beeld van actuarissen moet veranderen. Traditioneel zijn wij kwanten (let op: positieve connotatie!) die van oudsher in de verzekerings- en pensioenwereld opereren. Wij houden ons beroepshalve bezig met het identificeren en kwantificeren van risico’s en stellen de financiële gevolgen vast die deze risico’s met zich meebrengen. De vraag is of we die wereld niet moeten vergroten. Door ons al vroeg in de studie, maar vooral ook blijvend, te bekwamen in Data Science, is het mogelijk onze rol uit te breiden naar een adviseur met de erkende skills van een actuaris, aangevuld met vergaande domeinkennis.
Het vak data scientist bestaat amper 10 jaar en in 2008 bestond de term nog niet eens. En tegenwoordig is het ‘the sexiest job of the 21st century’. Dat belooft wat voor actuarissen. Want wij zijn bezig met de toekomst van ons beroep en Data Science maakt daar een belangrijk deel van uit.
Dit artikel is geschreven door drs. Corné van Iersel AAG CERA.
Corné is actuaris en senior beleidsmedewerker bij het Koninklijk Actuarieel Genootschap (AG), de Nederlandse beroepsvereniging van actuarissen en actuarieel analisten. Voor meer informatie over het AG en het beroep van actuaris, gaat u naar www.ag-ai.nl/ActuarieelGenootschap.