Weinig dingen die in de rechtspraktijk zo veel losmaken als de opkomst van artificial intelligence. Ik noemde vorige keer al de pleitrobot die zich warmdraait, en de dossiervretende software.
Door Arnoud Engelfriet
AI doet grote beloftes aan de gehele samenleving: het kan ziektes beter detecteren dan artsen, fraude consequent signaleren, zonder vooringenomenheid cv’s screenen – en dus ook recht doen zonder al die menselijke zwakheden.
Precies, dat noemen we een hype. Wat zit er nu achter die belofte van artificial intelligence (AI), en wat gaan we zien in 2019?
Als vakgebied bestaat AI al vele decennia, maar wat het nu precies is? Daar is niemand het tot nu toe over eens geworden. Mijn ietwat cynische samenvatting is dat AI haast per definitie een hype is, een belofte voor wat binnenkort mogelijk wordt. Zodra het gewoon kán, vinden we het een algoritme oftewel softwaretruc die gewoon wat rekent. Zodra we zien dat het kan, is het niet meer fascinerend.
Dat wil niet zeggen dat AI niet innovatief kan zijn. Er zijn de afgelopen jaren vele doorbraken geweest die echt een revolutie in de dataverwerking en -analyse hebben gerealiseerd. Belangrijk daarbij is wel dat u voor ogen houdt dat het eigenlijk niet gaat om een nieuwe intelligentie, maar om een andere manier van conclusies trekken. Zoals de Nederlandse computerwetenschapper en -filosoof Edsger Dijkstra het formuleerde: ‘The question of whether machines can think, is about as relevant as the question of whether submarines can swim’. Computers denken niet, ze opereren volstrekt anders. Maar wat ze daarmee kunnen doen, kan best eens betere resultaten opleveren dan menselijk denken.
De doorbraken in de afgelopen jaren gingen met name over de algoritmes. Hoe kom je van een berg data tot een manier om uitspraken over nieuwe input te komen? Hoe ga je snel door die data heen, hoe generaliseer je metingen tot de best passende algemene lijn? Nieuwe algoritmes, en vooral ook nieuwe supersnelle hardware en gigantische geheugenruimte, hebben daarin dingen mogelijk gemaakt die voorheen gewoon écht niet haalbaar waren.
De belangrijkste ontwikkeling op dit gebied was die van deep learning: algoritmes die patronen leren herkennen in verschillende fases, waarbij geprobeerd wordt het leerproces (goed of fout herkennend) te laten werken zoals menselijke hersencellen ook werken. Dit staat ook wel bekend als neurale netwerken. In de kern komt het eigenlijk altijd neer op statistische analyse waarbij verbanden in grote hoeveelheden data worden gezocht, om daarmee algemene regels te formuleren.
Een simpel voorbeeld: ploeg door miljoenen aankopen bij Albert Heijn heen om te zien wat vaak samen gekocht wordt. Dan zie je bijvoorbeeld dat een aankoop van diepvriesmaaltijden vaak samen gaat met de aankop van bier. Dus kun je mensen die een gekoelde stamppot kopen met grote kans op succes aanraden om eens een witbiertje te kopen.
Dit blijkt verbazingwekkend effectief, zelfs als je geen idee hebt waaróm diepvrieseten en bier vaak samen gekocht worden. Wij mensen zijn heel erg goed in het zien van oorzakelijke verbanden, en dat is een risico bij AI: deze analyses trekken conclusies op basis van correlaties, samenloop, en niet op basis van causaliteit, oorzakelijk verband. De computer heeft geen idee, maar ziet twee dingen samen gaan, dus daar kunnen we wat mee.
Vooringenomenheid
Het grote onderwerp rond AI in 2019 is de kans op vooringenomenheid. Een AI is niet objectief, maar ‘erft’ dezelfde vooroordelen als zijn menselijke voorgangers. Dit is een andere verschijningsvorm van hetzelfde probleem: de computer ziet een correlatie tussen bijvoorbeeld het geslacht (vrouw) en de carrièreontwikkeling (halve dagen werken toen zij 34 werd), en concludeert op basis daarvan daarmee dat mensen met deze eigenschappen geen kandidaten voor een topfunctie zijn. De computer heeft geen ethiek en geen geweten, en heeft dus geen idee of hij op eerlijke of oneerlijke gronden iemand afwijst. Ieder datapunt is gelijkwaardig. Dat sommige datapunten juridisch niet in orde zijn, is lastig een computer aan te leren.
Met de juiste data – en de juiste filters tegen verkeerde conclusies – trekt de computer wel de juiste conclusie. Daar gaat de komende jaren dus alle aandacht naar toe: hoe verzamelen we de juiste data, en hoe wéten we wat de juiste data zijn. Want natuurlijk kun je triviale elementen zoals geslacht weglaten uit een dataset, maar computers zijn slim en kunnen dit gemakkelijk afleiden uit andere informatie, zoals een koppelteken in de achternaam.
Nu AI ook voor juridisch relevante toepassingen steeds vaker gebruikt gaat worden, wordt de roep om aandacht voor die juiste data steeds belangrijker. Het maakt immers nogal uit of je als vrouw de Viva aangeraden krijgt omdat je schepijs koopt, of omdat je geweigerd wordt voor een topfunctie.
Het probleem voor de komende jaren wordt dan ook hoe we die data vrij van vooringenomenheid krijgen. Niet in het minst omdat we eigenlijk vaak niet goed weten óf er dergelijke zaken in zitten. Waren we als bedrijf altijd wel objectief bij de keuze van management-materiaal? Keken we wel eerlijk naar onze klanten en hun betaalgedrag? Wie dit probleem op weet te lossen, zit gebakken met zijn AI oplossing.