‘Gevoed met slechte data en in handen van charlatans leiden slimme algoritmes al helemaal tot gebakken lucht’, schrijft wetenschapsjournalist Enith Vlooswijk in haar column.

De vertegenwoordigers klopten aan in strakke pakken en met torenhoge beloftes. Mijn kennis, werkzaam bij een Vietnamese online-elektronicaverkoper, keek toe hoe zijn baas aan hun lippen hing. Hun zelflerende algoritmes konden zijn websitebezoekers beoordelen op kredietwaardigheid, vertelden ze. Kredietwaardige klanten zouden geld mogen lenen van bank X om producten online te kopen. Zo zou het bedrijf meer verkopen en de bank zou de leenrente opstrijken. Het elektronicabedrijf moest zelf garant staan voor die klanten die toch niet genoeg geld bleken te hebben.

Mijn kennis wilde weten op grond waarvan dat ‘slimme algoritme’ de kredietwaardigheid zou inschatten. Na wat aandringen bleek dat het klikgedrag op de website de doorslag gaf: wie eerst op een strijkijzer klikt en vervolgens toch voor de blender gaat, verraadt daarmee blijkbaar wezenlijke zaken over zijn financiële handel en wandel.

Zelflerende algoritmes behoren tot de meest veelbelovende instrumenten van de wetenschap. Gevoed met grote hoeveelheden data kunnen ze patronen herkennen die leiden tot belangrijke wetenschappelijke inzichten. Omdat er vaak weinig zicht is op de manier waarop de algoritmes te werk gaan, blijft het echter oppassen geblazen – zeker als de hoeveelheid data die ze verwerken beperkt is.

Een Deense computerwetenschapper vertelde me onlangs over een onderzoeksgroep die trots verkondigde een zelflerend algoritme te hebben ontwikkeld dat autisme met 80 % zekerheid herkent aan het stemgeluid. Toen het werd toegepast op nieuwe groepen proefpersonen, daalde dat percentage naar iets meer dan 50. Wat bleek: de stemopnames van de aanvankelijke proefpersonen waren gedaan op een doorsneeschool en op een speciale school voor autistische kinderen. Die op de doorsneeschool bevatte achtergrondgeluiden, de school voor autisten stond midden in een doodstil bos. Het algoritme had de proefpersonen dus leren onderscheiden op basis van achtergrondruis: slim, maar met ‘autistische stemmen’ had dat niets te maken.

Gevoed met slechte data en in handen van charlatans leiden slimme algoritmes al helemaal tot gebakken lucht. Mijn kennis wilde de vertegenwoordigers de deur wijzen, maar zijn baas ging graag met ze in zee. Al was het algoritme op drijfzand gebaseerd en zou hij de helft van de leningen zelf moeten ophoesten, dan nog verwachtte hij dat deze reclamestunt hem voldoende extra klandizie zou bezorgen.

Sommige mensen kopen graag een dode mus.

 

Enith Vlooswijk,
wetenschapsjournalist