Extrapolatie uit duizenden voorbeelden is goed genoeg voor veel toepassingen

Chemici zetten kunstmatige intelligentie op dit moment vooral in voor geavan­ceerde simulaties van reacties en processen. In het verschiet liggen echter ook methodes voor productontwerp.

Toen Jean Van Damme in 2006 afstudeerde op de chemische analyse van Hagelandse wijnen, had hij al het gevoel dat er meer uit de verzamelde data moest zijn te halen. Hij had een verband gevonden tussen de chromatografische resultaten en het smaakoordeel van een proefpanel, maar daarmee was het beeld niet compleet.

Enkele jaren later, in dienst bij retailer Colruyt, vond hij de ontbrekende schakel. ‘Colruyt kende het verband tussen wijnen en de voorkeur van individuele consumenten’, vertelt Van Damme. ‘Maar het verband met smaak kenden ze dan weer niet. Mijn idee was om de chemie, de uitkomsten van het panel en de consumenteninformatie te combineren. Dan kun je wijnbouwers en retailers vooraf vertellen welke wijnen de beste slaagkans hebben bij welke consumenten.’

Inmiddels heeft Ester.ai, het bedrijf dat Van Damme oprichtte om dit idee te verwezenlijken, vestigingen in Leuven en New York. Ester.ai gebruikt kunstmatige intelligentie (KI) om patronen te vinden in de relatie tussen zo’n 250 chemische componenten van bier en wijn, de smaakbeleving ervan en de kansen op de markt.

‘Neurale netwerken zijn absoluut niet intelligent’

‘Het zijn gecompliceerde relaties’, zegt Van Damme. ‘Bij de esters bijvoorbeeld, gaat het niet alleen om de aanwezigheid ervan, maar ook om de onderlinge verhoudingen. Sommige van die 250 componenten zijn misschien helemaal niet relevant voor de smaakbeleving. Die hopen we ook te achterhalen, want dan kun je met een beperktere analyse volstaan. Verder zijn er componenten die leiden tot zogeheten smaakfouten. Het panel geeft dan aan dat de wijn niet lekker is, maar waarom? Wij hebben in één geval een storende component gevonden die uiteindelijk herleidbaar was tot de reiniging van leidingen.’

Urinestaal

De diensten van Ester.ai zijn een concreet voorbeeld van KI in de chemische praktijk. Het bedrijf is ongetwijfeld een voorbode van een grotere golf, want wereldwijd zoemt het in de onderzoekslaboratoria. Neem alleen al de chromatografische analyse, waaraan ook Van Damme werkt.

‘Wanneer je een urinesample van een wielrenner hebt, bevat die soms wel duizend verschillende moleculen’, vertelt Bernd Ensing, werkzaam bij de groep computational chemistry aan de Universiteit van Amsterdam. ‘Dat leidt tot spectra met heel veel piekjes, die je moet analyseren. Het is heel goed mogelijk een computer zo te trainen dat hij die piekjes herkent, ook de heel kleine die een mens misschien over het hoofd ziet.’

Ensing refereert aan de klasse van KI-methodes die het verband leert tussen gewenste input en output, bekend als machine learning of neurale netwerken. Dit zijn in zichzelf eenvoudige algoritmes, die echter in complexe netwerken duizenden of zelfs miljoenen keren tegelijkertijd worden toegepast. Zo leggen ze een (statistisch) verband tussen invoer en uitvoer. Daarna zijn ze in staat bij een gegeven invoer de uitvoer te voorspellen.

‘De tijdwinst is een factor 1.000 tot 100.000’

Twee gangbare types problemen om met neurale netwerken aan te pakken, zijn classificatie en extrapolatie. Piekjes in een grafiek relateren aan bepaalde moleculen is een vorm van classificatie. Bij extrapolatie gaat het bijvoorbeeld om het voorspellen/simuleren van de eigenschappen van een nieuwe katalysator gegeven de ervaringen met verwante stoffen.

Factor 100.000

Ivo Filot houdt zich aan de Technische Universiteit Eindhoven bezig met multiscale modelling, vooral van de Fischer-Tropsch-reactie, die CO en H2 omzet in koolwaterstoffen. ‘Om die complexe reactie te begrijpen, begin je op de nanoschaal’, vertelt Filot. ‘In het tijdsbestek van minder dan een nanoseconde speelt zich een kwantumproces af op het oppervlak van de katalysator. De katalysator bevindt zich op een supportdeeltje en daarvan bevinden zich er weer een heleboel in een reactor met een doorsnee van enkele meters.’

Simulaties op ieder van die tijd- en ruimteschalen duren gerust dagen tot weken. Het gevolg is dat de schalen niet aan elkaar te koppelen vallen. Als je het model op nanosecondeschaal inbouwt in het model op microsecondeschaal, ben je duizend keer enkele weken bezig. Een neuraal netwerk dat getraind is op nanosecondeschaal doet de berekening in enkele seconden. Dan is inbouwen in het microsecondemodel ineens wel mogelijk.

‘We verleggen in zekere zin het rekenwerk’, legt Filot uit. ‘We hebben heel veel tijd geïnvesteerd om de supercomputer Cartesius een dataset te laten genereren om het neurale netwerk mee te trainen. Nu hoeven we die berekeningen echter nooit meer te doen. Bovendien hebben we een model dat we kunnen delen met collega’s. Uiteindelijk is de tijdwinst een factor 1.000 tot 100.000.’

Uiteraard levert het neurale netwerk geen exacte uitkomst van de Schrödingervergelijkingen die de nanoschaal dicteren. Maar de extrapolatie uit duizenden voorbeelden is goed genoeg voor veel toepassingen. Zeker als je zonder die benadering met lege handen zou staan.

‘Reverse-engineeren van bier of wijn kunnen we nog niet’

Een andere vorm van extrapolatie is de analyse van trajecten, zoals de vorming van polymeerketens of het vouwen van eiwitten. Deep Mind, een dochterbedrijf van Google, heeft met AlphaFold een systeem gebouwd dat gegeven een willekeurig eiwit voorspelt hoe het zich zal vouwen. Dat is op zich al mooi, en het opent direct weer nieuwe mogelijkheden. Ensing: ‘Soms gaat het mis bij het vouwen. Kun je kunstmatige intelligentie inzetten om dat soort missers te herkennen of te voorspellen, bijvoorbeeld om te achterhalen hoe ziektes zoals alzheimer of kanker ontstaan?’

Het gros van de huidige toepassingen zet stappen van bestaande theorie naar gewenste praktijk, omdat dit aansluit bij de huidige manier van productontwikkeling, dus ook van de manier van datacollectie. Je kunt KI echter ook de andere kant op laten redeneren: gegeven bepaalde product­eisen, hoe kom je tot een efficiënt productieproces?

In het geval van Ester.ai zou zich dat bijvoorbeeld vertalen in de vraag: er is een gat in de wijnmarkt, welke chemische componenten moeten er in de wijn zitten om die te bedienen? ‘Reverse-engineeren van bier of wijn kunnen we nog niet’, zegt Van Damme, die daaraan toevoegt teveel van ambachtelijke productie te houden om uit te willen zoeken welke additieven welke effecten zouden geven.

Menselijke intuïtie ligt ten grondslag aan een juiste zoekopdracht

Whisky

Er zijn echter minder ingrijpende voorbeelden te bedenken. Het blenden (mengen) van whisky’s rust nu op de intuïtie van experts, maar KI zou allicht beter de juiste verhoudingen kunnen vinden om een bepaald effect te bereiken. Dit soort toepassingen is overigens niet nieuw. Akzo­Nobel zette vijfentwintig jaar geleden al neurale netwerken in om bij gewenste vezeleigenschappen de optimale procesinstellingen uit te rekenen. De wiskunde achter KI is in die periode niet fundamenteel veranderd. Het verschil zit in de explosie van rekenkracht, waardoor de toepassingsschaal veel groter kan zijn.

De bottomline is dat kunstmatige intelligentie vrijwel altijd patronen kan vinden in grote datasets. Daaraan vooraf gaat echter wel een menselijke intuïtie om de juiste zoekopdracht te geven en het resultaat kritisch te beschouwen.

‘Neurale netwerken zijn absoluut niet intelligent’, waarschuwt Filot. ‘Ze richten zich op de details die je aangeeft en negeren de rest. Wij ondervonden bij het trainen op optimalisatie van reactiesnelheid dat het systeem de wet van behoud van massa negeerde, omdat we die niet expliciet als beperking hadden opgegeven. Je hebt altijd een expert in het veld nodig om de resultaten te duiden.’