De boom in kunstmatige intelligentie (artificial intelligence, AI) zal ook het (bio)chemisch onderzoek ingrijpend veranderen, als het aan de talloze initiatieven van de laatste jaren ligt. Maar hoeveel daarvan is hype en welke invalshoeken zijn het meest kansrijk?

De begintijd van AI

Zo’n dertig jaar geleden liepen bij Akzo Nobels vezelfabriek enkele ervaringsdeskundigen rond die precies konden inschatten welke procesparameters hoe ingesteld moesten worden om vezels met bepaalde eigenschappen te krijgen. De relatie was te ingewikkeld om deterministisch uit te rekenen. Het zat in de hoofden van de experts.

Omdat de afhankelijkheid van een klein aantal experts de fabricage kwetsbaar maakte, besloot Akzo een nieuwe technologie uit te proberen: neurale netwerken. In het platte vlak werkt dat ongeveer zo: start met honderd bekende x-y-paren, neem aan dat de relatie een polynoom is met bijvoorbeeld twintig factoren, begin met een willekeurig polynoom, pak het eerste x-y-paar, pas het polynoom aan zodat het x-y-paar past, pak het volgende x-y-paar en herhaal dit net zo lang tot alle x-y paren gedekt worden door het polynoom. Als de oorspronkelijke honderd paren representatief waren voor de totale dataset, heb je nu een polynoom dat bij een nieuwe x de y vindt, of in elk geval bij benadering.

’Start-ups en scale-ups denken vaak dat ze nog te weinig data hebben om dit soort methoden te gebruiken’

Sébastien Verhelst

In twee dimensies is dit voor een mens te volgen. Maar in meerdere dimensies, bijvoorbeeld vijf procesparameters en vijf producteigenschappen, lijkt het leerproces miraculeus. Vandaar de term ‘kunstmatige intelligentie’ of ‘machineleren’. Akzo’s opzet slaagde. De kennis van de experts, die de input-outputparen leverden om het neurale netwerk te trainen, belandde in de computer.

Begin jaren negentig van de vorige eeuw stonden tijdschriften vol met dit soort succesverhalen van kunstmatige intelligentie. Daarna werd het stil. Dat lag niet zozeer aan de algoritmes zelf, als wel aan dataopslag en rekenkracht. Hoe groter het aantal dimensies waarin je zoekt naar een passende functie, hoe groter de benodigde dataset en hoe meer rekenkracht nodig voor het trainen. De toename in computercapaciteit van de afgelopen tien jaar, zette de deur open naar kunstmatige intelligentie voor complexere problemen.

 

Grootste vooruitgang in AI volgens Forbes:

PDB_1nqh_EBI

PDB_1nqh_EBI

1. Het begrijpen van menselijke spraak in een gesprekscontext via Natural Language Programming (NLP)

2. Het steeds beter kunnen voorspellen van eiwitvouwing op basis van aminozuurvolgorde met deep learning

3. Het consistent winnen van complexe strategie-games; aanvankelijk schaak en go, nu ook Starcraft

4. Tesla’s zelflerende algoritmes voor autonoom rijden op basis van data van honderdduizenden auto’s met hun eigen ervaringen

 

AI voor start-ups

BlueChem, de Vlaamse incubator voor duurzame chemie, wilde algemene methoden ontwikkelen voor kunstmatige intelligentie in de (bio)chemie en sloot vorig jaar (2020) een overeenkomst met softwarebedrijf SAS. SAS stelt zijn AI-platform ter beschikking voor met name beginnende bedrijven binnen BlueChem.

powder-6075570_1280

Natriumbicarbonaat

‘Startups en scale-ups denken vaak dat ze nog te weinig data hebben om dit soort methoden te gebruiken’, vertelt analytics advisor Sébastien Verhelst van SAS. ‘Maar wij beschikken over technieken die ook met een beperkte dataset goede resultaten kunnen opleveren. Zo verwerven zij data-inzichten om sneller uit te groeien tot de chemische bedrijven van de toekomst.’

SAS brengt de kennis vanuit jarenlange ervaring in de procesindustrie, onder meer voor de rendementsverbetering van processen, kwaliteitscontrole en preventief onderhoud. Verhelst: ‘De engineering principles van een proces bevatten altijd een zekere variabiliteit in de output. Door de data intelligent te analyseren kunnen we niet eerder bekende relaties tussen input en out vinden. Die kennis is dan bruikbaar om de efficiëntie te verhogen.’

Een concreet voorbeeld van dat laatste is de productie van natriumcarbonaat. Dat proces is in de dikke eeuw van zijn bestaan al eindeloos geoptimaliseerd, maar door bij een grote fabrikant data van duizend sensoren te analyseren, slaagde SAS erin een model te bouwen dat iedere vier uur input levert aan de operators om de procesinstellingen bij te stellen.

 

Nieuw lab voor AI

In Nederland lanceerden de TU Delft en DSM begin 2021 het AI for Biosciences (AI4B.io) lab, als onderdeel van het bredere AI-initiatief ICAI (zie ‘AI buiten de moleculaire wetenschappen’). ‘We gaan redelijk fundamenteel onderzoek doen, van de nanoschaal tot complete fabriekslijnen’, vertelt wetenschappelijk directeur Marcel Reinders van het lab. ‘In eerste instantie gaat het steeds om patronen te ontdekken in grote hoeveelheden data. Op basis daarvan kun je vervolgens gerichter data verzamelen.’

Op grote schaal speelt het optimaliseren van processen in een vat. Reinders: ‘Die kun je doorrekenen met modellen uit de stromingsleer, maar numerieke analyse is kostbaar in tijd. Dan verzamel je data en krijg je twee maanden later te horen dat de temperatuur iets hoger had gemoeten. Je kunt die modellen ook gebruiken om data te genereren waarmee je een neuraal netwerk traint. Die training zelf kost veel tijd, maar als het eenmaal gebeurd is, kun je real-time analyses krijgen op daadwerkelijke procesdata.’

Met optimaliseren op procesniveau in een vat ben je er overigens niet. Want een fabriek koppelt vaak meerdere processen en het is niet gezegd dat de som optimaal is als de individuele delen dat zijn. ‘We hebben ons een beetje moeten beperken’, glimlacht Reinders. ‘Want we hadden natuurlijk ook nog optimalisatie in de gebruiksketen van chemische producten kunnen meenemen.’

 

AI in afvalstromen

AI zorgt voor ongekende mogelijkheden, maar het kan geen kwaad ook te denken aan eventuele beperkingen. Dat ondervond BioBTX, een producent van duurzame aromaten uit afvalstromen zoals laagwaardige kunststoffen, glycerol en afgewerkte (frituur)olie. Omdat de input van het proces zo fluctueert, onderzocht BioBTX samen met de Rijksuniversiteit Groningen of kunstmatige intelligentie zou kunnen helpen uit de ruwe samenstelling van het afval de optimale procescondities te destilleren.

‘We wilden graag de relatie weten tussen inputstroom en procescondities enerzijds, en eindproducten anderzijds’ , vertelt procestechnoloog Matthijs van Akker van BioBTX. ‘Dus de hoeveelheden benzeen, tolueen en xyleen, maar ook eventuele andere restproducten waar we wat mee kunnen. Daar hebben we kunstmatige intelligentie op losgelaten. Binnen bepaalde marges bleek dat goed te werken, maar daarbuiten volstrekt niet.’

Anders gezegd: de patroonherkenning kon vrij aardig interpoleren, maar niet extrapoleren. Van Akker: ‘Misschien hadden we dat kunnen verhelpen door nog meer data te verzamelen, maar dat zou weinig zinvol zijn. Dan heb je op een gegeven moment zoveel data verzameld dat je eigenlijk al weet wat je wilt weten. Het heeft ons dus niet gebracht wat we hoopten, maar we hebben er wel veel van geleerd en zien potentie voor toekomstige vraagstukken.’

Het is een belangrijke waarschuwing voor wie met kunstmatige intelligentie aan de slag gaat. Ja, je kunt onvermoede patronen uit je data halen, maar dan moet die wel representatief zijn en niet al te wild fluctueren. Want ook computers kunnen zo overvoerd raken met gegevens dat ze het spoor even volledig bijster raken.

potatos-723335_1920

 

Samenwerkingen, initiatieven en coalities

De belangstelling voor kunstmatige intelligentie in de chemie staat uiteraard niet op zichzelf. De technologie is hot, en inzet ervan wordt op alle fronten gestimuleerd. Partijen zoeken aansluiting bij elkaar en samenwerkingen schieten als paddenstoelen uit de grond. Niemand wil de boot missen, ook niet als hij de bestemming maar vaag voor ogen heeft.

AINed, een coalitie van bedrijfsleven en onderzoeksinstituten, stelde in 2018 een agenda op voor kunstmatige intelligentie, met als waarschuwing dat Nederland haast moest maken, want er zou sprake zijn van een ‘winner takes all’ scenario: wie achterblijft, zal zien dat bedrijven hun onderzoek en innovatie naar het buitenland verplaatsen. Het rapport ‘AI voor Nederland’, waaraan ook de VNCI meewerkte, riep onder meer op om het onderwijs op orde brengen, talent te werven in het buitenland, innovatiesubsidies in het leven te roepen en te werken aan de inrichting van een onderzoekscentrum dat tot de wereldtop behoort.

AI4Belgium

Met een vergelijkbare filosofie ging twee jaar geleden AI4Belgium van start, een initiatief van technologiefederatie Agoria en de federale overheid met als ambitie om België te positioneren als hét Europese onderzoekscentrum voor kunstmatige intelligentie. Sindsdien schaarden zich daar tientallen initiatieven onder, variërend van de opsporing van online racisme tot ondersteunend onderzoek bij de ontwikkeling van een coronavaccin. In maart kwam daar FARI bij, een samenwerkingsverband van bedrijfsleven en twee Brusselse universiteiten, dat zich wil richten op de maatschappelijke inbedding van kunstmatige intelligentie.

CLAIRE

Zowel Brussel als Den Haag kent een vestiging van Claire, een pan-Europees initiatief dat zich richt op de ontwikkeling van AI-instrumenten. Claire kent tien ‘adviesgroepen’ die zich op specifieke onderdelen richten, die voor de (bio)chemie niet allemaal in gelijke mate relevant zijn. Voor optimalisatietechnieken geldt dat duidelijk wel, voor verwerking van natuurlijke taal minder. Er is ook veel aandacht voor de ethische, juridische en sociale aspecten van de toepassing van kunstmatige intelligentie.

ICAI

Het internationale netwerk van Claire overlapt logischerwijs met nationale initiatieven als AI4Belgium en ICAI (Innovation Center for Artificial Intelligence) in Nederland. Onder AI hangen ruim dertig labs die zich op specifieke bedrijfstakken richten, variërend van detailhandel en politie tot mobiliteit en voeding. ‘Een van de redenen voor DSM en TU Delft om zich bij dit netwerk aan te sluiten is dat je zo ook toegang krijgt tot kennis uit andere sectoren’, zegt wetenschappelijk directeur Marcel Reinders van het AI for Biosciences lab.

Daarmee is het veld nog lang niet compleet, want de initiatieven buitelen over elkaar heen, zoals dat eigenlijk gaat met alle IT-innovaties. Het begint met een gezamenlijke inspanning om de algemene instrumenten te scheppen. Daarna wordt het een integraal onderdeel van de afzonderlijke bedrijfstakken. Vandaag de dag denkt niemand meer dat er een nationaal onderzoeksprogramma zou moeten bestaan om bedrijven optimaal te laten profiteren van internet.