Met een impliciet scoringsmodel kun je de intuïtieve keuzes van chemici ‘vangen’, schrijven onderzoekers van Novartis en Microsoft in Nature Communications. Dit kan het selectieproces van kandidaat-medicijnen veel efficiënter maken.
In de chemie zijn veel zaken vanuit een rationele aanpak te benaderen. Er is theoretische onderbouwing, er zijn tal van uitvoerig getoetste wetmatigheden en er is een schat aan literatuur en experimentele data beschikbaar. Maar toch kun je op basis daarvan niet alle keuzes die chemici op dagelijkse basis maken volledig verklaren. Opgedane ervaring, vaak verwoord als ‘intuïtie’, speelt ook een grote rol.
Formaliseren
Die intuïtie is moeilijk expliciet te maken, maar toch is dat precies wat onderzoekers van Novartis en Microsoft voor ogen hadden. Want als je onderliggende patronen kunt identificeren, kun je die ‘verborgen’ kennis formaliseren en gebruiken voor nieuwe, voorspellende machine learning technieken waarmee je het selectie- en optimalisatieproces van nieuwe drug leads efficiënter kunt maken.
Om uit te vogelen of er patronen ten grondslag liggen aan die ongrijpbare intuïtie, kregen 35 ervaren chemici van Novartis in meerdere ronden goed geannoteerde molecuulstructuren voorgelegd waarbij ze steeds uit sets van twee de beste kandidaat voor verdere lead optimization moesten kiezen.
Hun keuzes vormden de input voor het trainen van een zogeheten impliciet scoringsmodel, dat alle feedback van de chemici, gecombineerd met de andere bekende parameters, gebruikt om van nieuwe, nog niet onderzochte, moleculen te voorspellen of het geschikte kandidaat-geneesmiddelen zijn. Wat blijkt: de intuïtie is te vangen. De voorspellingen van het getrainde model zijn consistent en goed te correleren met keuzes die nu door chemici op basis van parameters zoals QED, quantitative estimate of drug-likeness, synthese-gemak en oplosbaarheid, al dan niet bewust worden gemaakt.
Vage parameters
Het scoringsmodel biedt daarmee volgens het Novartis-Microsoft team een zinvolle aanvulling op het handmatige scoren van kandidaat-moleculen, waardoor het lead optimization proces veel efficiënter kan verlopen. ‘Dit is een heel leuke en nuttige paper’, zegt Gerard van Westen, hoogleraar kunstmatige intelligentie en farmacochemie aan de Universiteit Leiden. ‘Ze laten zien dat de gezochte chemische intuïtie daadwerkelijk te vangen is en dat er een correlatie is met oude, vage parameters als QED. De centrale vraag bij het ontwikkelen van geneesmiddelen is wat een molecuul tot een medicijn maakt. Bij het beantwoorden van die vraag kan deze tool zeker helpen.’
Deze resultaten laten volgens Van Westen ook zien dat deze machine learning methoden steeds beter worden. ‘Wij hebben in 2006 eens een studie gedaan om de manier waarop chemici moleculen een score geven te reproduceren in een computational model, maar dat lukte toen niet. De technieken zijn nu dus zo goed, dat het wel kan.’
Wat hem ook aanspreekt is dat het model beschikbaar is voor anderen. Best bijzonder aangezien een farmagigant als Novartis een van de ontwikkelaars is. ‘Nou, nee hoor’, reageert Van Westen. ‘Van de Big Pharma is Novartis een van de meest benaderbare bedrijven op dit vlak.’ Als het dus voor iedereen beschikbaar is, zou het dan niet heel interessant zijn om te zien of het model ook de intuïtie van bijvoorbeeld chemici bij andere farma-bedrijven weet te vangen? Van Westen: ‘Ik denk eigenlijk dat dat niet veel zou verschillen. Ik zou liever een vergelijking zien met de keuzes die academisch chemici maken, daar ben ik veel nieuwsgieriger naar.’
Nog geen opmerkingen