Recente ontwikkelingen uit het lab van David Baker tillen het veld van computationeel enzymontwerp (weer) naar een hoger niveau. Academisch gezien een sterke prestatie, maar hoe zit het met de toepasbaarheid? ‘Dit is echt een nieuwe fase.’ 

David Baker (University of Washington), kersverse Nobellaureaat in 2024, timmert al langer aan de weg als het gaat om enzymontwerp. In een recente paper in Science laten hij en zijn team zien hoe je met generatieve kunstmatige intelligentie geheel nieuwe enzymen kunt ontwerpen die de activiteit van natuurlijke enzymen benaderen. 

Ze baseerden hun enzymen op zeer goed bestudeerde serinehydrolases. ‘Wat bijzonder is aan dit werk is dat ze hebben gekeken naar een hele reeks elementaire stappen die tijdens de enzymatische reactie plaatsvinden’, zegt Gerard Roelfes, hoogleraar biomoleculaire chemie & katalyse aan de Rijksuniversiteit Groningen. ‘Tot dusver was de benadering om je alleen te richten op de snelheidsbepalende stap, maar het probleem is dat zo’n reactie via verschillende overgangstoestanden verloopt en dat het dus na een succesvol ontwerp van de snelheidsbepalende stap alsnog mis kan gaan. Daar schiet je dus niks mee op.’  

Enzymontwerp

Beeld: Roy Wolfs/Curve

In eerder werk was de beginactiviteit van Bakers ontworpen enzymen heel laag en was er enorm veel gestuurde evolutie nodig om een acceptabele activiteit te krijgen. ‘Door dat proces verandert ook het oorspronkelijke ontwerp’, vervolgt Roelfes. ‘Dat gaf aan dat het wel een goed startpunt was, maar in termen van ontwerpkwaliteit behoorlijk rudimentair.’ In dit werk is volgens Roelfes dus een grote conceptuele stap gezet door naar alle stappen in het katalytische proces te kijken. ‘Daarbij helpt het natuurlijk dat de algoritmes ook veel krachtiger en slimmer zijn geworden.’ 

From scratch 

Arnout Voet, hoofddocent Biochemie, Moleculaire en Structurele Biologie aan de KU Leuven, is ook onder de indruk van dit werk, maar wil toch een kanttekening plaatsen. ‘Hoe groot deze stap écht is, is moeilijk te zeggen’, legt hij uit. ‘Baker is een koploper in het veld en heeft een gigantisch en gevarieerd team tot zijn beschikking. Daarnaast is dit type onderzoek heel erg duur en gaat de budgetten van de meeste labo’s en kleine bedrijven te boven. Wel is dit iets dat compleet nieuw is en het staat dan ook terecht in Science, maar industrieel toepasbare enzymen zijn naar mijn idee nog niet voor morgen of overmorgen.’ 

Hoe heeft de Baker-groep dit nu precies klaargespeeld? Voet: ‘Ze hebben allereerst een algoritme geleerd hoe een katalytische reactie werkt wanneer er ook een substraat aanwezig is, waaronder de verschillende transition states die zo’n substraat doormaakt. Dat deden ze met een zogenoemd placer-model en die hebben ze gebruikt om de novo, dus from scratch, modellen te bouwen.’ 

Daarvoor heeft David Baker een AI-model ontwikkeld dat RFdiffusion heet. ‘Dit model heeft geleerd hoe een proteïne-backbone eruitziet’, vervolgt Voet. ‘Vergelijkbaar met hoe AI nu foto’s kan genereren, kan RFdiffusion dat met zulke backbones. Die worden in grote getale random aangemaakt, met de placer wordt daarna gekeken of er varianten tussen zitten die compatibel zijn met de transition states. Nu kunnen ze een volledig niet-natuurlijk eiwit genereren waarbij ze rekening houden met verschillende substraten die gehydrolyseerd kunnen worden.’ 

‘In de katalyse is Ångström-precisie niet genoeg’

Gerard Roelfes 

Verbeterpunten 

Toch blijft de failure rate hoog, merkt Voet op. ‘Je krijgt steeds maar een paar werkende proteïnes en die moet je vervolgens nog stapsgewijs verbeteren. Zelfs hun beste varianten blijven onder de prestaties van natuurlijke enzymen die deze hydrolysereactie uitvoeren.’ 

Ook Roelfes ziet nog verbeterpunten. ‘Chemische reactiviteit kent veel subtiliteiten. In de Baker-groep halen ze met hun eiwitontwerp tegenwoordig routinematig Ångström-precisie. Dat is heel knap, maar in de katalyse is dat niet goed genoeg: je moet op tienden Ångströms zitten, want minieme afstandsverschillen hebben grote consequenties.’ Een grote moeilijkheid daarin is het rekening houden met de dynamica, ofwel hoe het eiwit en het substraat in de enzympocket bewegen. ‘De Baker-groep doet een goede poging door de verschillende transition states mee te nemen, maar dat moet echt nog wel verder ontwikkeld worden. De behaalde katalytische efficiënties zijn indrukwekkend, maar nog steeds ver verwijderd van dat van natuurlijke hydrolases.’ 

Vastpinnen 

Een andere recente paper, die op het moment van schrijven nog op bioRxiv staat, komt van het team van David Bakers voormalige postdoc Gustav Oberdorfer en heeft net een andere insteek. ‘In Oberdorfers werk gooien ze de volgorde om’, zegt Roelfes. ‘Ze ontwerpen eerst een active site en daaromheen bouwen ze dan de eiwitstructuur die de active site ondersteunt. Daarbij nemen ze alvast wat conformationele vrijheid van het substraat mee.’ Dat is belangrijk, want je kunt het substraat in de computer wel vastpinnen, maar dat wil niet zeggen dat het zich in de praktijk precies zo gedraagt als in de simulatie.  

‘Oberdorfer deed zijn werk op retro-aldolases, een enzym dat een niet-natuurlijke reactie kan doen’, voegt Voet toe. ‘Dat soort enzymen was al ontwikkeld in het lab van Baker, maar omdat het bij lange na niet zo veel is bestudeerd als de hydrolases is er veel minder data beschikbaar. Dat maakt het moeilijker voor de AI om active sites te genereren omdat die niet gekend zijn.’ 

Idealiter zou je een combinatie van de onderzoeken van Oberdorfer en Baker moeten doen, aldus Voet. De AI-modellen van Baker moet je loslaten op heel veel data van niet-natuurlijke enzymatische reacties, waardoor je de perfecte backbone in elkaar kunt zetten. Het model moet dan kijken naar de active sites, of die in de backbone passen en heel veel computationele iteraties proberen. 

‘Dit kan leiden tot specifieke, complexere enzymreacties’

Arnout Voet 

Grotere rol 

Hoewel de papers het dus anders insteken, ziet Roelfes wel een vergelijkbaar uitgangspunt: ze focussen op reacties waarvan goed bekend is wat er nodig is in de active site. ‘De hydrolysereacties uit Bakers werk zijn enorm veel bestudeerd en in de beginjaren van enzymontwerp is er ook veel gekeken naar retro-aldolases. Dat geeft dus een vrij goed idee van hoe de active site eruit zou moeten zien.’ In beide gevallen ontwierpen de onderzoekers dus een nieuw enzym, maar wel voor een bekende reactie waar dus eigenlijk al een oplossing voor is. ‘Dus de grote vraag is nu: hoe maak je de stap naar écht nieuwe reacties waarvoor je minder informatie hebt over het enzymatische mechanisme?’ 

‘Ook al doen we het in mijn groep nog niet, ik erken wel dat computational design een steeds grotere rol gaat spelen’, zegt Roelfes. ‘Dus ik geloof dat we op een gegeven moment op een punt komen waarbij we op die manier echt rationeel enzymen kunnen ontwerpen voor specifieke reacties. Dit is echt een nieuwe fase, wat ze hier laten zien kun je niet zomaar even doen met wat basis chemische kennis.’ 

Niet eenvoudig 

Voet verwacht ook dat dit veld in de toekomst wel interessant gaat zijn voor de (bio)farmaceutische industrie. ‘Wanneer er meer data is gegenereerd van enzymen die verschillende reacties kunnen doen, kan de AI betere voorspellingen doen voor enzymontwerp. Uiteindelijk zou je dan enzymen kunnen maken die specifieke, complexere reacties kunnen katalyseren.’ 

In de academie kun je de methodes van Baker rechtstreeks gebruiken, maar de software is niet eenvoudig, aldus Voet. ‘Je moet wel ervaring hebben in de biochemie of anders in de computerwetenschappen. Eigenlijk heb je mensen nodig die dit beiden kunnen, dus mensen in de biochemie die dat combineren met AI gaan waarschijnlijk wereldwijd jobs aangeboden krijgen.’ Roelfes beaamt dat: ‘Mijn tip voor mensen die beginnen in de biokatalyse: verdiep je in dit soort methodes, bekwaam jezelf erin, want dit soort werk gaat een steeds grotere rol spelen.’  

 

Anna Lauko, Samuel Pellock, Kiera Sumida, et al., Computational design of serine hydrolases, Science (2025), doi:10.1126/science.adu2454

Markus Braun, Adrian Tripp, et al., Computational design of highly active de novo enzymes, bioRxiv (2024), doi:10.1101/2024.08.02.606416