Nanoporie-apparatuur heeft een plek veroverd in het lab, naast gevestigde sequence-technologie. Voor sommige onderzoeksvragen is het zelfs een eerste keuze geworden. Ondertussen kijken onderzoekers of porietechnologie zich leent voor het ontrafelen van eiwitten.

‘Het idee is dat we komend voorjaar, als de tulpen in bloei staan, een eerste versie van het genoom kunnen presenteren. Het gaat om een bizarre hoeveelheid DNA. De tulp telt twaalf chromosomen en elk chromosoom is net zo groot als een compleet humaan genoom.’ Nanoporie-sequencen is voor veel onderzoekers nog een experimentele technologie, maar voor Hans Jansen van Future Genomics Technologies is het een eerste keuze geworden. Zijn bedrijf, op het Leidse Science Park, heeft de techniek al gebruikt om het genoom van gist en paling uit te lezen. Future Genomics sequencet vooral voor andere onderzoeksgroepen. Onlangs is Jansens bedrijf gecertificeerd door Oxford Nanopore, de leverancier van MinION en GridION apparatuur.

 

Lange reads

Het genoom van de tulp: daar lopen de meeste onderzoekers liever met een boog omheen. Het erfelijk materiaal van Tulipa gesneriana is net als bij veel andere planten en bomen erg groot en complex. Zo telt bijvoorbeeld het genoom van Amerikaanse Loblolly-den – in omvang de huidige genoom recordkaart – 22 miljard basenparen, zevenmaal zo veel als de mens, waarvan 80 % in repeterende sequenties zit. De tulp zal daar met 35 miljard basenparen vermoedelijk niet voor onder doen.

Een grote kweker en veredelaar, Dümmen Orange uit De Lier, steunt het project en heeft een oranje cultivar aangedragen om de komende maanden te sequencen. Het uitlezen van zo’n mega-genoom is op zich het probleem niet: het maakt voor een sequence-apparaat niet uit van welk organisme het DNA afkomstig is. De uitdaging zit in silico: computersoftware moet miljoenen DNA-fragmenten uit de database op volgorde aan elkaar zien te passen, zonder fouten te maken of stukken over te houden. Doordat zulke plantengenomen vol zitten met herhalingen lijken veel fragmenten ook nog eens sterk op elkaar.

En daar biedt nanoporie-sequencen om te beginnen een groot voordeel, omdat het DNA-fragmenten (reads) oplevert van 10.000 à 20.000 basen. De techniek levert dus langere letterreeksen dan klassieke shotgun-technologie, die stukjes van 150 tot 300 basen produceert. Daarmee puzzelen is te vergelijken met het aan elkaar plakken van een krantenpagina die in 1.000 of in 10 stukken is geknipt; het laatste is gewoon makkelijker.

Maar zodra je een tulp gaat sequencen is de omvang van de puzzel weer zo enorm dat gangbare software heel veel tijd nodig heeft, zegt Jansen. ‘De computer moet een read vergelijken met elke andere read in de database. Met een genoom van drie miljard basen is dat nog wel te doen, maar de tulp is tien keer zo groot. Het betekent dat je honderd keer meer vergelijkingen moet maken en dat levert maanden extra rekenwerk. Het is niet meer te doen.’

De Leidse bioinformaticus Christiaan Henkel heeft die rekentaak vereenvoudigd, zegt Jansen. Door minder vergelijkingen te maken en foutcorrecties op een ander moment uit te voeren, kan het puzzelen efficiënter verlopen. ‘Bij het palinggenoom hebben we dat uitgeprobeerd. Met oude software zou het op meerdere computers twee weken hebben geduurd, nu kan het met een pc binnen een dag. Dat is echt een groot voordeel. Zonder deze software zou het samenstellen van een tulpgenoom ondoenlijk zijn.’

 

‘Zonder deze software zou het samenstellen van een tulpgenoom ondoenlijk zijn’

Dat computers stevig moeten malen op data van nanoporie-sequencen zit voor een deel in correctie van fouten. Daaruit spreekt een nadeel van nanoporie-technologie: de sequentie bevat 4 à 8 % fouten en daarom moet het genoom tientallen keren worden uitgelezen, om te bevestigen dat ACG inderdaad ACG is en geen ACT. Voor shotgun-technologie ligt het foutpercentage lager dan 0,1 %.

Bij nanoporie-sequencen wordt enkelstrengs DNA door een nauwe eiwit-porie getrokken, met een tempo van 450 basen per seconde. Basen verschillen van vorm en beïnvloeden de ionenstroom die door de membraan loopt. Het patroon in het hobbelige elektrische meetsignaal wordt omgezet in een DNA-letterreeks, maar soms wordt een verkeerde letter toegewezen.

Janssen: ‘Meerdere basen bepalen het elektrische signaal. Het belangrijkst zijn de drie basen in de porie, maar er is ook invloed van basen eromheen. Een neuraal netwerk herkent en vertaalt die fluctuaties in een DNA-volgorde. In de ontwikkeling van neurale software door bijvoorbeeld Google worden enorme stappen gemaakt, en die kennis sijpelt geleidelijk door naar het nanoporie-sequencen. De nauwkeurigheid van de nanoporie-data verbetert dus nog steeds.’

 

Heranalyse

Nu meer genomen met nanoporie-technologie worden uitgelezen is het mogelijk om een vergelijking te maken met oudere versies van genoomkaarten, die met shotgun-sequencen zijn ontrafeld, zoals de paling (Scientific Reports 7: 7213). Het zijn geen enorme verschillen, maar in de oude kaart van de paling zitten fouten, zegt Jansen. ‘We hebben beide kaarten vergeleken en de verschillen zijn terug te voeren op fouten in hoe de eerste kaart is samengesteld. Er zitten stukken DNA aan elkaar geknoopt, die in het echt niet aan elkaar zitten. De sequence-data was beschikbaar, maar de software had niet de juiste oplossing gekozen.’

Microbioloog Arthur Gorter de Vries, promovendus bij de sectie Industriële Microbiologie van de TU Delft, ontdekte veel grotere verschillen bij de relatief veel beter onderzochte bakkersgist Saccharomyces cerevisiae. Samen met de Delftse bio-informaticus Alex Salazar besloot het DNA van een veelgebruikte giststam (CEN.PK113-7D) met nanoporie-technologie nogmaals uit lezen. De kaart die ze daarmee in elkaar puzzelden, is maar liefst 770.000 basen groter dan de vorige versie en telt 248 extra gen-annotaties (FEMS Yeast Research 17: fox074). Op een klein genoom van zo’n 12 miljoen basenparen is dat een flinke aanvulling.

Veel van deze nieuw beschreven genen liggen op de uiteinden van de chromosomen, en spelen een rol in hoe de gist reageert op veranderingen in de omgeving. Bovendien liggen ze geregeld in instabiele delen van het genoom, die makkelijker kunnen muteren. Die evolutionaire flexibiliteit helpt gist in te spelen op nieuwe omstandigheden. De nieuwe genoomkaart is kortom interessant voor onderzoekers en bedrijven die gist beter willen begrijpen. Niet voor niets doet Gorter de Vries een deel van zijn promotieonderzoek in samenwerking met bierproducent Heineken.

Zo’n her-analyse van een genoomkaart die allerlei blinde vlekken invult, illustreert volgens Gorter de Vries de kracht van nanoporie-sequencen. ‘Met nanoporie-technologie kun je makkelijk lengtes halen van rond de 20.000 basen. Dat is een groot voordeel als je achteraf een genoomkaart moet samenstellen.’

 

Betrouwbare kaart

Volgens Gorter de Vries zijn onderzoekers nu in staat een betrouwbare kaart te bouwen zonder voorafgaande kennis of een referentiegenoom. Vooral voor microben is dat al interessant; het sequencen van relatief kleine genomen zoals van gist kost nog maar € 200.

Gorter de Vries gebruikt de technologie om de genetica van bierbrouwgist (Saccharomyces pastorianus) beter te begrijpen. Bierbrouwgist doet het goed bij de lage temperaturen van de pilsbrouwerij. Het is soort die is ontstaan in Duitsland in de zestiende eeuw en blijkt een hybride van bakkersgist en een wilde gistsoort: Saccharomyces eubayanus. Gorter de Vries: ‘Bierbrouwgist heeft dus een complex genoom met veel diversiteit, waarin DNA van beide soorten aanwezig is. Om dat beter te begrijpen is vanwege het hybride karakter van deze gist de nanoporie-technologie ideaal. We kunnen nu biergist-stammen uit verschillende streken onderzoeken en zien hoe dit gistgenoom zich heeft aangepast aan gebruik door de mens.’

In theorie kan nanoporie-sequencen miljoenen basen achtereen en zelfs chromosomen van kop tot staart aflezen, maar toch is dat niet het belangrijkste doel, stelt Gorter de Vries. ‘Heel af en toe vinden we reads met de lengte van een half chromosoom. Dat is een uitzondering, want als je DNA uit de cel haalt en opzuivert, ontstaan altijd breuken. Bovendien is het zo dat bij lang DNA de kans groot is dat de streng niet in zijn geheel door de porie past. Bijvoorbeeld doordat er vouwen in de sequentie zitten. Daarom wordt het DNA vooraf in kleinere stukken van gemiddeld 10.000 à 20.000 basen gebroken, het formaat dat we optimaal kunnen meten. Het zou kunnen dat als de technologie zich verder ontwikkelt, die gemiddelde lengte groter wordt.’

Gorter de Vries denkt niet dat nanoporie-technologie shotgun-sequencen helemaal overbodig zal maken. Nanoporiën hebben namelijk soms moeite met bepaalde basevolgorden. ‘Bijvoorbeeld plekken waar vijftien A’s achter elkaar staan. Dat levert een moeilijk te interpreteren signaal, waardoor je het aantal nucleotiden niet exact kunt bepalen. Daarom maken we nog steeds gebruik van shotgun-sequencing, om dergelijke stukken in het genoom te corrigeren.’

 

‘Nanoporie-technologie is ideaal voor gisten met een hybride karakter’

Hoewel de huidige technologie zich praktisch bewijst, wordt er in het fundamentele onderzoek gewerkt aan nieuwe membranen en poriën. Het doel daarbij is meer betrouwbare informatie, lagere foutpercentages, en het toepassen van porietechnologie op andere moleculen dan DNA, zoals eiwitten, zegt Grégory Schneider, werkzaam bij het Leiden Institute of Chemistry.

Zijn groep is vooral geïnteresseerd in het gebruik van grafeen als materiaal om biomoleculen doorheen te leiden en te meten. Grafeen is zeer dun, geleidend en die eigenschappen kunnen gebruikt worden om elke base in een DNA-streng afzonderlijk te detecteren. Het grafeen dient dan als nanogap: een ultradunne elektrode die aan een stroompje door het biomolecuul kan ‘voelen’ welke DNA-letter er passeert. Het meten van deze tunneling-stroompjes levert hopelijk een nauwkeuriger beeld van de chemische samenstelling.

Tot dusver hebben verschillende onderzoeksgroepen DNA door een grafeenporie geleid, maar het beschrijven van de nucleotidevolgorde is nog niet gelukt. Schneider: ‘Het grootste obstakel is ionische ruis in de nanoporie. Wij onderzoeken of we die ruis met chemische stabilisatie van het grafeen-membraan kunnen terugdringen.’

 

Eiwitten

Schneider heeft ook een Vidi-subsidie ontvangen voor het ontwikkelen van porietechnologie voor real-time eiwit-sequencen met nanoporiën en grafeen nanogaps. Op dat vlak liggen de grootste uitdagingen. DNA is een redelijk uniform molecuul dat zich voorspelbaar gedraagt, maar eiwitten zijn gevouwen en ‘plakkerig’ door de twintig verschillende aminozuren met uiteenlopende ladingen en hydrofobe eigenschappen waar het uit bestaat. Zie dat maar eens netjes ontvouwen, zonder te kleven door een nanoporie te krijgen. Schneider wil dit gaan tackelen door op nanoschaal SDS-PAGE na te bootsen, om vervolgens het eiwit door een grafeenporie te leiden. ‘De grootste uitdaging daarbij is het ontwerp van de porie en het uitlijnen met de grafeen-elektrodes.’