Het heeft onderzoekers tientallen jaren gekost om de structuur van slechts 17 procent van de eiwitten in het menselijk lichaam in kaart te brengen. Nu is kunstmatige intelligentie (AI) er in minder dan een jaar in geslaagd om dat cijfer op te krikken naar 98,5 procent. De nieuwe informatie kan helpen bij de ontwikkeling van nieuwe geneesmiddelen.
Het bepalen van de complexe, verfrommelde vorm van eiwitten is een enorme wetenschappelijke uitdaging gebleken. Eiwitten zijn opgebouwd uit aminozuren, dus om de vorm van een eiwit vast te stellen, moet je bepalen in welke volgorde de aminozuren voorkomen. Sommige aminozuren worden aangetrokken door andere, andere worden afgestoten door water. Daardoor krijgen hun ketens ingewikkelde vormen die moeilijk in detail zijn te berekenen.
Toch is het de moeite waard om deze lastige klus te klaren. Inzicht in eiwitstructuren maakt het namelijk mogelijk om nieuwe, heel gerichte geneesmiddelen te ontwerpen die zich binden aan specifieke eiwitdelen.
Genetisch onderzoek biedt al lang de mogelijkheid om de volgorde van een eiwit te bepalen. Een efficiënte manier om de vórm te vinden, was er echter nog niet. De klus uitbesteden aan supercomputers heeft geen noemenswaardige vooruitgang opgeleverd.
Vorig jaar publiceerde het Britse AI-bedrijf DeepMind bewijs dat AI het probleem kan oplossen. DeepMind trainde een neuraal netwerk, AlphaFold, met delen van eerder opgeloste eiwitvormen. De AI leerde met behulp van 32 afzonderlijke algoritmes de vorm van eiwitten te bepalen. Dat trucje wist hij vervolgens ook toe te passen op nieuwe, nog onopgeloste eiwitstukken. De onderzoekers controleerden het werk van DeepMind aan de hand van experimentele gegevens.
Sindsdien heeft het bedrijf de technologie toegepast op duizenden eiwitten. Het begon met de menselijke verzameling eiwitten, eiwitten die relevant zijn voor covid-19 en andere eiwitten die veel impact hebben. DeepMind geeft hun resultaten nu vrij in een database die is opgezet in samenwerking met het Europees Laboratorium voor Moleculaire Biologie.
Mens en twintig andere
DeepMind heeft de structuur in kaart gebracht van 98,5 procent van de ongeveer 20.000 eiwitten in het menselijk lichaam. Voor 35,7 procent daarvan gaf het algoritme aan dat het meer dan 90 procent nauwkeurigheid bereikte bij het voorspellen van de vorm.
De resterende 1,5 procent van de menselijke eiwitverzameling waarvoor geen structuur is gepubliceerd, waren eiwitten met aminozuurreeksen van meer dan 2700 delen. Die zijn voorlopig buiten beschouwing gelaten om de rekentijd in te korten.
In totaal gaf het bedrijf meer dan 350.000 eiwitstructuren vrij, waaronder de eiwitten van twintig andere organismen die veel worden gebruikt in biologisch onderzoek, van E. coli tot gist. Het team hoopt binnen enkele maanden bijna elk eiwit dat de wetenschap kent toe te voegen. Dat zijn meer dan 100 miljoen structuren.
Revolutionair
Bioloog John Moult van de Universiteit van Maryland noemt de rol die AI kan spelen bij eiwitonderzoek een ‘grote verrassing’. ‘Het is revolutionair op een manier die moeilijk te bevatten is’, zegt hij. ‘Als je werkt aan een zeldzame ziekte waarvan de structuur onbekend was, dan kun je die informatie nu bekijken. Voorheen was die heel moeilijk of zelfs onmogelijk te verkrijgen.’
Demis Hassabis, oprichter van DeepMind, zegt dat AlphaFold – dat vrij beschikbaar is gemaakt – eiwitvormen oplost in minuten of, in sommige gevallen, seconden. Daarvoor gebruikt het neurale netwerk hardware die niet geavanceerder is dan een standaard videokaart.
‘Het kost één grafische processor een paar minuten om één eiwit te vouwen. Dat had jaren van experimenteel werk gekost’, zegt hij. ‘We maken deze schat aan gegevens gewoon beschikbaar. Het is in zekere zin verbazingwekkend: van het moment dat we een systeem hadden gemaakt dat hiertoe in staat is tot het daadwerkelijk produceren van alle gegevens, is slechts een kwestie geweest van maanden. We hopen dat het een soort standaardgereedschap wordt dat alle biologen over de hele wereld gebruiken.’
Betrouwbaarheidsscore
Het team voegde ook een betrouwbaarheidswaarde toe aan alle structuurvoorspellingen. Volgens Hassabis is deze informatie van vitaal belang, aangezien de resultaten de basis zullen vormen voor onderzoek.
Hassabis denkt dat een deel van de eiwitten waarvoor de betrouwbaarheidswaarde laag is, mogelijk te wijten is aan fouten in de volgorde, of misschien aan ‘iets intrinsieks in de biologie’. Eiwitten kunnen bijvoorbeeld van nature ongeordend of onvoorspelbaar zijn.