Wetenschap
Het aminozuur selenocysteïne, 3D-ballenmodel. Krediet:YassineMrabet/CC BY 3.0/Wikipedia
Bijna elk fundamenteel biologisch proces dat nodig is voor het leven wordt uitgevoerd door eiwitten. Ze creëren en behouden de vormen van cellen en weefsels; vormen de enzymen die levensondersteunende chemische reacties katalyseren; fungeren als moleculaire fabrieken, transporteurs en motoren; dienen als zowel signaal als ontvanger voor cellulaire communicatie; en nog veel meer.
Bestaat uit lange ketens van aminozuren, eiwitten voeren deze talloze taken uit door zichzelf te vouwen tot precieze 3D-structuren die bepalen hoe ze omgaan met andere moleculen. Omdat de vorm van een eiwit zijn functie en de mate van disfunctie bij ziekte bepaalt, inspanningen om eiwitstructuren te belichten staan centraal in de hele moleculaire biologie - en in het bijzonder therapeutische wetenschap en de ontwikkeling van levensreddende en levensveranderende medicijnen.
In recente jaren, computationele methoden hebben aanzienlijke vooruitgang geboekt bij het voorspellen hoe eiwitten vouwen op basis van kennis van hun aminozuursequentie. Indien volledig gerealiseerd, deze methoden hebben het potentieel om vrijwel alle facetten van biomedisch onderzoek te transformeren. huidige benaderingen, echter, zijn beperkt in de omvang en reikwijdte van de eiwitten die kunnen worden bepaald.
Nutsvoorzieningen, een wetenschapper van de Harvard Medical School heeft een vorm van kunstmatige intelligentie gebruikt die bekend staat als deep learning om de 3D-structuur van elk eiwit effectief te voorspellen op basis van de aminozuursequentie ervan.
Online melden in celsystemen op 17 april systeembioloog Mohammed AlQuraishi beschrijft een nieuwe benadering voor het berekenen van de eiwitstructuur door een nauwkeurigheid te bereiken die vergelijkbaar is met de huidige state-of-the-art methoden, maar met snelheden tot een miljoen keer sneller.
"Het vouwen van eiwitten is de afgelopen halve eeuw een van de belangrijkste problemen geweest voor biochemici, en deze benadering vertegenwoordigt een fundamenteel nieuwe manier om die uitdaging aan te gaan, " zei AlQuraishi, docent systeembiologie aan het Blavatnik Institute bij HMS en een fellow bij het Laboratory of Systems Pharmacology. "We hebben nu een heel nieuw uitzicht om eiwitvouwing te onderzoeken, en ik denk dat we net begonnen zijn aan de oppervlakte te krabben."
Makkelijk te vermelden
Hoewel zeer succesvol, processen die fysieke hulpmiddelen gebruiken om eiwitstructuren te identificeren, zijn duur en tijdrovend, zelfs met moderne technieken zoals cryo-elektronenmicroscopie. Als zodanig, de overgrote meerderheid van eiwitstructuren - en de effecten van ziekteverwekkende mutaties op deze structuren - zijn nog grotendeels onbekend.
Computationele methoden die berekenen hoe eiwitten vouwen, hebben het potentieel om de kosten en tijd die nodig zijn om de structuur te bepalen drastisch te verminderen. Maar het probleem is moeilijk en blijft onopgelost na bijna vier decennia van intense inspanning.
Eiwitten zijn opgebouwd uit een bibliotheek van 20 verschillende aminozuren. Deze werken als letters in een alfabet, combineren tot woorden, zinnen en alinea's om een astronomisch aantal mogelijke teksten te produceren. In tegenstelling tot alfabetletters, echter, aminozuren zijn fysieke objecten die in de 3D-ruimte zijn gepositioneerd. Vaak, secties van een eiwit zullen fysiek dicht bij elkaar liggen, maar worden gescheiden door grote afstanden in termen van volgorde, omdat de aminozuurketens lussen vormen, spiralen, vellen en kronkels.
"Het boeiende aan het probleem is dat het vrij eenvoudig is om te zeggen:neem een reeks en bepaal de vorm, "AlQuraishi zei. "Een eiwit begint als een ongestructureerde string die een 3D-vorm moet aannemen, en de mogelijke reeksen vormen waarin een touwtje kan worden gevouwen, is enorm. Veel eiwitten zijn duizenden aminozuren lang, en de complexiteit overschrijdt snel de capaciteit van de menselijke intuïtie of zelfs de krachtigste computers."
Moeilijk op te lossen
Om deze uitdaging aan te gaan, wetenschappers maken gebruik van het feit dat aminozuren met elkaar interageren op basis van de wetten van de natuurkunde, op zoek naar energetisch gunstige toestanden zoals een bal die bergafwaarts rolt om zich op de bodem van een vallei te vestigen.
De meest geavanceerde algoritmen berekenen de eiwitstructuur door op supercomputers te draaien - of crowd-sourced rekenkracht in het geval van projecten zoals Rosetta@Home en Folding@Home - om de complexe fysica van aminozuurinteracties met brute kracht te simuleren. Om de enorme rekenkundige vereisten te verminderen, deze projecten zijn afhankelijk van het in kaart brengen van nieuwe sequenties op vooraf gedefinieerde sjablonen, dat zijn eiwitstructuren die eerder door experimenten zijn bepaald.
Andere projecten, zoals Google's AlphaFold, hebben de laatste tijd enorme opwinding veroorzaakt door gebruik te maken van de vooruitgang in kunstmatige intelligentie om de structuur van een eiwit te voorspellen. Om dit te doen, deze benaderingen ontleden enorme hoeveelheden genomische gegevens, die de blauwdruk voor eiwitsequenties bevatten. Ze zoeken naar reeksen over veel soorten die waarschijnlijk samen zijn geëvolueerd, het gebruik van dergelijke sequenties als indicatoren voor de directe fysieke nabijheid om de structuurassemblage te geleiden.
Deze AI-benaderingen, echter, voorspel geen structuren die uitsluitend gebaseerd zijn op de aminozuursequentie van een eiwit. Dus, ze hebben een beperkte werkzaamheid voor eiwitten waarvoor geen voorkennis is, evolutionair unieke eiwitten of nieuwe eiwitten ontworpen door mensen.
Diep trainen
Om een nieuwe aanpak te ontwikkelen, AlQuraishi paste zogenaamd end-to-end differentiable deep learning toe. Deze tak van kunstmatige intelligentie heeft de rekenkracht en tijd die nodig is om problemen zoals beeld- en spraakherkenning, applicaties zoals Apple's Siri en Google Translate inschakelen.
In essentie, differentieerbaar leren omvat een enkele, enorme wiskundige functie - een veel geavanceerdere versie van een middelbare school-calculusvergelijking - gerangschikt als een neuraal netwerk, waarbij elk onderdeel van het netwerk informatie voorwaarts en achterwaarts invoert.
Deze functie kan zichzelf afstemmen en aanpassen, keer op keer op onvoorstelbare niveaus van complexiteit, om precies te "leren" hoe een eiwitsequentie zich wiskundig verhoudt tot zijn structuur.
AlQuraishi ontwikkelde een deep-learningmodel, een terugkerend geometrisch netwerk genoemd, die zich richt op de belangrijkste kenmerken van eiwitvouwing. Maar voordat het nieuwe voorspellingen kan doen, het moet worden getraind met behulp van vooraf bepaalde sequenties en structuren.
Voor elk aminozuur het model voorspelt de meest waarschijnlijke hoek van de chemische bindingen die het aminozuur verbinden met zijn buren. Het voorspelt ook de rotatiehoek rond deze bindingen, die van invloed is op hoe een lokaal deel van een eiwit geometrisch gerelateerd is aan de gehele structuur.
Dit wordt herhaaldelijk gedaan, bij elke berekening geïnformeerd en verfijnd door de relatieve posities van elk ander aminozuur. Als de hele constructie klaar is, het model controleert de nauwkeurigheid van zijn voorspelling door deze te vergelijken met de "ground truth"-structuur van het eiwit.
Dit hele proces wordt herhaald voor duizenden bekende eiwitten, met het model leren en de nauwkeurigheid ervan bij elke iteratie verbeteren.
Nieuw uitzicht
Toen zijn model eenmaal was opgeleid, AlQuraishi testte zijn voorspellende kracht. Hij vergeleek de prestaties met andere methoden uit de afgelopen jaren van de Critical Assessment of Protein Structure Prediction - een jaarlijks experiment dat computationele methoden test op hun vermogen om voorspellingen te doen met behulp van eiwitstructuren die zijn vastgesteld maar niet publiekelijk zijn vrijgegeven.
Hij ontdekte dat het nieuwe model beter presteerde dan alle andere methoden bij het voorspellen van eiwitstructuren waarvoor er geen reeds bestaande sjablonen zijn. inclusief methoden die co-evolutionaire gegevens gebruiken. Het presteerde ook beter dan alle behalve de beste methoden wanneer reeds bestaande sjablonen beschikbaar waren om voorspellingen te doen.
Hoewel deze winst in nauwkeurigheid relatief klein is, AlQuraishi merkt op dat eventuele verbeteringen aan de bovenkant van deze tests moeilijk te bereiken zijn. En omdat deze methode een geheel nieuwe benadering van eiwitvouwing vertegenwoordigt, het kan bestaande methoden aanvullen, zowel computationeel als fysiek, om een veel breder scala aan structuren te bepalen dan voorheen mogelijk was.
Opvallend, het nieuwe model voert zijn voorspellingen op ongeveer zes tot zeven orden van grootte sneller uit dan bestaande computationele methoden. Het trainen van het model kan maanden duren, maar eenmaal getraind kan het voorspellingen doen in milliseconden in vergelijking met de uren tot dagen die het kost met andere benaderingen. Deze dramatische verbetering is deels te danken aan de enkele wiskundige functie waarop het is gebaseerd, waarvoor slechts een paar duizend regels computercode nodig zijn in plaats van miljoenen.
De hoge snelheid van de voorspellingen van dit model maakt nieuwe toepassingen mogelijk die voorheen traag of moeilijk te realiseren waren, AlQuraishi zei, zoals het voorspellen hoe eiwitten van vorm veranderen als ze interageren met andere moleculen.
"Deep-learning benaderingen, niet alleen de mijne, zullen blijven groeien in hun voorspellende kracht en in populariteit, omdat ze een minimale, eenvoudig paradigma dat nieuwe ideeën gemakkelijker kan integreren dan de huidige complexe modellen, " hij voegde toe.
Het nieuwe model is niet direct klaar voor gebruik in, zeggen, ontdekking of ontwerp van geneesmiddelen, AlQuraishi zei, omdat de nauwkeurigheid momenteel ergens rond de 6 angstrom ligt - nog steeds op enige afstand van de 1 tot 2 angstrom die nodig is om de volledige atomaire structuur van een eiwit op te lossen. Maar er zijn veel mogelijkheden om de aanpak te optimaliseren, hij zei, inclusief het verder integreren van regels uit de scheikunde en de natuurkunde.
"Het nauwkeurig en efficiënt voorspellen van eiwitvouwing is een heilige graal voor het veld, en het is mijn hoop en verwachting dat deze benadering, gecombineerd met alle andere opmerkelijke methoden die zijn ontwikkeld, zal dit in de nabije toekomst kunnen doen, " zei AlQuraishi. "Misschien lossen we dit snel op, en ik denk dat niemand dat vijf jaar geleden zou hebben gezegd. Het is heel spannend en tegelijkertijd ook een beetje schokkend."
Om anderen te helpen deelnemen aan methodeontwikkeling, AlQuraishi heeft zijn software en resultaten vrij beschikbaar gesteld via het GitHub-platform voor het delen van software.
"Een opmerkelijk kenmerk van AlQuraishi's werk is dat een enkele onderzoeker, ingebed in het rijke onderzoeksecosysteem van de Harvard Medical School en de biomedische gemeenschap van Boston, kan concurreren met bedrijven zoals Google op een van de populairste gebieden van de informatica, " zei Peter Sorger, HMS Otto Krayer hoogleraar systeemfarmacologie aan het Blavatnik Institute bij HMS, directeur van het Laboratorium voor Systeemfarmacologie bij HMS en de academische mentor van AlQuraishi.
"Het is onverstandig om de ontwrichtende impact te onderschatten van briljante kerels zoals AlQuraishi die werken met open-source software in het publieke domein, ' zei Sorger.
Wetenschap © https://nl.scienceaq.com