Wetenschap
MIT-onderzoekers combineerden experimentele chemie met kunstmatige intelligentie om niet-toxische, zeer actieve peptiden die kunnen worden gehecht aan fosforodiamidaat morfolino-oligomeren (PMO) om de medicijnafgifte te bevorderen. Door deze nieuwe sequenties te ontwikkelen, onderzoekers hopen de ontwikkeling van gentherapieën voor Duchenne-spierdystrofie en andere ziekten snel te versnellen. Krediet:Massachusetts Institute of Technology
Duchenne spierdystrofie (DMD), een zeldzame genetische ziekte die meestal wordt gediagnosticeerd bij jonge jongens, verzwakt geleidelijk de spieren over het hele lichaam totdat het hart of de longen het begeven. Symptomen verschijnen vaak op de leeftijd van 5; naarmate de ziekte vordert, patiënten verliezen het vermogen om rond de leeftijd van 12 te lopen. de gemiddelde levensverwachting voor DMD-patiënten schommelt rond de 26.
Het was groot nieuws, dan, toen Cambridge, Het in Massachusetts gevestigde Sarepta Therapeutics kondigde in 2019 een doorbraakmedicijn aan dat zich direct richt op het gemuteerde gen dat verantwoordelijk is voor DMD. De therapie maakt gebruik van antisense fosforodiamidate morfolino-oligomeren (PMO), een groot synthetisch molecuul dat de celkern doordringt om het dystrofine-gen te wijzigen, waardoor de productie van een sleuteleiwit mogelijk is dat normaal gesproken ontbreekt bij DMD-patiënten. "Maar er is een probleem met PMO zelf. Het is niet erg goed in het binnendringen van cellen, " zegt Carly Schissel, een doctoraat kandidaat bij het MIT's Department of Chemistry.
Om de levering aan de kern te stimuleren, onderzoekers kunnen celpenetrerende peptiden (CPP's) aan het medicijn bevestigen, daardoor helpt het de cel en kernmembranen te passeren om zijn doel te bereiken. Welke peptidesequentie is het beste voor de klus, echter, is een dreigende vraag gebleven.
MIT-onderzoekers hebben nu een systematische aanpak ontwikkeld om dit probleem op te lossen door experimentele chemie te combineren met kunstmatige intelligentie om niet-toxische, zeer actieve peptiden die aan PMO kunnen worden gehecht om de levering te vergemakkelijken. Door deze nieuwe sequenties te ontwikkelen, ze hopen de ontwikkeling van gentherapieën voor DMD en andere ziekten snel te versnellen.
De resultaten van hun onderzoek zijn nu gepubliceerd in het tijdschrift Natuurchemie in een paper onder leiding van Schissel en Somesh Mohapatra, een doctoraat student aan het MIT Department of Materials Science and Engineering, wie zijn de hoofdauteurs. Rafael Gomez-Bombarelli, assistent-professor materiaalkunde en techniek, en Bradley Pentelute, hoogleraar scheikunde, zijn de senior auteurs van de krant. Andere auteurs zijn onder meer Justin Wolfe, Colin Fadzen, Kamela Bellovoda, Chia-Ling Wu, Jenna Hout, Annika Malmberg, en Andrej Loas.
"Nieuwe peptiden voorstellen met een computer is niet erg moeilijk. Om te beoordelen of ze goed zijn of niet, dit is wat moeilijk is, ", zegt Gomez-Bombarelli. "De belangrijkste innovatie is het gebruik van machine learning om de sequentie van een peptide te verbinden, in het bijzonder een peptide dat niet-natuurlijke aminozuren bevat, tot experimenteel gemeten biologische activiteit."
Droomgegevens
CPP's zijn relatief korte ketens, opgebouwd uit vijf tot twintig aminozuren. Hoewel één CPP een positief effect kan hebben op de medicijnafgifte, verschillende met elkaar verbonden hebben een synergetisch effect bij het dragen van drugs over de finishlijn. Deze langere ketens, met 30 tot 80 aminozuren, worden mini-eiwitten genoemd.
Voordat een model zinvolle voorspellingen kon doen, onderzoekers aan de experimentele kant moesten een robuuste dataset maken. Door 57 verschillende peptiden te mixen en matchen, Schissel en haar collega's waren in staat om een bibliotheek van 600 mini-eiwitten te bouwen, elk gekoppeld aan PMO. Met een analyse, het team was in staat om te kwantificeren hoe goed elk mini-eiwit zijn lading door de cel kon verplaatsen.
De beslissing om de activiteit van elke reeks te testen, met PMO al bijgevoegd, belangrijk geweest. Omdat een bepaald medicijn waarschijnlijk de activiteit van een CPP-sequentie zal veranderen, het is moeilijk om bestaande gegevens opnieuw te gebruiken, en data gegenereerd in één enkel lab, op dezelfde machines, door dezelfde mensen, voldoen aan een gouden standaard voor consistentie in datasets voor machine learning.
Een doel van het project was om een model te maken dat met elk aminozuur zou kunnen werken. Hoewel er van nature slechts 20 aminozuren in het menselijk lichaam voorkomen, honderden andere bestaan elders, zoals een aminozuuruitbreidingspakket voor de ontwikkeling van geneesmiddelen. Om ze weer te geven in een machine learning-model, onderzoekers gebruiken meestal one-hot codering, een methode die elk onderdeel toewijst aan een reeks binaire variabelen. Drie aminozuren, bijvoorbeeld, zou worden weergegeven als 100, 010, en 001. Om nieuwe aminozuren toe te voegen, het aantal variabelen zou moeten toenemen, wat betekent dat onderzoekers vast zouden zitten aan het opnieuw opbouwen van hun model bij elke toevoeging.
In plaats daarvan, het team koos ervoor om aminozuren weer te geven met topologische vingerafdrukken, wat in wezen een unieke barcode creëert voor elke reeks, waarbij elke regel in de streepjescode ofwel de aanwezigheid of afwezigheid van een bepaalde moleculaire substructuur aangeeft. "Zelfs als het model [een reeks] nog niet eerder heeft gezien, we kunnen het weergeven als een streepjescode, die consistent is met de regels die het model heeft gezien, " zegt Mohapatra, die de ontwikkelingsinspanningen van het project leidde. Door gebruik te maken van dit representatiesysteem, de onderzoekers konden hun gereedschapskist met mogelijke sequenties uitbreiden.
Het team trainde een convolutief neuraal netwerk op de miniproteïnebibliotheek, met elk van de 600 miniproteïnen gelabeld met zijn activiteit, wat aangeeft dat het de cel kan doordringen. Vroegtijdig, het model stelde mini-eiwitten voor beladen met arginine, een aminozuur dat een gat in het celmembraan scheurt, wat niet ideaal is om cellen in leven te houden. Om dit probleem op te lossen, onderzoekers gebruikten een optimizer om arginine te destilleren, voorkomen dat het model vals speelt.
Uiteindelijk, het vermogen om door het model voorgestelde voorspellingen te interpreteren was de sleutel. "Het is meestal niet genoeg om een zwarte doos te hebben, omdat de modellen zich zouden kunnen fixeren op iets dat niet klopt, of omdat het een fenomeen onvolmaakt zou kunnen uitbuiten, ', zegt Gomez-Bombarelli.
In dit geval, onderzoekers konden door het model gegenereerde voorspellingen overlappen met de streepjescode die de sequentiestructuur weergeeft. "Door dat te doen, worden bepaalde regio's benadrukt waarvan het model denkt dat ze de grootste rol spelen bij hoge activiteit, " zegt Schissel. "Het is niet perfect, but it gives you focused regions to play around with. That information would definitely help us in the future to design new sequences empirically."
Delivery boost
uiteindelijk, the machine-learning model proposed sequences that were more effective than any previously known variant. One in particular can boost PMO delivery by 50-fold. By injecting mice with these computer-suggested sequences, the researchers validated their predictions and demonstrated that the miniproteins are nontoxic.
It is too early to tell how this work will affect patients down the line, but better PMO delivery will be beneficial in several ways. If patients are exposed to lower levels of the drug, they may experience fewer side effects, bijvoorbeeld, or require less-frequent doses (PMO is administered intravenously, often on a weekly basis). The treatment may also become less costly. As a testament to the concept, recent clinical trials demonstrated that a proprietary CPP from Sarepta Therapeutics could decrease exposure to PMO by 10-fold. Ook, PMO is not the only drug that stands to be improved by miniproteins. In additional experiments, the model-generated miniproteins carried other functional proteins into the cell.
Noticing a disconnect between the work of machine-learning researchers and experimental chemists, Mohapatra has posted the model on GitHub, along with a tutorial for experimentalists who have their own list of sequences and activities. He notes that over a dozen people from across the world have adopted the model so far, repurposing it to make their own powerful predictions for a wide range of drugs.
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com