science >> Wetenschap >  >> Chemie

Machine learning gebruiken om peptiden te ontwerpen

Overzicht van de iteratieve Peptide Optimization with Optimal Learning (POOL) methode workflow. Credit: Natuurcommunicatie (2018). DOI:10.1038/s41467-018-07717-6

Wetenschappers en ingenieurs zijn al lang geïnteresseerd in het synthetiseren van peptiden - ketens van aminozuren die verantwoordelijk zijn voor het uitvoeren van vele functies in cellen - om zowel de natuur na te bootsen als om nieuwe activiteiten uit te voeren. Een ontworpen peptide, bijvoorbeeld, kan een functioneel medicijn zijn dat in bepaalde delen van het lichaam werkt zonder te verslechteren, een moeilijke taak voor veel peptiden.

Maar methoden voor het ontdekken en synthetiseren van peptiden zijn duur en tijdrovend, vaak met maanden of jaren van giswerk en mislukking.

Onderzoekers van de Northwestern University, samenwerken met medewerkers van de Cornell University en de University of California, San Diego, hebben een nieuwe manier ontwikkeld om optimale peptidesequenties te vinden:met behulp van een machine-learning-algoritme als medewerker.

Het algoritme analyseert experimentele gegevens en biedt suggesties voor de volgende beste reeks om te proberen, het creëren van een heen-en-weer selectieproces dat de tijd die nodig is om het optimale peptide te vinden drastisch vermindert.

De resultaten, die een nieuw kader zou kunnen bieden voor experimenten op het gebied van materiaalwetenschap en scheikunde, werden gepubliceerd in Natuurcommunicatie op 7 dec.

"We zien dit als de volgende golf in hoe we moleculen en materialen ontwerpen, " zei de Noordwest-professor Nathan Gianneschi, een corresponderende auteur op het papier. "We kunnen wat we uit intuïtie weten combineren met de kracht van een algoritme en de oplossing vinden met minder experimenten."

Gianneschi is de Jacob en Rosaline Cohn-hoogleraar in de afdeling scheikunde van het Weinberg College of Arts and Sciences in Northwestern en in de afdelingen materiaalkunde en engineering en biomedische technologie bij Northwestern Engineering.

Om de methode te maken, Gianneschi, die ook de associate director is van het Northwestern's International Institute for Nanotechnology, samen met Peter Frazier, een universitair hoofddocent bij Cornell die werkt in operationeel onderzoek en machine learning, en Michael Burkart, een chemisch bioloog en expert in enzymologie aan UC San Diego, om een ​​betere manier te vinden om peptiden te maken die biomaterialen zouden kunnen genereren, met name nanostructuren en microstructuren die eiwitten op bepaalde manieren zouden kunnen wijzigen. De eerste stap was het vinden van de juiste peptiden die als enzymatische substraten voor deze structuren zouden dienen.

Peptiden zijn opgebouwd uit ketens van aminozuren die wel 20 aminozuren lang kunnen zijn, met 20 verschillende mogelijkheden voor elk zuur. Omdat de sequentie de peptidefunctie bepaalt, het uitzoeken van optimale sequenties vereist dure experimenten die vaak met giswerk worden uitgevoerd.

De experimentatoren, Gianneschi en Burkart, werkte meerdere jaren met Frazier aan de ontwikkeling van een systeem dat experimentele gegevens combineerde met een algoritme voor machinaal leren om de beste strategieën te vinden voor het maken van nieuwe materialen.

Nadat Frazier het algoritme had ontworpen en de twee samenwerkten om het te trainen, de experimentatoren ontwikkelden een reeks van 100 peptiden, experimenten uitgevoerd om erachter te komen welke werkten zoals ze bedoeld waren, voerde die informatie vervolgens in het algoritme in. Het algoritme adviseerde vervolgens wat te veranderen voor de volgende ronde van peptideontwikkeling, en adviseerde ook strategieën waarvan het dacht dat het zou mislukken.

"Nu begonnen we selectiviteit te krijgen, " zei Gianneschi. Door dit proces meerdere keren te voltooien, ze waren in staat om optimale peptiden te vinden.

"In plaats van te gissen en naar miljoenen peptiden te kijken, we waren in staat om naar honderden peptiden te kijken en heel snel samen te komen tot sequenties die zich op volledig nieuwe manieren gedroegen, " zei hij. In vergelijking met willekeurige mutaties of giswerk, de algoritmemethode was statistisch gezien veel succesvoller.

Hoewel dit werk gericht was op substraten, dit proces kan worden gebruikt om peptiden voor elk soort doel te ontdekken, zoals medicijnafgifte, en misschien zelfs worden gebruikt om DNA-sequenties te ontdekken, ook. Omdat elke vorm van optimale volgorde kan worden ontdekt, onderzoekers zijn ook niet beperkt tot welke aminozuursequenties in de genetische code worden gevonden.

De volgende stap is het automatiseren van het hele proces. Gianneschi is ook geïnteresseerd in het gebruik van de methode om optimale oppervlakken voor polymeren te vinden, met name polymeren die worden gebruikt in medische implantaten. Het vinden van de juiste oppervlakken die binden aan weefsel of spieren kan helpen om littekenweefsel of implantaatafstoting te voorkomen.

"Je zou in wezen sequenties kunnen ontdekken die specifieke dingen doen, wat echt de kern is van wat peptiden en nucleïnezuren in de natuur doen, " zei hij. "Dit kan een revolutie teweegbrengen in de manier waarop we peptiden maken."