Wetenschap
Wetenschappers van de Universiteit van Maryland pasten een taalverwerkingssysteem toe op de bewegingen van een riboswitch-molecuul dat hier is afgebeeld, om te begrijpen hoe en wanneer het molecuul verschillende vormen aanneemt. Krediet:Zachary Smith/UMD
Door natuurlijke taalverwerkingstools toe te passen op de bewegingen van eiwitmoleculen, Wetenschappers van de Universiteit van Maryland hebben een abstracte taal gemaakt die de meerdere vormen beschrijft die een eiwitmolecuul kan aannemen en hoe en wanneer het van de ene vorm naar de andere overgaat.
De functie van een eiwitmolecuul wordt vaak bepaald door zijn vorm en structuur, Dus het begrijpen van de dynamiek die vorm en structuur controleert, kan een deur openen naar het begrijpen van alles, van hoe een eiwit werkt tot de oorzaken van ziekte en de beste manier om gerichte medicamenteuze therapieën te ontwerpen. Dit is de eerste keer dat een machine learning-algoritme op deze manier is toegepast op biomoleculaire dynamica, en het succes van de methode levert inzichten op die ook kunnen helpen bij het bevorderen van kunstmatige intelligentie (AI). Een onderzoekspaper over dit werk werd op 9 oktober gepubliceerd. 2020, in het journaal Natuurcommunicatie .
"Hier laten we dezelfde AI-architecturen zien die worden gebruikt om zinnen te voltooien bij het schrijven van e-mails, kunnen worden gebruikt om een taal te ontdekken die wordt gesproken door de moleculen van het leven, " zei de senior auteur van de krant, Pratyush Tiwary, een assistent-professor in de afdeling Scheikunde en Biochemie van UMD en het Instituut voor Fysische Wetenschap en Technologie. "We laten zien dat de beweging van deze moleculen in kaart kan worden gebracht in een abstracte taal, en dat AI-technieken kunnen worden gebruikt om biologisch waarheidsgetrouwe verhalen te genereren uit de resulterende abstracte woorden."
Biologische moleculen zijn constant in beweging, rondscharrelen in hun omgeving. Hun vorm wordt bepaald door hoe ze worden gevouwen en gedraaid. Ze kunnen seconden of dagen in een bepaalde vorm blijven voordat ze plotseling openspringen en zich opnieuw vouwen in een andere vorm of structuur. De overgang van de ene vorm naar de andere gebeurt net als het uitrekken van een verwarde spoel die zich in fasen opent. Naarmate verschillende delen van de spoel loslaten en ontvouwen, het molecuul neemt verschillende intermediaire conformaties aan.
Maar de overgang van de ene vorm naar de andere vindt plaats in picoseconden (biljoensten van een seconde) of sneller, wat het voor experimentele methoden zoals krachtige microscopen en spectroscopie moeilijk maakt om precies vast te leggen hoe de ontvouwing plaatsvindt, welke parameters van invloed zijn op het ontvouwen en welke verschillende vormen mogelijk zijn. De antwoorden op die vragen vormen het biologische verhaal dat de nieuwe methode van Tiwary kan onthullen.
Tiwary en zijn team pasten de bewegingswetten van Newton toe - die de beweging van atomen in een molecuul kunnen voorspellen - met krachtige supercomputers, inclusief UMD's Deepthought2, statistische fysica-modellen te ontwikkelen die de vorm simuleren, beweging en traject van individuele moleculen.
Daarna voerden ze die modellen in een machine learning-algoritme, zoals het programma dat Gmail gebruikt om zinnen automatisch aan te vullen terwijl je typt. Het algoritme benaderde de simulaties als een taal waarin elke moleculaire beweging een letter vormt die met andere bewegingen aan elkaar kan worden geregen om woorden en zinnen te maken. Door de regels van syntaxis en grammatica te leren die bepalen welke vormen en bewegingen elkaar opvolgen en welke niet, het algoritme voorspelt hoe het eiwit ontwart als het van vorm verandert en de verscheidenheid aan vormen die het onderweg aanneemt.
Om aan te tonen dat hun methode werkt, het team paste het toe op een klein biomolecuul genaamd riboswitch, die eerder waren geanalyseerd met behulp van spectroscopie. De resultaten, die de verschillende vormen onthulde die de riboswitch kon aannemen als hij werd uitgerekt, kwam overeen met de resultaten van de spectroscopiestudies.
"Een van de belangrijkste toepassingen hiervan, Ik hoop, is om medicijnen te ontwikkelen die zeer gericht zijn, "Zei Tiwary. "Je wilt krachtige medicijnen hebben die heel sterk binden, maar alleen voor datgene waaraan u wilt dat ze zich binden. We kunnen dat bereiken als we de verschillende vormen kunnen begrijpen die een bepaald biomolecuul van belang kan aannemen, omdat we op het juiste moment en zo lang als we willen medicijnen kunnen maken die slechts aan een van die specifieke vormen binden."
Een even belangrijk onderdeel van dit onderzoek is de kennis die is opgedaan over het taalverwerkingssysteem dat Tiwary en zijn team gebruikten, dat over het algemeen een terugkerend neuraal netwerk wordt genoemd, en in dit specifieke geval een lange-kortetermijngeheugennetwerk. De onderzoekers analyseerden de wiskunde die ten grondslag lag aan het netwerk terwijl het de taal van moleculaire beweging leerde. Ze ontdekten dat het netwerk een soort logica gebruikte die vergelijkbaar was met een belangrijk concept uit de statistische fysica, padentropie genaamd. Als u dit begrijpt, ontstaan er mogelijkheden voor het verbeteren van terugkerende neurale netwerken in de toekomst.
"Het is natuurlijk om te vragen of er heersende fysieke principes zijn die AI-tools succesvol maken, ' zei Tiwary. 'Hier ontdekken we dat, inderdaad, het is omdat de AI leerpadentropie is. Nu we dit weten, het opent meer knoppen en versnellingen die we kunnen afstemmen om betere AI voor biologie te doen en misschien, ambitieus, zelfs AI zelf verbeteren. Telkens wanneer u een complex systeem zoals AI begrijpt, het wordt minder een black-box en geeft je nieuwe tools om het effectiever en betrouwbaarder te gebruiken."
Wetenschap © https://nl.scienceaq.com