science >> Wetenschap >  >> Chemie

Het AI-gestuurde initiatief dat de ontdekking van medicijnen voor de behandeling van COVID-19 versnelt

Wetenschappers gebruiken Theta, een high-performance computersysteem bij de Argonne Leadership Computing Facility, om hen te helpen bij het analyseren van COVID-19-eiwitten. Krediet:Argonne National Laboratory

Een nieuwe pijplijn van AI- en simulatietools kan het proces van screening van kandidaat-geneesmiddelen voor COVID-19 50, 000 keer sneller.

Om een ​​medicijn te vinden dat het SARS-CoV-2-virus kan stoppen, wetenschappers willen miljarden moleculen screenen op de juiste combinatie van eigenschappen. Het proces is meestal riskant en traag, duurt vaak meerdere jaren. Echter, een internationaal team van wetenschappers zegt dat ze een manier hebben gevonden om het proces 50, 000 keer sneller met behulp van kunstmatige intelligentie (AI).

tien organisaties, waaronder het Argonne National Laboratory van het Amerikaanse Department of Energy (DOE), een pijplijn van AI- en simulatietechnieken hebben ontwikkeld om de ontdekking van veelbelovende kandidaat-geneesmiddelen voor COVID-19 te bespoedigen, de ziekte veroorzaakt door het SARS-CoV-2-virus. De pijplijn heet IMPECCABLE, afkorting voor Integrated Modeling PipelinE voor COVID Cure door betere leads te beoordelen.

"Met de AI die we hebben geïmplementeerd, we hebben in een dag tijd vier miljard potentiële kandidaat-geneesmiddelen kunnen screenen, terwijl bestaande rekenhulpmiddelen realistisch gezien slechts één tot tien miljoen kunnen screenen, " zei Thomas Brettin, strategisch programmamanager bij Argonne.

Waarom een ​​geïntegreerde aanpak nodig is

IMPECCABLE integreert meerdere technieken voor gegevensverwerking, op fysica gebaseerde modellering en simulatie, en machinaal leren, een vorm van AI die patronen in data gebruikt om voorspellende modellen te genereren.

"We integreren meerdere benaderingen omdat er geen enkel algoritme of methode is die in je eentje met grote efficiëntie en nauwkeurigheid kan werken, " zei Argonne computationeel bioloog Arvind Ramanathan. "Als we alleen op simulaties vertrouwden, het zou ons jaren kosten om een ​​waarschijnlijk doelwit te vinden, zelfs met de snelste supercomputers."

Onderdelen van de pijpleiding

Aan het begin van de pijplijn computationele technieken worden gebruikt om de basiseigenschappen van miljarden moleculen te berekenen. Deze gegevens worden in de volgende fase van de pijplijn gebruikt om machinale leermodellen te maken die kunnen voorspellen hoe waarschijnlijk het is dat een bepaald molecuul zal binden met een bekend viraal eiwit. Diegene die het meest veelbelovend blijken te zijn, worden vervolgens gesimuleerd op krachtige computersystemen.

"Eiwitten zijn vloeibare structuren, en simulaties tonen ons nieuwe conformaties voor hen. Die gebruiken we om onze machine learning-modellen te verbeteren, "Zei Argonne computationeel wetenschapper Austin Clyde. "Het iteratieve proces gaat door totdat we kunnen valideren dat de moleculen waarvan we hebben vastgesteld dat ze waarschijnlijk binden aan SARS-CoV-2-eiwitten veelbelovend zijn."

Er worden ook zeer grote experimentele datasets verzameld van duizenden eiwitkristallen met behulp van röntgenstralen bij de Advanced Photon Source (APS), een DOE Office of Science User Facility op de campus van Argonne. De techniek die ze gebruiken om deze gegevens te verkrijgen, staat bekend als röntgenkristallografie. ermee, onderzoekers kunnen gedetailleerde afbeeldingen van virale eiwitten en hun chemische toestanden vastleggen om de nauwkeurigheid van hun machine learning-modellen te verbeteren.

"Sinds het begin van de pandemie, we hebben meer dan 45 kristalstructuren met hoge resolutie van SARS-CoV-2-eiwitten en hun complexen met andere verbindingen kunnen bepalen. Deze informatie, in combinatie met computationele analyse, kan kritische inzichten bieden voor verdere op structuur gebaseerde inspanningen voor het ontwerpen van geneesmiddelen en het ontwerp van remmers met hogere affiniteit mogelijk maken en, uiteindelijk therapieën die kunnen worden gebruikt om COVID-19 te behandelen, " zei Andrzej Joachimiak, directeur van het Structural Biology Centre (SBC) aan bundellijn 19-ID-D van het APS.

De uiteindelijke doelen van de pijplijn zijn om (1) de functie van virale eiwitten te begrijpen; (2) identificeer moleculen met een hoog potentieel om aan deze eiwitten te binden en, als resultaat, de proliferatie van SARS-CoV-2 blokkeren; en (3) dit inzicht leveren aan medicijnontwerpers en -ontwikkelaars voor verder onderzoek en ontwikkeling.

“In tegenstelling tot de traditionele aanpak, waar je op de wetenschapper vertrouwt om heel hard na te denken en, op basis van wat ze weten, bedenk ideeën voor een molecuul, met onze pijplijn kun je grote aantallen moleculen automatisch screenen, uw kans op het vinden van een waarschijnlijke kandidaat drastisch vergroten, " zei Ian Foster, directeur van de Data Science and Learning-divisie van Argonne.