science >> Wetenschap >  >> Chemie

Onderzoekers gebruiken Theta voor realtime analyse van COVID-19-eiwitten

Nsp10/16-oppervlak met liganden. Onderzoekers hebben een pijplijn ontwikkeld om ALCF-supercomputers te verbinden met APS-experimenten om realtime analyse van COVID-19-eiwitten mogelijk te maken, de weg vrijmaken om de belangrijke eiwitstructurele dynamiek van het coronavirus op te helderen. Krediet:Mateusz Wilamowski, Universiteit van Chicago, Centrum voor structurele genomica van infectieziekten; George Minasov, Noordwestelijke Universiteit, Centrum voor structurele genomica van infectieziekten

Onderzoekers van Argonne hebben een pijplijn ontwikkeld tussen ALCF-supercomputers en Advanced Photon Source-experimenten om on-demand analyse van de kristalstructuur van COVID-19-eiwitten mogelijk te maken.

Als het coronavirus SARS-CoV-2 en de bijbehorende ziekte, COVID-19, ontwikkeld en verspreid over het land en de planeet, het Argonne National Laboratory van het Amerikaanse Department of Energy (DOE) sloot zich aan bij de wereldwijde strijd door te beginnen met werken om de pandemie beter te begrijpen en te behandelen. Verschillende van dergelijke onderzoekslijnen zijn gelanceerd bij de Argonne Leadership Computing Facility, een DOE Office of Science gebruikersfaciliteit, om te profiteren van zijn aanzienlijke wetenschappelijke middelen; een van deze lijnen heeft de kristalstructuur geanalyseerd van een eiwitcomplex dat geassocieerd is met het coronavirus.

De sleutel tot het begrijpen van het coronavirus is het ontrafelen van de structuur ervan. Hiertoe, Onderzoekers van Argonne hebben de Theta-supercomputer van ALCF gebruikt om kristallografische beelden te analyseren van een eiwitcomplex dat geassocieerd is met SARS-CoV-2. De afbeeldingen zijn afkomstig van Argonne's Advanced Photon Source (APS), een DOE Office of Science gebruikersfaciliteit, na experimenten met behulp van een techniek die bekend staat als seriële synchrotron-kristallografie en die is ontworpen om de complexe chemie van virale eiwitten op te helderen.

Seriële synchrotronkristallografie-experimenten maken gebruik van röntgenstralen met hoge intensiteit om de structuren van grote moleculen te onthullen met slechts fractionele stralingsdoses in vergelijking met de vereisten van traditionele kristallografische technieken. Als resultaat, seriële synchrotron-kristallografie stelt onderzoekers in staat om tienduizenden microscopisch kleine kristallen in beeld te brengen, met zeer korte belichtingstijden voor elk afzonderlijk monster. De hoge snelheid van de techniek leidt tot het genereren van een breed scala aan gegevens, waarvan de complexiteit en dichtheid geavanceerde en rekenkundig veeleisende analyses vereisen.

Massaal parallelle systemen zoals Theta zijn uniek in hun vermogen om te voldoen aan de eisen die seriële synchrotronkristallografie stelt voor snelle, on-the-fly verwerking. Het inschakelen van Theta voor gebruik in on-the-fly verwerking is een gegevenspijplijn die rond de supercomputer is gebouwd. Deze pijplijn automatiseert data-acquisitie, analyse, curatie, en visualisatie, het transporteren van resultaten naar een repository waaruit metadata kan worden geëxtraheerd voor publicatie.

De pijplijn genereert grote beeldbatches met een hoge snelheid, met gegevensoverdrachten met snelheden van 700 megabyte per seconde dankzij Globus, een door de Universiteit van Chicago gerunde gegevensbeheerservice.

"De implementatie van deze pijplijn tussen de APS en de ALCF voor on-demand analyse is een enorm succes geweest, " zei Ryan Chard, een computerwetenschapper bij Argonne die de beeldverwerkingsinspanningen leidde. "We bereikten een verwerkingssnelheid van maximaal 95 afbeeldingen per seconde." Deze hoge snelheid maakte het mogelijk om direct feedback te geven aan de experimentatoren van het APS.

De pijplijn begint met het overbrengen van beelden van Globus van het APS naar het Theta-systeem. De beelden worden vervolgens geanalyseerd en verwerkt met FuncX, een function-as-a-service berekeningssysteem dat de verzending van individuele taken naar beschikbare computerknooppunten organiseert. FuncX wordt vervolgens ook gebruikt om metadata over hits te extraheren, identificeer kristaldiffracties, en genereer visualisaties die zowel de monster- als de hitlocaties weergeven. Hierna de ruwe data, metagegevens, en gerelateerde visualisaties worden gepubliceerd op een portal die wordt gehost bij de ALCF, waar ze worden geïndexeerd en doorzoekbaar gemaakt voor hergebruik.

Negentien monsters werden geanalyseerd over bijna 1, 500 stromen in de loop van drie runs van tien uur op de APS-straal, waarbij meer dan 700, 000 afbeeldingen werden verwerkt op Theta. De resulterende gegevens werden gepubliceerd op het dataportaal en gebruikt om experimenteel werk en configuraties verder te verfijnen. De orkestratie die nodig is om onderzoek op deze schaal mogelijk te maken, wordt mogelijk gemaakt door automatiseringsdiensten voor onderzoeksgegevens die momenteel worden ontwikkeld op het Globus-platform, en ondersteund door de betrouwbare bestandsoverdracht, en veilige mogelijkheden voor het delen van gegevens die al op grote schaal worden gebruikt in APS-bundellijnen. Deze mogelijkheden zullen blijven verbeteren met toekomstige geplande verbeteringen aan APS-bundellijnen, ALCF-supercomputers, Globus, en het APS-naar-ALCF-netwerk. De aanstaande APS-upgrade, waarmee onderzoekers dingen op schaal kunnen zien die ze nog nooit eerder hebben gezien met röntgenstralen op basis van opslagringen, datasnelheden met orden van grootte zal verhogen. Het combineren van deze mogelijkheden van de ALCF en APS Upgrade zal de wetenschappelijke ontdekking aanzienlijk verbeteren.

"De toenemende biologische relevantie van seriële synchrotronkristallografie-experimenten heeft onderzoekers ertoe aangezet om de komende weken een aantal verdere experimenten voor te bereiden, " zei Darren Sherrell, een biofysicus en beamline-wetenschapper bij de X-ray Science Division van de APS. "Dit werk maakt de weg vrij om de belangrijke structurele dynamiek van eiwitten van het coronavirus op te helderen."