Science >> Wetenschap >  >> Chemie

Onderzoekers bouwen een AI die enzymen ontdekt

Gemarkeerde aminozuurresiduen door het neurale netwerk DeepECtransformer. Credit:Natuurcommunicatie (2023). DOI:10.1038/s41467-023-43216-z

Hoewel E. coli een van de meest bestudeerde organismen is, is de functie van 30% van de eiwitten waaruit E. coli bestaat nog niet duidelijk onthuld. Hiervoor werd een kunstmatige intelligentie gebruikt om 464 soorten enzymen te ontdekken uit de eiwitten die onbekend waren, en de onderzoekers gingen verder met het verifiëren van de voorspellingen van drie soorten eiwitten die met succes waren geïdentificeerd via in vitro enzymtests.



Een gezamenlijk onderzoeksteam, bestaande uit Gi Bae Kim, Ji Yeon Kim, Dr. Jong An Lee en Distinguished Professor Sang Yup Lee van de afdeling Chemische en Biomoleculaire Technologie van KAIST, en Dr. Charles J. Norsigian en Professor Bernhard O. Palsson van de afdeling Bioengineering van UCSD heeft DeepECtransformer ontwikkeld, een kunstmatige intelligentie die de enzymfuncties kan voorspellen op basis van de eiwitsequentie. Daarnaast heeft het team een ​​voorspellingssysteem opgezet door gebruik te maken van de AI om de enzymfunctie snel en nauwkeurig te identificeren.

Het werk van het team wordt beschreven in het artikel met de titel "Functionele annotatie van enzymcoderende genen met behulp van deep learning met transformatorlagen." Het artikel werd op 14 november gepubliceerd in Nature Communications .

Enzymen zijn eiwitten die biologische reacties katalyseren, en het identificeren van de functie van elk enzym is essentieel voor het begrijpen van de verschillende chemische reacties die voorkomen in levende organismen en de metabolische kenmerken van die organismen.

Het Enzyme Commission (EC)-nummer is een classificatiesysteem voor enzymfuncties, ontworpen door de International Union of Biochemistry and Molecular Biology, en om de metabolische kenmerken van verschillende organismen te begrijpen, is het noodzakelijk om een ​​technologie te ontwikkelen die enzymen en EG-nummers snel kan analyseren. van de enzymen die in het genoom aanwezig zijn.

Er zijn verschillende op deep learning gebaseerde methoden ontwikkeld om de kenmerken van biologische sequenties te analyseren, waaronder de voorspelling van de eiwitfunctie, maar de meeste ervan hebben het probleem van een black box, waarin het gevolgtrekkingsproces van AI niet kan worden geïnterpreteerd.

Er zijn ook verschillende voorspellingssystemen gerapporteerd die AI gebruiken voor het voorspellen van de enzymfunctie, maar deze lossen dit black box-probleem niet op, of kunnen het redeneerproces niet op een fijnkorrelig niveau interpreteren (bijvoorbeeld het niveau van aminozuurresiduen in de enzymsequentie). ).

De structuur van het kunstmatige neurale netwerk van DeepECtransformer. Credit:Het Korea Advanced Institute of Science and Technology (KAIST)

Het gezamenlijke team ontwikkelde DeepECtransformer, een AI die gebruik maakt van deep learning en een eiwithomologie-analysemodule om de enzymfunctie van een bepaalde eiwitsequentie te voorspellen.

Om de kenmerken van eiwitsequenties beter te begrijpen, werd de transformatorarchitectuur, die vaak wordt gebruikt bij natuurlijke taalverwerking, bovendien gebruikt om belangrijke kenmerken over enzymfuncties in de context van de gehele eiwitsequentie te extraheren, waardoor het team de EC nauwkeurig kon voorspellen. nummer van het enzym. De ontwikkelde DeepECtransformator kan in totaal 5360 EC-getallen voorspellen.

Het gezamenlijke team analyseerde de transformatorarchitectuur verder om het inferentieproces van DeepECtransformer te begrijpen, en ontdekte dat de AI bij het inferentieproces informatie gebruikt over katalytisch actieve plaatsen en/of de cofactorbindingsplaatsen die belangrijk zijn voor de enzymfunctie. Door de black box van DeepECtransformer te analyseren, werd bevestigd dat de AI tijdens het leerproces zelfstandig de kenmerken kon identificeren die belangrijk zijn voor de enzymfunctie.

"Door gebruik te maken van het voorspellingssysteem dat we hebben ontwikkeld, konden we de functies voorspellen van enzymen die nog niet waren geïdentificeerd en deze experimenteel verifiëren", zegt Gi Bae Kim, de eerste auteur van het artikel.

"Door DeepECtransformer te gebruiken om voorheen onbekende enzymen in levende organismen te identificeren, zullen we in staat zijn om verschillende facetten die betrokken zijn bij de metabolische processen van organismen nauwkeuriger te analyseren, zoals de enzymen die nodig zijn om verschillende nuttige verbindingen te biosynthetiseren of de enzymen die nodig zijn om plastics biologisch af te breken," voegde hij eraan toe.

"DeepECtransformer, die snel en nauwkeurig enzymfuncties voorspelt, is een sleuteltechnologie in functionele genomica, waardoor we de functie van hele enzymen op systeemniveau kunnen analyseren", zegt professor Sang Yup Lee.

Hij voegde eraan toe:"We zullen het kunnen gebruiken om milieuvriendelijke microbiële fabrieken te ontwikkelen op basis van uitgebreide metabolische modellen op genoomschaal, waardoor de ontbrekende informatie over het metabolisme mogelijk wordt geminimaliseerd."

Meer informatie: Gi Bae Kim et al, Functionele annotatie van voor enzymen coderende genen met behulp van deep learning met transformatorlagen, Nature Communications (2023). DOI:10.1038/s41467-023-43216-z

Journaalinformatie: Natuurcommunicatie

Aangeboden door het Korea Advanced Institute of Science and Technology (KAIST)