science >> Wetenschap >  >> Elektronica

Deep-learning-aangedreven DeepEC-framework helpt enzymfuncties nauwkeurig te begrijpen

Algemeen schema van DeepEC. Krediet:KAIST

Een door diepgaand leren aangedreven computationeel raamwerk, 'DeepEC, ' zal de voorspelling van hoge kwaliteit en hoge doorvoer van enzymcommissienummers mogelijk maken, wat essentieel is voor een nauwkeurig begrip van enzymfuncties.

Een team bestaande uit Dr. Jae Yong Ryu, Professor Hyun Uk Kim, en Distinguished Professor Sang Yup Lee van KAIST rapporteerde het computationele raamwerk aangedreven door deep learning dat enzymcommissie (EC)-nummers met hoge precisie op een high-throughput manier voorspelt.

DeepEC neemt een eiwitsequentie als invoer en voorspelt nauwkeurig EC-nummers als uitvoer. Enzymen zijn eiwitten die biochemische reacties en EC-nummers katalyseren, die uit vier niveaunummers bestaan ​​(d.w.z. een, B, C, d) biochemische reacties aangeven. Dus, de identificatie van EC-nummers is van cruciaal belang voor een nauwkeurig begrip van de enzymfuncties en het metabolisme.

EC-nummers worden meestal gegeven aan een eiwitsequentie die codeert voor een enzym tijdens een genoomannotatieprocedure. Vanwege het belang van EC-nummers, er zijn verschillende voorspellingstools voor EC-nummers ontwikkeld, maar ze hebben ruimte voor verdere verbetering met betrekking tot rekentijd, precisie, Dekking, en de totale grootte van de bestanden die nodig zijn voor de voorspelling van het EC-nummer.

DeepEC gebruikt drie convolutionele neurale netwerken (CNN's) als een belangrijke motor voor de voorspelling van EC-nummers, en implementeert ook homologie-analyse voor EC-nummers als de drie CNN's geen betrouwbare EC-nummers produceren voor een bepaalde eiwitsequentie. DeepEC is ontwikkeld met behulp van een gouden standaarddataset van 1, 388, 606 eiwitsequenties en 4, 669 EG-nummers.

Vooral, benchmarkingstudies van DeepEC en vijf andere representatieve EC-nummervoorspellingstools toonden aan dat DeepEC de meest nauwkeurige en snelste voorspellingen voor EC-nummers deed. DeepEC had ook de kleinste schijfruimte nodig voor implementatie, waardoor het een ideale softwarecomponent van derden is.

Verder, DeepEC was het meest gevoelig bij het detecteren van enzymatisch functieverlies als gevolg van mutaties in domeinen/bindingsplaatsresidu van eiwitsequenties; in deze vergelijkende analyse, alle domeinen of bindingsplaatsresten werden vervangen door L-alanineresten om de eiwitfunctie te verwijderen, die bekend staat als de L-alanine-scanmethode.

Deze studie is online gepubliceerd in de Proceedings van de National Academy of Sciences ( PNAS ) op 20 juni, 2019, getiteld "Deep learning maakt hoogwaardige en snelle voorspelling van enzymcommissienummers mogelijk."

"DeepEC kan worden gebruikt als een onafhankelijke tool en ook als een softwarecomponent van derden in combinatie met andere computerplatforms die metabolische reacties onderzoeken. DeepEC is gratis online beschikbaar, ’ zei professor Kim.

Distinguished Professor Lee zei:"Met DeepEC, het is mogelijk geworden om steeds grotere hoeveelheden eiwitsequentiegegevens efficiënter en nauwkeuriger te verwerken."