science >> Wetenschap >  >> Chemie

Annotatietool biedt een stap in de richting van het begrijpen van verbanden tussen ziekte, gemuteerd RNA

Dit is een computerafbeelding van een RNA-molecuul. Krediet:Richard Feldmann/Wikipedia

Onderzoekers van de Oregon State University hebben een computerprogramma ontwikkeld dat een belangrijke stap vertegenwoordigt in de richting van een beter begrip van de verbanden tussen gemuteerd genetisch materiaal en ziekte.

Bekend als bpRNA, de software is een big-data-annotatietool voor secundaire structuren in ribonucleïnezuren.

"Het is in staat om RNA-structuren te ontleden, inclusief complexe pseudoknot-bevattende RNA's, dus je eindigt met een doel, nauwkeurig, gemakkelijk te interpreteren beschrijving van alle lussen, stengels en pseudoknots, " zei corresponderend auteur David Hendrix. "Je krijgt ook de posities, sequentie en flankerende basenparen van elk structureel kenmerk, waardoor we de RNA-structuur massaal op grote schaal kunnen bestuderen."

RNA werkt met DNA, het andere nucleïnezuur - zo genoemd omdat ze voor het eerst werden ontdekt in de celkernen van levende wezens - om de eiwitten te produceren die in het hele lichaam nodig zijn. DNA bevat erfelijke informatie van een persoon, en RNA levert de gecodeerde instructies van de informatie aan de eiwitproductieplaatsen in de cellen. Veel RNA-moleculen coderen niet voor een eiwit, en deze staan ​​bekend als niet-coderende RNA's.

"Er zijn tal van voorbeelden van ziekte-geassocieerde mutaties in niet-coderende RNA's die waarschijnlijk hun structuur beïnvloeden, en om statistisch te analyseren waarom die mutaties verband houden met ziekte, moeten we de analyse van de RNA-structuur automatiseren, zei Hendriks, assistent-professor biochemie en biofysica aan het College of Science. "RNA is een van de fundamentele, essentiële moleculen voor het leven, en we moeten de structuur van RNA's begrijpen om te begrijpen hoe ze werken."

Secundaire structuren zijn de basenparende interacties binnen een enkel nucleïnezuurpolymeer of tussen twee polymeren. DNA heeft voornamelijk volledig basengepaarde dubbele helices, maar RNA is enkelstrengs en kan gecompliceerde interacties vormen.

Hendrix zegt bpRNA, deze maand gepresenteerd in een paper in Onderzoek naar nucleïnezuren , beschikt over de grootste en meest gedetailleerde database tot nu toe van secundaire RNA-structuren.

"Om eerlijk te zijn is het een meta-database, maar onze speciale saus is het hulpmiddel om alles te annoteren, zei Hendriks, die ook een assistent-professor is aan het OSU College of Engineering. "Vroeger was er geen manier om te zeggen waar alle structurele kenmerken zich op een geautomatiseerde manier bevonden. We bieden een kleurgecodeerde kaart van waar alles is. Deze annotaties zullen ons in staat stellen statistische trends te identificeren die licht kunnen werpen op de vorming van RNA-structuren en open de deur voor machine learning-algoritmen om de secundaire RNA-structuur te voorspellen op manieren die niet mogelijk waren."

Onderzoekers hebben de tool met succes getest op meer dan 100, 000 structuren, "waarvan vele zeer complex zijn, met veel complexe pseudoknots."

"Elke dag worden nieuwe RNA's ontdekt en onderzoekers boeken enorme vooruitgang in het begrijpen van hun functie, "Zei Hendrix. "We beginnen te beseffen dat het genoom naast boodschapper-RNA's vol zit met niet-coderende RNA's. en het zijn belangrijke biologische moleculen met grote effecten op de menselijke gezondheid en ziekte."