science >> Wetenschap >  >> Chemie

Wetenschappers vinden manier om ruis uit big data te verwijderen in metabolomics-onderzoek

Metabolisme is ingewikkeld. Het goede nieuws is dat het misschien niet zo ingewikkeld is als eerder werd gedacht. Nieuw onderzoek van wetenschappers van de Washington University ondersteunt een afbeelding die meer lijkt op die aan de rechterkant. Krediet:Gary Patti-lab

Niet lang geleden, wetenschappers zetten weddenschappen op het aantal genen in het menselijk genoom. Sommige weddenschappen liepen op tot 100, 000 genen aanwezig zijn. Nadat de sequentie van het menselijk genoom was voltooid, een project onder leiding van het McDonnell Genome Institute aan de Washington University School of Medicine in St. Louis, zelfs de laagste schatting van 25, 947 bleek boven het werkelijke aantal te zijn.

Nutsvoorzieningen, bijna 15 jaar later, wetenschappers van de Washington University zien een trend die doet denken aan het nieuwste type big data dat bekend staat als metabolomics. Ze schatten dat het aantal metabolieten dat aanwezig is in een dataset 90 procent kleiner zou kunnen zijn dan eerder werd geschat.

De studie werd online gepubliceerd op 15 september in Analytische scheikunde .

Net als zijn genomische voorganger, metabolomics probeert alle metabolieten die in een monster aanwezig zijn te profileren. In tegenstelling tot genen, echter, metabolieten zijn niet gemaakt van gemeenschappelijke bouwstenen en zijn veel meer chemisch divers. Bekende metabolieten zijn onder meer moleculen zoals glucose en cholesterol, waarvan vele een product van een dieet zijn. Dus, proberen om het exacte aantal metabolieten bij de mens vast te stellen was een zware uitdaging. Vanwege de sterke voedingsafhankelijkheid, sommige wetenschappers hebben betoogd dat het niet eens de relevante vraag is om te stellen.

Er is al bijna net zo lang interesse in het meten van metabolieten als er interesse is in de menselijke gezondheid. Analyse van glucose bij diabetes gaat waarschijnlijk eeuwen terug. Sinds de jaren zestig worden er een handvol andere metabolieten gebruikt om ziekten te diagnosticeren die algemeen worden aangeduid als "aangeboren stofwisselingsstoornissen". Metabolomics probeert al deze metabolieten te meten, en meer. De vraag is:hoeveel zijn er nog?

Het toneel voor metabolomics werd gezet met de komst van geavanceerde apparaten die massaspectrometers worden genoemd. Deze instrumenten zijn als kleine weegschalen die de gewichten van moleculen kunnen meten, zoals suikers. Door gebruik te maken van databases en rekenalgoritmen, wetenschappers kunnen gemeten gewichten omzetten in samengestelde namen, zoals glucose.

Een decennium geleden, toen metabolomics mainstream begon te worden, wetenschappers waren verrast toen ze ontdekten dat het aantal signalen in een typisch metabolomics-experiment het aantal bekende metabolieten in leerboeken over biochemie aanzienlijk overschrijdt. Zei Gary Patti, universitair hoofddocent chemie in Arts &Sciences en senior auteur van de studie:"Natuurlijk, de reflexmatige reactie is om aan te nemen dat de meeste signalen die geen overeenkomsten in databases retourneren, overeenkomen met onbekende metabolieten die nog nooit eerder zijn gemeld."

De implicaties van een dergelijke veronderstelling zijn groot:tienduizenden metabolieten moeten nog worden ontdekt, een orde van grootte meer dan wat is opgenomen op uw gewone wandkaart van uitgebreide stofwisseling (zie afbeelding hieronder).

"Het is routine om tienduizenden signalen te detecteren in metabolomics, maar slechts 1, 000 tot 2, 000 zijn geïdentificeerd in elk experiment tot nu toe, " zei Nathaniel Mahieu, een postdoctoraal onderzoeker in Patti's lab, die de studie leidde.

Zei Patti:"De vraag van een miljoen dollar is:met hoeveel metabolieten komen al deze metabolomische signalen eigenlijk overeen?"

Mahieu en Patti, die vorige week werd aangekondigd als een winnaar van een achtjarige, $ 5,85 miljoen inaugurele subsidie ​​in milieugezondheid van de National Institutes of Health, ontwikkelde nieuwe experimentele en computationele benaderingen om metabolomics datasets te ondervragen. Ze kwamen tot een opvallende conclusie. Ze ontdekten dat het werkelijke aantal metabolieten in een typische metabolomics-analyse een tiende zo groot kan zijn als eerder werd gesuggereerd, waarbij veel van de gegevens afkomstig zijn van "ruis". Duizenden signalen komen voort uit besmetting, artefacten, en iets dat 'degeneratie' wordt genoemd - zeg, wanneer één metaboliet evenveel verschillende signalen vertoont. Het onderzoeksteam ontdekte dat sommige metabolieten verschijnen als meer dan 150 signalen.

"Het blijkt dat meer dan 90 procent van de signalen die we zien in E. coli-gegevens in wezen ruis zijn, "Zei Mahieu. "Dit vermindert het aantal onbekende metabolieten waarvan we dachten dat we ze ontdekten enorm."

"Ik denk dat dit een soort wake-up call is, een realiteitscheck als je wilt, over wat metabolomics suggereert over de grootte van het metaboloom, ' zei Patti. 'Ik geloof dat het een goede zaak is. Het betekent dat we veel dichter bij het begrijpen van het metabolisme zijn dan we waarschijnlijk dachten dat we waren."

Wat betreft de volgende stap, Patti's lab is van plan hun technieken uit te breiden naar menselijke monsters.

"Het uiteindelijke doel is om analoge experimenten te doen voor mensen, "Zei Patti. "Ons werk hier is een belangrijke stap voorwaarts."

Dus wat betekenen al deze ruissignalen voor andere wetenschappers die metabolomics uitvoeren? Het Patti-lab is begonnen met het samenstellen van wat zij 'referentiegegevenssets' noemen in een database met de naam creDBle (creDBle.wustl.edu). Ze hopen dat het experimenten zal vergemakkelijken voor andere wetenschappers die metabolomics uitvoeren.

"De manier waarop metabolomics momenteel wordt uitgevoerd, is vreselijk inefficiënt. We verspillen veel tijd aan het interpreteren van signalen die minimaal biologisch inzicht bieden, "Zei Mahieu. "We hopen dat deze referentiegegevenssets in creDBle zullen helpen voorkomen dat wetenschappers dezelfde ruissignalen steeds opnieuw moeten identificeren nu we ze hebben geannoteerd."