science >> Wetenschap >  >> Chemie

Machine learning-software voorspelt gedrag van bacteriën

Een artistieke afbeelding van een bacteriecel. Krediet:centra voor ziektebestrijding en -preventie / James Archer

In een primeur voor machine learning-algoritmen, een nieuw stukje software ontwikkeld bij Caltech kan het gedrag van bacteriën voorspellen door de inhoud van een gen te lezen. De doorbraak zou belangrijke implicaties kunnen hebben voor ons begrip van bacteriële biochemie en voor de ontwikkeling van nieuwe medicijnen.

Een van de speerpunten van de moderne farmacologie is gericht op het verlichten van kwalen door medicijnen te ontwikkelen die zich richten op specifieke eiwitten die zich in de membranen van de cellen van ons lichaam bevinden. Deze eiwitten, zogenaamde integrale membraaneiwitten (IMP), fungeren als receptoren of "poorten" die materialen in en uit cellen laten. Voorbeelden van IMP's zijn G-eiwit-gekoppelde receptoren, die informatie doorgeven aan een cel over zijn omgeving, en ionenkanalen, die de binnenomgeving van een cel regelen door als poortwachters te fungeren die selectief ionen de cel in en uit laten gaan. IMP's zijn het doelwit van bijna 50 procent van alle geneesmiddelen op de markt. Helaas, veel IMP's worden slecht begrepen.

"Dit zijn zeer belangrijke moleculen die ons lichaam maakt waar we gewoon niet genoeg van weten, " zegt Bil Clemons, een professor in de biochemie aan Caltech.

Om een ​​vollediger begrip te krijgen van een IMP, onderzoekers moeten er grote hoeveelheden van genereren voor zuivering en gedetailleerd onderzoek. Typisch, dat wordt gedaan door het DNA voor dat eiwit in bacteriën in te voegen; het eiwit wordt dan als een vanzelfsprekendheid geproduceerd terwijl de bacteriën groeien en zich vermenigvuldigen. Het probleem is dat niet alle bacteriën bereid zijn mee te werken en slechts een schamele hoeveelheid eiwit aan te maken. Slechts een paar bacteriën maken uiteindelijk genoeg van de eiwitten om nuttig te zijn, en, tot nu, er is geen manier voor onderzoekers om te weten of een bacterie waarmee ze werken een hit of een blindganger zal zijn.

"Een van de belangrijkste beperkingen bij het bestuderen van membraaneiwitten is het gebrek aan vermogen om ze in redelijke hoeveelheden tot expressie te brengen, "zegt Clemons. "We gebruiken deze bacteriën als fabrieken om dingen voor ons te maken, maar het is wisselvallig ... meestal missen. anekdotisch, het is ongeveer 10 procent succesvol geweest."

Al het vallen en opstaan ​​​​om bacteriën te laten samenwerken, verspilt tijd en middelen van onderzoekers. Clemons vroeg zich af of het mogelijk zou zijn om computers te gebruiken om te voorspellen hoe bacteriën zullen reageren wanneer ze worden gevraagd een eiwit te maken dat ze normaal niet produceren.

"We gingen ervan uit dat bacteriële cellen het DNA kwantitatief afleesden om te bepalen hoeveel van deze eiwitten ze moesten maken, " zegt hij. "We wilden weten of we computerhulpmiddelen konden gebruiken om het succespercentage te vergroten bij het vinden van bacteriën die eiwitten in bruikbare hoeveelheden tot expressie brengen om ons te helpen moleculen te karakteriseren die belangrijk zijn voor de geneeskunde."

Clemons en zijn afgestudeerde student, Shyam Saladi, hebben die tool gemaakt - een machine-learningsoftware die ze IMProve hebben genoemd - die bacterieel DNA vergelijkt met gegevens over hoeveel eiwit de bacteriën produceren. Vervolgens gebruikten ze een dataset voor IMProve die veel bacteriemonsters kweekte om te zien hoe goed ze de gewenste membraaneiwitten produceerden. De onderzoekers trainden IMProve door die resultaten en de genetische codes in te voeren waarop de bacteriën vertrouwen om de eiwitten tot expressie te brengen in IMProve, zodat het kon leren welke DNA-sequenties zouden leiden tot een hoge eiwitproductie.

Nadat de software was getraind, de onderzoekers ontdekten dat het het gedrag van bacteriën zo goed voorspelde dat ze hun snelheid van het succesvol plukken van bacteriën die IMP's in grote hoeveelheden tot expressie zouden brengen, konden verdubbelen.

"Het verraste ons omdat er geen garantie was dat deze aanpak zou werken, "zegt Clemons. "Cellen zijn extreem complex, en je vraagt ​​een relatief eenvoudig statistisch model om te voorspellen wat een cel gaat doen. Vanuit dat perspectief, het was behoorlijk schokkend."

Maar, Clemons voegt eraan toe dat misschien zijn hun resultaten achteraf niet zo verrassend.

"Dit onderstreept het idee dat cellen gewoon computers zijn, en ze zijn gewoon dingen aan het berekenen, " hij zegt.

De krant, getiteld "Een statistisch model voor verbeterde membraaneiwitexpressie met behulp van sequentie-afgeleide functies, " verschijnt in het nummer van 30 maart van de Tijdschrift voor biologische chemie .