science >> Wetenschap >  >> Elektronica

Machine learning voorspelt het gedrag van biologische circuits

Twee bacteriekolonies die paarse ringen hebben gevormd vanwege de gene drive die onderzoekers erin hebben geïmplanteerd. Een nieuw machine learning-model versnelt deze wetenschap enorm door de interactie van tientallen biologische variabelen te voorspellen. Krediet:Lingchong You, Duke universiteit

Biomedische ingenieurs van Duke University hebben een machinale leerbenadering ontwikkeld om de interacties tussen complexe variabelen in gemanipuleerde bacteriën te modelleren die anders te omslachtig zouden zijn om te voorspellen. Hun algoritmen zijn generaliseerbaar naar vele soorten biologische systemen.

In de nieuwe studie de onderzoekers trainden een neuraal netwerk om de cirkelvormige patronen te voorspellen die zouden worden gecreëerd door een biologisch circuit ingebed in een bacteriecultuur. Het systeem werkte 30, 000 keer sneller dan het bestaande rekenmodel.

Om de nauwkeurigheid verder te verbeteren, het team bedacht een methode om het machine learning-model meerdere keren te hertrainen om hun antwoorden te vergelijken. Daarna gebruikten ze het om een ​​tweede biologisch systeem op te lossen dat op een andere manier rekenkundig veeleisend is, laten zien dat het algoritme kan werken voor uiteenlopende uitdagingen.

De resultaten verschijnen op 25 september online in het tijdschrift Natuurcommunicatie .

"Dit werk is geïnspireerd door Google en laat zien dat neurale netwerken kunnen leren een mens te verslaan in het bordspel Go, " zei Lingchong You, hoogleraar biomedische technologie aan Duke.

"Ook al heeft het spel eenvoudige regels, er zijn veel te veel mogelijkheden voor een computer om deterministisch de beste volgende optie te berekenen, U zei. "Ik vroeg me af of een dergelijke benadering nuttig zou kunnen zijn bij het omgaan met bepaalde aspecten van biologische complexiteit waarmee we worden geconfronteerd."

De uitdaging voor jou en zijn postdoctoraal medewerker Shangying Wang was om te bepalen welke set parameters een specifiek patroon in een bacteriecultuur zou kunnen produceren volgens een geconstrueerd gencircuit.

Een bacteriekolonie die genetisch is bewerkt om een ​​gencircuit te bevatten, vormt een paarse ring terwijl deze groeit. Onderzoekers gebruiken machine learning om interacties te ontdekken tussen tientallen variabelen die de eigenschappen van de ring beïnvloeden, zoals de dikte, hoe snel het zich vormt en het aantal ringen dat zich vormt. Krediet:Lingchong You, Duke universiteit

In eerder werk, Je in het laboratorium geprogrammeerde bacteriën om eiwitten te produceren die, afhankelijk van de specifieke kenmerken van de groei van de cultuur, interageren met elkaar om ringen te vormen. Door variabelen zoals de grootte van de groeiomgeving en de hoeveelheid geleverde voedingsstoffen te controleren, de onderzoekers ontdekten dat ze de dikte van de ring konden regelen, hoe lang het duurde om te verschijnen en andere kenmerken.

Door een willekeurig aantal tientallen potentiële variabelen te wijzigen, de onderzoekers ontdekten dat ze meer konden doen, zoals het veroorzaken van de vorming van twee of zelfs drie ringen. Maar omdat een enkele computersimulatie vijf minuten duurde, het werd onpraktisch om in een grote ontwerpruimte te zoeken naar een specifiek resultaat.

Voor hun studie het systeem bestond uit 13 bacteriële variabelen zoals de groeisnelheid, verspreiding, eiwitafbraak en cellulaire beweging. Alleen al het berekenen van zes waarden per parameter zou een enkele computer meer dan 600 jaar kosten. Als u het op een parallel computercluster met honderden knooppunten uitvoert, kan die runtime worden teruggebracht tot enkele maanden, maar machine learning kan het tot uren terugbrengen.

"Het model dat we gebruiken is traag omdat het rekening moet houden met tussenliggende stappen in de tijd met een snelheid die klein genoeg is om nauwkeurig te zijn, "zei U. "Maar we geven niet altijd om de tussenstappen. We willen alleen de eindresultaten voor bepaalde toepassingen. En we kunnen (terug)gaan naar de tussenstappen als we de eindresultaten interessant vinden."

Om naar de eindresultaten te gaan, Wang wendde zich tot een machine learning-model dat een diep neuraal netwerk wordt genoemd en dat effectief voorspellingen kan doen die orden van grootte sneller zijn dan het oorspronkelijke model. Het netwerk neemt modelvariabelen als invoer, kent aanvankelijk willekeurige gewichten en vooroordelen toe, en spuugt een voorspelling uit van welk patroon de bacteriekolonie zal vormen, de tussenstappen die naar het uiteindelijke patroon leiden volledig overslaan.

Hoewel het eerste resultaat niet in de buurt komt van het juiste antwoord, de gewichten en vooroordelen kunnen elke keer worden aangepast wanneer nieuwe trainingsgegevens in het netwerk worden ingevoerd. Gezien een voldoende grote "trainingsset", het neurale netwerk zal uiteindelijk bijna elke keer leren nauwkeurige voorspellingen te doen.

Om de paar gevallen aan te pakken waarin machine learning het mis heeft, Jij en Wang hebben een manier bedacht om hun werk snel te controleren. Voor elk neuraal netwerk, het leerproces heeft een element van willekeur. Met andere woorden, het zal nooit twee keer op dezelfde manier leren, zelfs als het op dezelfde reeks antwoorden is getraind.

Elk van deze grafieken vertegenwoordigt een dwarsdoorsnede van een bacteriekolonie. De pieken voorspellen waar de kolonie paarse eiwitten gaat produceren die door een kunstmatig genencircuit ringen vormen. De grafieken bovenaan zijn gemaakt door een machine learning-algoritme, terwijl die aan de onderkant zijn gemaakt door een meer grondige simulatie. Ze passen heel goed bij elkaar - behalve de laatste. Krediet:Duke University

De onderzoekers trainden vier afzonderlijke neurale netwerken en vergeleken hun antwoorden voor elke instantie. Ze ontdekten dat wanneer de getrainde neurale netwerken vergelijkbare voorspellingen doen, deze voorspellingen waren dicht bij het juiste antwoord.

"We ontdekten dat we niet elk antwoord hoefden te valideren met het langzamere standaard rekenmodel, " zei U. "In plaats daarvan gebruikten we in wezen de 'wijsheid van de menigte'."

Met het machine learning-model getraind en bevestigd, de onderzoekers wilden het gebruiken om nieuwe ontdekkingen te doen over hun biologische circuit. In de eerste 100, 000 datasimulaties gebruikt om het neurale netwerk te trainen, slechts één produceerde een bacteriekolonie met drie ringen. Maar met de snelheid van het neurale netwerk, Jij en Wang konden niet alleen nog veel meer drielingen vinden, maar bepalen welke variabelen cruciaal waren bij het produceren ervan.

"Het neurale net was in staat om patronen en interacties tussen de variabelen te vinden die anders onmogelijk te ontdekken zouden zijn, ' zei Wang.

Als afsluiting van hun studie, Jij en Wang probeerden hun aanpak uit op een biologisch systeem dat willekeurig werkt. Het oplossen van dergelijke systemen vereist dat een computermodel dezelfde parameters vele malen herhaalt om de meest waarschijnlijke uitkomst te vinden. Hoewel dit een heel andere reden is voor lange rekentijden dan hun oorspronkelijke model, vonden de onderzoekers dat hun aanpak nog steeds werkte, waaruit blijkt dat het generaliseerbaar is naar veel verschillende complexe biologische systemen.

De onderzoekers proberen hun nieuwe aanpak nu toe te passen op complexere biologische systemen. Naast het draaien op computers met snellere GPU's, ze proberen het algoritme zo efficiënt mogelijk te programmeren.

"We hebben het neurale netwerk getraind met 100, 000 gegevenssets, maar dat was misschien overdreven, " zei Wang. "We ontwikkelen een algoritme waarbij het neurale netwerk in realtime kan interageren met simulaties om dingen te versnellen."

"Ons eerste doel was een relatief eenvoudig systeem, "zei You. "Nu willen we deze neurale netwerksystemen verbeteren om inzicht te krijgen in de onderliggende dynamiek van complexere biologische circuits."