science >> Wetenschap >  >> Elektronica

Diepe neurale netwerkversnelling gebruiken voor beeldanalyse bij het ontdekken van geneesmiddelen

Intel werkt samen met Novartis aan het gebruik van diepe neurale netwerken (DNN) om screening met hoge inhoud te versnellen - een belangrijk element van vroege ontdekking van geneesmiddelen. Het samenwerkingsteam heeft de tijd voor het trainen van beeldanalysemodellen teruggebracht van 11 uur naar 31 minuten - een verbetering van meer dan 20 keer.

Screening met een hoog gehalte aan cellulaire fenotypes is een fundamenteel hulpmiddel ter ondersteuning van vroege ontdekking van geneesmiddelen. De term "hoge inhoud" staat voor de rijke set van duizenden vooraf gedefinieerde functies (zoals grootte, vorm, textuur) die worden geëxtraheerd uit afbeeldingen met behulp van klassieke beeldverwerkingstechnieken. Screening met hoge inhoud maakt analyse van microscopische beelden mogelijk om de effecten van duizenden genetische of chemische behandelingen op verschillende celculturen te bestuderen.

De belofte van deep learning is dat relevante beeldkenmerken die de ene behandeling van de andere kunnen onderscheiden, "automatisch" uit de gegevens worden geleerd. Door diepe neurale netwerkversnelling toe te passen, biologen en datawetenschappers bij Intel en Novartis hopen de analyse van beeldschermen met een hoge inhoud te versnellen. In dit gezamenlijke werk het team concentreert zich op hele microscopiebeelden in plaats van een afzonderlijk proces te gebruiken om eerst elke cel in een afbeelding te identificeren. Hele microscopie-afbeeldingen kunnen veel groter zijn dan de afbeeldingen die doorgaans worden aangetroffen in datasets voor diep leren. Bijvoorbeeld, de afbeeldingen die in deze evaluatie worden gebruikt, zijn meer dan 26 keer groter dan afbeeldingen die doorgaans worden gebruikt uit de bekende ImageNet-dataset van dieren, objecten en scènes.

Diepe convolutionele neurale netwerkmodellen, voor het analyseren van microscopiebeelden, werken meestal op miljoenen pixels per afbeelding, miljoenen parameters in het model en mogelijk duizenden trainingsbeelden tegelijk. Dat betekent een hoge rekenbelasting. Zelfs met geavanceerde rekenmogelijkheden op bestaande computerinfrastructuur, diepere verkenning van DNN-modellen kan onbetaalbaar zijn in termen van tijd.

Om deze uitdagingen op te lossen, de samenwerking past diepe neurale netwerkversnellingstechnieken toe om meerdere afbeeldingen in aanzienlijk minder tijd te verwerken, terwijl meer inzicht wordt verkregen uit afbeeldingsfuncties die het model uiteindelijk leert.

Het samenwerkingsteam met vertegenwoordigers van Novartis en Intel heeft meer dan 20 keer1 verbetering laten zien in de tijd om een ​​dataset van 10K-afbeeldingen voor training te verwerken. Met behulp van de dataset Broad Bioimage Benchmark Collection 021 (BBBC-021), het team heeft een totale verwerkingstijd van 31 minuten bereikt met een nauwkeurigheid van meer dan 99 procent.

Voor dit resultaat is het team gebruikte acht CPU-gebaseerde servers, een snelle weefselverbinding, en geoptimaliseerde TensorFlow1. Door gebruik te maken van het fundamentele principe van dataparallellisme in deep learning-training en de mogelijkheid om de voordelen van grote geheugenondersteuning op het serverplatform volledig te benutten, het team was in staat om met 32 ​​TensorFlow-werknemers op te schalen naar meer dan 120 afbeeldingen van 3,9 megapixels per seconde.

Hoewel begeleide deep learning-methoden essentieel zijn om de classificatie van afbeeldingen te versnellen en de tijd tot inzicht te versnellen, deep learning-methoden zijn afhankelijk van grote door experts gelabelde datasets om de modellen te trainen. De tijd en handmatige inspanning die nodig is om dergelijke datasets te maken, is vaak onbetaalbaar. Ongecontroleerde deep learning-methoden - die kunnen worden toegepast op niet-gelabelde microscopiebeelden - houden de belofte in om nieuwe inzichten te onthullen voor cellulaire biologie en uiteindelijk voor het ontdekken van geneesmiddelen. Dit zal in de toekomst de focus zijn van voortdurende inspanningen.