Wetenschap
Retrosynthese heeft tot doel een reeks reactanten te voorspellen voor de productie van bepaalde moleculen, die een belangrijke rol spelen op het gebied van de biochemie, zoals het ontwerp van moleculaire routes en de ontdekking van geneesmiddelen. De meeste bestaande methoden profiteren slechts van één soort informatie in plaats van verder rekening te houden met de diverse aspecten van moleculaire informatie.
Om dit probleem aan te pakken heeft een onderzoeksteam een onderzoek uitgevoerd, dat nu is gepubliceerd in Frontiers of Computer Science .
Het team stelde een multi-stream netwerk voor voor het voorspellen van retrosynthese door moleculen vanuit meerdere perspectieven te beschrijven met behulp van hun SMILES- en ECFP-descriptoren.
MSNR bestaat uit drie hoofdmodules:(i) De parallelle CNN en de tekst-CNN die de ECFP's en SMILES na one-hot-codering als invoer gebruikt om de diepe functies te produceren. (ii) De combinatierepresentatie wordt bedacht door de twee soorten diepe kenmerken van ECFP's en SMILES te combineren, die een diepgaand perspectief bieden op moleculaire representatie. (iii) Er zijn drie dichte classificaties geïmplementeerd om de waarschijnlijkheid van reactanten voor moleculen te voorspellen, waarbij gebruik wordt gemaakt van de diepe kenmerken die door verschillende stromen worden geëxtraheerd als respectievelijk de moleculaire representatie.
Door deze multi-stream voorspellingsresultaten met verschillende gewichten te combineren, komt het model tot een uiteindelijke retrosynthesevoorspelling. Bovendien wordt het model getraind met behulp van een algehele verliesfunctie die in staat is gebruik te maken van de diverse informatie die beschikbaar is voor elk type diepgaande functie.