science >> Wetenschap >  >> Chemie

Kunstmatige intelligentie zal de chemische ruimte in kaart brengen om te helpen navigeren door de grote diversiteit aan chemische verbindingen

Wetenschappers van het Skoltech Center for Computational and Data-Intensive Science and Engineering (CDISE) en Helmholtz Munich Center for Environmental Health (HMGU, Duitsland) hebben een neuraal netwerk gecreëerd voor het visualiseren van de chemische ruimte van verbindingen die van potentiële waarde kunnen zijn voor de farmaceutische industrie. De nieuwe methode zal helpen om nieuwe chemische verbindingen te creëren en te navigeren in de ruimte van de bestaande chemicaliën. De resultaten van het onderzoek zijn gepubliceerd in RSC Advances.

Chemici moeten vaak zwoegen door enorme databases met tien- of zelfs honderdduizenden chemische structuren om de beste kandidaten te selecteren. Om dit te doen, ze moeten weten welke klassen van verbindingen de database bevat. Echter, door duizenden moleculen gaan is een moeizame taak, wat veel gemakkelijker zou zijn als de moleculen als stippen werden afgebeeld en op een vlak of in de ruimte zouden worden geplaatst, met vergelijkbare moleculen die bij elkaar zitten. Dit zou het mogelijk maken om de chemische ruimte te bestuderen met een eenvoudig hulpmiddel op dezelfde manier als de geograaf digitale kaarten van verschillende schalen gebruikt om een ​​groter beeld te bekijken of in te zoomen op een bepaald gebied. Maar hier is het probleem:hoe zou het algoritme weten waar de moleculen moeten worden geplaatst als het gereedschap geen kennis heeft van chemie?

Een gezamenlijke groep onderzoekers van CDISE (Dmitry Karlov, Sergey Sosnin en Maxim Fedorov) en HMGU (Igor Tetko) pasten AI-methoden toe om informatie rechtstreeks uit gegevens te halen, en het diepe neurale netwerk gekoppeld aan de populaire t-SNE-dimensiereductiemethode om een ​​neuraal netwerk te creëren dat in staat is om een ​​2D-weergave van de verbinding op een vlak te genereren op basis van de multidimensionale structuur van de verbinding die als invoer wordt ontvangen. De nieuwe methode plaatst moleculen met vergelijkbare eigenschappen dicht bij elkaar, zodat de verbindingen op basis van hun eigenschappen in klassen kunnen worden ingedeeld. De auteurs van de studie trainden hun neurale netwerk op miljoenen verbindingen met bekende biologische activiteit.

"We hebben de t-SNE-methode aangepast om de chemische ruimte van verbindingen met farmaceutisch potentieel te visualiseren door het diepe neurale netwerk te trainen en eenvoudige descriptoren en een metriek voor het berekenen van afstanden in een multidimensionale ruimte te selecteren. We hebben ook aangetoond dat deze benadering het mogelijk maakt om meer informatie op te slaan in vergelijking met andere methoden voor dimensiereductie, terwijl het qua snelheid vergelijkbaar is met PCA, " zegt Skoltech-onderzoeker en de eerste auteur van de studie Dmitry Karlov.

In de toekomst, de wetenschappers zijn van plan een reeks hulpmiddelen te ontwikkelen voor chemici en apothekers om de opstelling van nieuwe, onontgonnen verbindingen in vergelijking met die welke al zijn bestudeerd en beschreven in de literatuur. Dit versnelt de R&D-fase in de zoektocht naar nieuwe geneesmiddelen.