science >> Wetenschap >  >> Chemie

Onderzoekers beoordelen de state-of-the-art text mining-technologieën voor chemie

In een recente Chemische beoordelingen artikel, Spaanse onderzoekers hebben de eerste uitgebreide herziening gepubliceerd van de state-of-the-art methodologieën die ten grondslag liggen aan chemische zoekmachines, benoemde entiteitsherkenning en tekstminingsystemen.

Het snelgroeiende veld van big data-toepassingen in biomedisch onderzoek, samen met het gebruik van machine learning en kunstmatige intelligentietechnologieën voor tekstdatamining, heeft geleid tot veelbelovende instrumenten. De auteurs schrijven, "Deze beoordeling is georganiseerd om te dienen als een praktische gids voor onderzoekers die zich op dit gebied begeven, maar ook om hen te helpen zich de volgende stappen in dit opkomende datawetenschapsveld voor te stellen."

"Door de release van Gold Standard-datasets en de organisatie van verschillende benchmark-evenementen voor de gemeenschap, de Biologische Text Mining Unit heeft een cruciale rol gespeeld bij de ontwikkeling en evaluatie van de huidige chemische tekstminingsystemen, zoals benadrukt in dit artikel, " legt Martin Krallinger uit, hoofd van de eenheid en co-eerste auteur van de recensie.

Een enorme hoeveelheid ongestructureerde gegevens

Een aanzienlijk deel van de biomedisch relevante data is alleen beschikbaar in de vorm van ongestructureerde data. Dit soort gegevens omvat snelgroeiende wetenschappelijke literatuur, medicinale chemieoctrooien, elektronische medische dossiers en documenten voor klinische proeven. In feite, elk jaar, meer dan 20, 000 nieuwe verbindingen worden gepubliceerd in tijdschriften over medicinale en biologische chemie.

In staat zijn om ongestructureerde biomedische onderzoeksgegevens om te zetten in gestructureerde databases die efficiënter kunnen worden verwerkt door machines of door mensen kunnen worden opgevraagd, is van cruciaal belang voor een reeks heterogene toepassingen. Deze omvatten de identificatie van nieuwe doelwitten voor geneesmiddelen en chemische sondes om die nieuwe potentiële doelwitten te valideren/verwerpen, herbestemming van goedgekeurde medicijnen, de identificatie van bijwerkingen van geneesmiddelen of het ophalen van systeembiologie geassocieerd met chemische ziekten of chemische genennetwerken.

Als therapeutische strategie om medische behoeften te behandelen, chemische verbindingen vormen een belangrijke entiteit die van cruciaal belang is voor biomedisch onderzoek. "De bouw van grote chemische kennisbanken, integratie van chemische informatie met biologische en klinische gegevens, is van cruciaal belang om nieuwe therapeutische doelen voor onvervulde medische behoeften te identificeren en te valideren en om het ontdekkingsproces van geneesmiddelen te versnellen, " zegt Julen Oyarzabal, directeur van Translational Sciences bij CIMA en co-leider van dit rapport.