Wetenschap
Een nieuw algoritme vertaalt symbolische kennis in vectorruimten om deductief redeneren te combineren met machine learning. Krediet:Maxat Kulmanov
Een KAUST-team heeft een wiskundig raamwerk ontwikkeld dat de kloof overbrugt tussen door mensen leesbare kennis op hoog niveau en statistische gegevens. Naar verwachting zal het machine learning verbeteren.
Mensen vertrouwen op patronen, labels en orde om de wereld te begrijpen. wij categoriseren, classificeren en verbanden leggen tussen verwante zaken en ideeën, het creëren van symbolen die we kunnen gebruiken om informatie te delen. Kunstmatige intelligentie, anderzijds, wordt het meest effectief getraind met behulp van ruwe numerieke gegevens. Hoe, dan, kunnen kunstmatige intelligentie-algoritmen gebruik maken van onze enorme hoeveelheid symbolische kennis? Dit is een vervelend probleem en een dat, indien gebarsten, zou een enorme nieuwe multidimensionale bibliotheek voor machine learning en kunstmatige intelligentie kunnen openen.
Robert Hoehndorf, Maxat Kulmanov en hun medewerkers bij KAUST's Computational Bioscience Research Center en Halifax University, Canada, hebben een wiskundige brug geslagen tussen deze schijnbaar onverenigbare vormen van informatie.
"Er is een grote kloof in onderzoek naar kunstmatige intelligentie tussen benaderingen die zijn gebaseerd op symbolische representaties op hoog niveau die begrijpelijk zijn voor mensen en de subsymbolische benaderingen die worden gebruikt voor het trainen van kunstmatige neurale netwerken, " legt Kulmanov uit. "Symbolische benaderingen zijn gebaseerd op logische relaties, terwijl subsymbolische benaderingen afhankelijk zijn van statistieken en continue real-genummerde vectorruimten."
De onderzoekers wilden een 'inbedding'-functie ontwikkelen die de ene wiskundige structuur aan de andere koppelt op een manier die enkele van de kenmerken van de eerste structuur behoudt.
"Inbeddingen worden gebruikt omdat de tweede structuur geschikter kan zijn voor sommige operaties, " zegt Hoehndorf. "In dit werk, we brachten een formele taal in kaart, een beschrijvingslogica genoemd, in een reëel getal vectorruimte, die gemakkelijker kunnen worden gebruikt voor machine learning, zoals computervergelijking en het uitvoeren van voorspellende bewerkingen."
Beschrijvingslogica's worden veel gebruikt in de biologie en de medische biologie om geformaliseerde theorieën te beschrijven, zoals de functies van genen en de terminologie die wordt gebruikt bij medische diagnoses.
"Logica, zoals beschrijvingslogica, zijn sinds de jaren zestig de basis voor kunstmatige-intelligentiesystemen en worden al meer dan 100 jaar in de wiskunde bestudeerd, ", zegt Hoehndorf. "Voortbouwend op deze geschiedenis van onderzoek, we hebben een inbeddingsfunctie gemaakt die niet alleen symbolen in een vectorruimte projecteert, maar genereert ook algebraïsche modellen om de semantiek van de symbolen binnen de beschrijvingslogica vast te leggen."
De sleutel tot de prestatie van het team is het koppelen van de inbedding aan de modeltheorie, waardoor het mogelijk werd om gebruik te maken van gevestigde kennis en de eerste inbedding te creëren die de semantiek behoudt.
"Onze methode is direct toepasbaar op honderden geformaliseerde theorieën in biologisch en biomedisch onderzoek en honderden biologische databases, " zegt Kulmanov. "In de toekomst, we zullen onze methode toepassen op meer problemen in de biologie, waarvan we hopen dat het de biomedische toepassingen van kunstmatige intelligentie zal verbeteren."
Wetenschap © https://nl.scienceaq.com