Wetenschap
Krediet:CC0 Publiek Domein
Datamining en extractie van kennis uit verschillende bronnen is big data, grote zaken. Maar, hoe gaat de zoeksoftware om met entiteiten die worden genoemd waar slechts een deel van hun naam wordt gebruikt of een naam wordt afgebroken terwijl dit normaal niet het geval is? Onderzoek gepubliceerd in de International Journal of Intelligent Information and Database Systems onthult details van een nieuwe benadering voor het verbeteren van de herkenning en het ondubbelzinnig maken van benoemde entiteiten in nieuwskoppen.
Jayendra Barua en Rajdeep Niyogi van de afdeling Computerwetenschappen en Engineering, aan het Indiase Instituut voor Technologie, in Roorkee, Uttarakhand, Indië, uitleggen dat hun benadering van een dergelijke analyse van actuele nieuwskoppen voortbouwt op een getraind algoritme dat is geleerd om de koppeltekens te verwijderen en onvolledige namen aan te vullen om dubbelzinnigheid te verwijderen.
De evaluatie door het team van hun nieuwe aanpak laat zien dat het ongeveer 10 procent nauwkeuriger werkt dan conventionele systemen en dus het automatisch ophalen van nieuws geassocieerd met bepaalde bedrijven zou kunnen verbeteren. organisaties, evenementen, publieke figuren, en andere entiteiten die van belang zijn voor die datamining van het nieuws. Het systeem werkt goed met nieuwsfeeds, zoals het RSS-type nieuwsfeed dat wordt gegenereerd door regelmatig bijgewerkte websites. Krantenkoppen uit dergelijke bronnen zijn doorgaans langer dan conventionele krantenkoppen, maar zijn niettemin beknopt, gewoonlijk tien of minder woorden lang zijn. Elk woord kan dan belangrijk zijn in een dataminingcontext en daarom is ondubbelzinnigheid van cruciaal belang.
DNA met een twist:ontdekking zou de ontwikkeling van antibiotica kunnen bevorderen
Studie brengt nanobody-structuur in kaart, wat leidt tot nieuwe manieren om mogelijk ziekten te bestrijden
Hoe metaalatomen zich kunnen rangschikken op een isolator
Wat is de relatie tussen CO2 en zuurstof in fotosynthese?
Koolhydraten vastleggen
Toename van stormen kan catastrofale gevolgen hebben voor de visserijsector
Uitdagingen voor de ontwikkeling van duurzame veehouderij in het westen van Pennsylvania
Professor spoort wetenschappers aan om zich uit te spreken over klimaatverandering
Moss tapijten helpen erosie te stoppen
Bosbranden zijn onvermijdelijk - toenemende woningverliezen, dodelijke slachtoffers en kosten zijn niet
MAVEN onthult dat Mars metaal in zijn atmosfeer heeft
Hoe pKa-waarden te berekenen
Zustercelprofilering is bedoeld om uitzaaiing van kanker te stoppen
Adaptief beheer van bodembehoud is essentieel voor het verbeteren van de waterkwaliteit, uit onderzoek blijkt
Kledingvoorschriften op de werkplek vormen barrières voor mensen met een handicap
Frankrijk zindert onder hittegolf, brandweerlieden op scherp zetten
De fabrieksactiviteit in China valt in januari naarmate de angst voor virussen toeneemt
Willekeurige effecten sleutel tot het indammen van epidemieën
Wetenschap © https://nl.scienceaq.com