science >> Wetenschap >  >> Elektronica

Een nieuwe tool voor datawetenschappers en biologen en meer

Krediet:CC0 Publiek Domein

Het sociale netwerk Linkedin vertelt een gebruiker hoe hij/zij is verbonden met een ander. In het echte leven, aanknopingspunten zijn niet altijd even evident. Echter, het identificeren van patronen of relaties en overeenkomsten tussen entiteiten is een taak die van cruciaal belang is voor bedrijven, biologen, dokters, patiënten en meer.

Een nieuwe rekentool ontwikkeld in het laboratorium van de USC Viterbi School Ming Hsieh Department of Electrical and Computer Engineering professor Paul Bodgan in samenwerking met Ming Hsieh professor Edmond Jonckheere, kan snel de verborgen verbanden en onderlinge relaties tussen groepen/items/personen identificeren met een grotere nauwkeurigheid dan bestaande tools.

De onderzoekers in Bogdans lab zijn een soort rechercheurs en de puzzel die ze proberen te ontrafelen is hoe een aanwijzing, persoon, item of actie is verbonden en gerelateerd aan een andere entiteit. Stel je een laboratorium voor dat gewijd is aan een wetenschappelijke "Zes graden van ..." om verborgen onderlinge verbanden te ontdekken. Het probleem dat ze aanpakken, staat bij onderzoekers die complexe netwerken bestuderen bekend als het 'gemeenschapsdetectieprobleem':het identificeren en in kaart brengen welke individuen of items gemeen hebben en hoe ze met elkaar verbonden zijn.

Zo'n computerhulpmiddel zou door verschillende groepen kunnen worden gebruikt:politieke strategen die overlappende waarden of gedeelde kenmerken van kiezers proberen te vinden; of biologen die het potentieel van de bijwerkingen of interacties van een medicijn willen voorspellen — zonder jaren aan levende experimenten uit te voeren. Hun onderzoek wordt ook ingezet om te identificeren welke delen van de hersenen aan dezelfde functies werken - een belangrijk stuk informatie voor neurowetenschappers en personen met hersenbeschadiging om te anticiperen of bepaalde delen van de hersenen de functionaliteit voor beschadigd weefsel zouden kunnen overnemen. Je kunt je ook voorstellen dat het algoritme van dit lab werkt aan het vinden van contactpunten op schijnbaar niet-gerelateerde informatie.

Hun recente artikel, getiteld "Ollivier-Ricci Curvature-Based Method to Community Detection in Complex Networks", in het tijdschrift Nature Wetenschappelijke rapporten , documenteert de methode die de groep heeft ontwikkeld om deze verbeterde tool te creëren.

Methodologie/Proof of Concept:

doctoraat kandidaat Jayson Sia die aan het onderzoek meewerkte, geeft aan dat het door hen ontwikkelde algoritme, de op Ollivier-Ricci kromming (ORC) gebaseerde gemeenschapsidentificatie, werd getest en gevalideerd op vier bekende real-world datasets waarvoor het doel is om het verbindingspunt te vinden tussen de "knooppunten" of individuen/individuele items in een groep door te kijken naar de verbanden ertussen of wat bekend is in technisch jargon als 'randen'. De datasets omvatten een drug-drug interaction network, de Zachary's Karate Club; lidmaatschappen van een universiteitsvoetbalconferentie; en een set van meer dan 1000 politieke blogs.

zegt hoofdauteur Sia, "In deze krant, we gebruikten een nieuwe geometrische benadering via de Ollivier-Ricci-kromming die een natuurlijke methode biedt om inherente netwerkgemeenschapsstructuren te ontdekken.."

Kromming in de geometrische context, legt Sia uit, "meet in wezen hoe een oppervlak afwijkt van plat zijn (of hoe een oppervlak 'kromt'). De geometrie van oppervlakken is gerelateerd aan de studie van kaartprojecties en hoe afstanden worden gemeten in een gekromd oppervlak zoals de aarde. De Ollivier-Ricci kromming breidt dit concept van 'kromming' uit tot netwerken met positief gekromde randen die 'goed verbonden' zijn en van nature een 'gemeenschap' vormen. Negatief gebogen randen daarentegen worden geïnterpreteerd als 'bruggen' tussen gemeenschappen en het doorsnijden van dergelijke randen zou de informatiestroom tussen gemeenschappen isoleren."