science >> Wetenschap >  >> Elektronica

Nieuwe datawetenschapsmethode maakt grafieken in één oogopslag gemakkelijker te lezen

Afbeelding met een voorbeeld van een van de gebruikersonderzoeken, waarin gebruikers grafieken moesten classificeren op basis van hun vorm. De grafiek aan de rechterkant toont een voorbeeld van een complexe grafiek die een hoge complexiteitsscore (c) zou krijgen. Intuïtief, het is moeilijker te lezen dan de grafiek aan de linkerkant. Om de leesbaarheid te verbeteren, een visualisatieprogramma kan belangrijke aspecten van de gegevens verbeteren om ze leesbaarder te maken. Krediet:Gabriel Ryan, Wu Lab/Columbia Engineering

Artsen lezen EEG's op de eerste hulp, first responders kijken naar meerdere schermen met live datafeeds van sensoren in een rampgebied, makelaars die financiële instrumenten kopen en verkopen, moeten allemaal zeer snel weloverwogen beslissingen nemen. Visualisatiecomplexiteit kan de besluitvorming bemoeilijken wanneer men naar gegevens in een grafiek kijkt. Wanneer timing cruciaal is, het is essentieel dat een grafiek gemakkelijk te lezen en te interpreteren is.

Om besluitvormers in dergelijke scenario's te helpen, computerwetenschappers van Columbia Engineering en Tufts University hebben een nieuwe methode ontwikkeld - "Pixel Approximate Entropy" - die de complexiteit van een datavisualisatie meet en kan worden gebruikt om gemakkelijker leesbare visualisaties te ontwikkelen. Eugene Wu, assistent-professor informatica, en Gabriël Ryan, die toen een Masterstudent was en nu Ph.D. student aan Colombia, presenteren hun paper op de IEEE VIS 2018-conferentie op donderdag, 25 oktober in Berlijn, Duitsland.

"Dit is een geheel nieuwe benadering van het werken met lijndiagrammen met veel verschillende mogelijke toepassingen, " zegt Rianne, eerste auteur op papier. "Onze methode geeft visualisatiesystemen een manier om te meten hoe moeilijk lijndiagrammen zijn om te lezen, dus nu kunnen we deze systemen zo ontwerpen dat ze automatisch grafieken vereenvoudigen of samenvatten die op zichzelf moeilijk te lezen zijn."

Behalve het visueel inspecteren van een visualisatie, er zijn maar weinig manieren geweest om de complexiteit van een datavisualisatie automatisch te kwantificeren. Om dit probleem op te lossen, Wu's groep creëerde Pixel Approximate Entropy om een ​​"visuele complexiteitsscore" te bieden die automatisch moeilijke grafieken kan identificeren. Ze hebben een laagdimensionale entropiemaat aangepast om op lijndiagrammen te werken, en voerde vervolgens een reeks gebruikersonderzoeken uit die aantoonden dat de meting kon voorspellen hoe goed gebruikers grafieken waarnamen.

Video die illustreert hoe de nieuwe Pixel Approximate Entropy-techniek de complexiteit van een datavisualisatie meet en kan worden gebruikt om gemakkelijker leesbare visualisaties te ontwikkelen Credit:Gabriel Ryan, Wu Lab/Columbia Engineering

"In snelle omgevingen, het is belangrijk om te weten of de visualisatie zo complex zal zijn dat de signalen kunnen worden verduisterd, " zegt Wu, die tevens medevoorzitter is van de Data, Media, &Society Center in het Data Science Institute. "Het vermogen om complexiteit te kwantificeren is de eerste stap om hier automatisch iets aan te doen."

Het team verwacht dat hun systeem, wat open-source is, zal vooral nuttig zijn voor datawetenschappers en ingenieurs die AI-gestuurde datawetenschapssystemen ontwikkelen. Door een methode te bieden waarmee het systeem de visualisaties die het weergeeft beter kan begrijpen, Pixel Approximate Entropy zal de ontwikkeling van intelligentere datawetenschapssystemen helpen stimuleren.

"Bijvoorbeeld, bij industriële besturing kan het nodig zijn dat een operator trends in uitlezingen van verschillende systeemmonitors in de loop van de tijd observeert en erop reageert, zoals bij een chemische of elektriciteitscentrale, " Ryan voegt toe. "Een systeem dat zich bewust is van de complexiteit van kaarten, zou uitlezingen kunnen aanpassen om ervoor te zorgen dat de operator belangrijke trends kan identificeren en vermoeidheid kan verminderen bij het proberen om potentieel ruisvolle signalen te interpreteren.

Wu's groep is van plan om datavisualisatie uit te breiden om deze modellen te gebruiken om gebruikers en ontwerpers automatisch te waarschuwen wanneer visualisaties te complex zijn en om afvlakkingstechnieken voor te stellen, en om andere kwantitatieve perceptuele modellen te ontwikkelen die kunnen helpen bij het ontwerpen van dataverwerkings- en visualisatiesystemen.