Wetenschap
Na het uitvoeren van een sentimentanalyse van meer dan 36, 000 tweets, een jonge onderzoeker van KTU, Litouwen heeft een schaal gemaakt die aangeeft hoe de bewoners en bezoekers het emotionele klimaat van de verschillende buurten van Manhattan beoordelen. Krediet:Juste Suminaite/KTU
Een jonge onderzoeker van de Kaunas University of Technology (KTU), Litouwen – Domantas Didziapetris – heeft een op kunstmatige intelligentie gebaseerde oplossing gemaakt voor het meten van het emotionele klimaat in Manhattan, New York. Na het uitvoeren van een sentimentanalyse van meer dan 36 duizend tweets, hij creëerde een schaal die aangeeft hoe de bewoners en bezoekers het emotionele klimaat van de verschillende buurten van Manhattan beoordelen.
New York is een van 's werelds meest bezochte steden. Volgens de officiële gegevens in 2018, New York City verwelkomde een record van 65,2 miljoen bezoekers, en het aantal groeit voortdurend. Manhattan, de dichtstbevolkte van de vijf stadsdelen van New York City, heeft een bevolking van 2,7 miljoen en trekt jaarlijks bijna 15 miljoen toeristen.
"Manhattan is het hart van New York City, barst van het leven. En wat is een betere plek om een nieuwe methodologie te testen dan de stad die letterlijk nooit slaapt?", zegt Domantas Didziapetris van de KTU-faculteit Bouwkunde en Civiele Techniek.
Volgens de jonge onderzoeker Bij stadsanalysemethoden wordt vaak nog gebruik gemaakt van papieren of online enquêtes. Toch zijn ze niet altijd betrouwbaar, en de resultaten geven mogelijk niet de werkelijke situatie weer.
“Een blik op een social media platform geeft wellicht meer inzicht in de werkelijke situatie dan een uitgebreide vragenlijst. de hier geuite meningen zijn veel expressiever en impulsiever, omdat mensen de neiging hebben om hun vreugde of teleurstelling online te uiten op het moment dat ze het voelen. Een van de beste platforms om dergelijke gegevens te verzamelen, is Twitter, omdat het het aantal tekens in een bericht beperkt, het is gemakkelijk om de gegevens te depersonaliseren en de overeenkomst om de gegevens te delen is al verleend zodra een gebruiker zich aanmeldt bij Twitter, ", legt Didziapetris uit.
Om de gegevens te verwerken zijn een aantal IT-programma's geschreven. Ten eerste, Python werd gebruikt om software te compileren die de tweets in realtime zou verzamelen. In de periode van ongeveer 4 maanden, meer dan 1 miljoen tweets werden verzameld, 65, 447 van hen hadden geografische coördinaten. Nadat u alle vermeldingen hebt verwijderd, die van buiten Manhattan kwamen, 36, 543 tweets werden verder geanalyseerd, geclassificeerd door de grenzen van de gemeenschapsdistricten zoals geïdentificeerd in het New York City Open Data-portaal.
Ten tweede, de onderzoeker maakte een programma voor sentimentanalyse van de tweets. Er werden twee criteria overwogen:subjectiviteit en polariteit. De subjectiviteit geeft de feitelijke inhoud van de tweet aan en de polariteit - de emotionele toon ervan. Beide criteria kunnen worden beoordeeld van -1 tot +1.
"Hoe hoger de subjectiviteitscriteria, des te minder betrouwbaar is de invoer. Hoe dichter de polariteit bij -1 ligt, hoe minder positief de emotionele toon van de tweet is, ", legt Didziapetris uit.
De resultaten van de sentimentanalyse werden op de kaart geprojecteerd, en, volgens de jonge onderzoeker hierdoor werd duidelijk welke buurten, bij wijze van spreken, vrolijk, en welke - niet zo veel. De Upper West Side had het minst gunstige emotionele klimaat in Manhattan.
De Upper West Side is nog steeds een te groot gebied om conclusies over te trekken; daarom, het was noodzakelijk om de werkelijke locatie vast te stellen die zou moeten worden herzien en verder ontwikkeld.
Om deze taak te voltooien, de "Urban Network Analysis Toolbox voor ArcGIS, " een toolkit gemaakt door MIT in 2011, voor stedelijke netwerkanalyse werd gebruikt. Een van de methodes, betweenness, wordt doorgaans gebruikt om het potentieel van voorbijgangers in het netwerk te berekenen en in te schatten. Hoe beter bereikbaar het gebied is, de warmer (rood) is de kleur op de kaart.
"Hoe minder bereikbaar het gebied, hoe meer verlaten het is, en de verlaten gebieden zijn meestal meer vatbaar voor criminele activiteiten. Na analyse van het stedelijke netwerk, een van de buurten in de buurt zag er bijzonder verdacht uit - na de visualisatie, het werd blauw en groen. Mijn hypothese werd bewezen direct nadat ik de foto's uit het gebied had ontvangen. Simpel gezegd, het mist veiligheid. Mijn chef, wie heeft de foto's gemaakt, beschreef het algemene gevoel in het gebied als 'onveilig', 'niet gezellig', 'aanmoedigen om zo snel mogelijk te vertrekken', 'oud'. Het echt interessante is dat dit gebied vlakbij actieve en bereikbare gebouwen in het Oosten ligt, zoals Lincoln Center, De Juilliardschool, ' zegt Didziapetris.
Wetenschap © https://nl.scienceaq.com