science >> Wetenschap >  >> Elektronica

Gegevens van sociale media die worden gebruikt om mislukkingen in de detailhandel te voorspellen

Krediet:CC0 Publiek Domein

Onderzoekers hebben een combinatie van sociale media en transportgegevens gebruikt om de kans te voorspellen dat een bepaald retailbedrijf zal slagen of mislukken.

Met behulp van informatie uit tien verschillende steden over de hele wereld, de onderzoekers, onder leiding van de Universiteit van Cambridge, hebben een model ontwikkeld dat met 80% nauwkeurigheid kan voorspellen of een nieuw bedrijf binnen zes maanden zal falen. De resultaten worden gepresenteerd op de ACM Conference on Pervasive and Ubiquitous Computing (Ubicomp), vindt deze week plaats in Singapore.

Hoewel de detailhandel altijd risicovol is geweest, de afgelopen jaren hebben de winkelstraten een transformatie ondergaan naarmate meer en meer retailers falen. Het model dat door de onderzoekers is gebouwd, kan nuttig zijn voor zowel ondernemers als stedenbouwkundigen bij het bepalen waar ze hun bedrijf willen vestigen of in welke gebieden ze willen investeren.

"Een van de belangrijkste vragen voor elk nieuw bedrijf is de hoeveelheid vraag die het zal ontvangen. Dit houdt rechtstreeks verband met hoe waarschijnlijk het is dat het bedrijf zal slagen, " zei hoofdauteur Krittika D'Silva, een Gates-geleerde en Ph.D. student aan Cambridge's Department of Computer Science and Technology. "Wat voor soort statistieken kunnen we gebruiken om die voorspellingen te doen?"

D'Silva en haar collega's gebruikten meer dan 74 miljoen check-ins van het locatiegebaseerde sociale netwerk Foursquare uit Chicago, Helsinki, Jakarta, Londen, Los Angeles, New York, Parijs, San Francisco, Singapore en Tokio; en gegevens van 181 miljoen taxiritten vanuit New York en Singapore.

Met behulp van deze gegevens, de onderzoekers hebben locaties ingedeeld naar de eigenschappen van de buurten waarin ze zich bevonden, de bezoekpatronen op verschillende tijdstippen van de dag, en of een buurt bezoekers uit andere buurten trok.

"We wilden de voorspellende kracht van statistieken over een plaats op een bepaald moment beter begrijpen, ' zei D'Silva.

Of een bedrijf slaagt of faalt, is normaal gesproken gebaseerd op een aantal beheersbare en onbeheersbare factoren. Beheersbare factoren kunnen de kwaliteit of prijs van het product van de winkel zijn, de openingstijden en de klanttevredenheid. Oncontroleerbare factoren zijn onder meer de werkloosheidscijfers van een stad, algemene economische omstandigheden en stedelijk beleid.

"We ontdekten dat zelfs zonder informatie over een van deze oncontroleerbare factoren, we kunnen nog steeds locatiespecifieke, locatiegerelateerde en op mobiliteit gebaseerde functies bij het voorspellen van de waarschijnlijke ondergang van een bedrijf, ' zei D'Silva.

Uit de gegevens bleek dat in alle tien steden, locaties die de klok rond populair zijn, in plaats van alleen op bepaalde momenten van de dag, hebben meer kans van slagen. Aanvullend, locaties waar veel vraag naar is buiten de typische populaire uren van andere locaties in de buurt, hebben de neiging om langer te overleven.

De gegevens suggereerden ook dat locaties in verschillende buurten, met meerdere soorten bedrijven, hebben de neiging om langer te overleven.

Hoewel de tien steden bepaalde overeenkomsten vertoonden, de onderzoekers moesten ook rekening houden met hun verschillen.

"De statistieken die nuttige voorspellers waren, variëren van stad tot stad, wat suggereert dat factoren steden op verschillende manieren beïnvloeden, "zei D'Silva. "Als een voorbeeld, dat de reissnelheid naar een locatie alleen in New York en Tokio een belangrijke maatstaf is. Dit kan te maken hebben met de snelheid van het vervoer in die steden of misschien met de verkeerssnelheid."

Om de voorspellende kracht van hun model te testen, de onderzoekers moesten eerst bepalen of een bepaalde locatie was gesloten binnen het tijdvenster van hun dataset. Vervolgens hebben ze het model 'getraind' op een aantal locaties, het model vertellen wat de kenmerken van die locaties waren in het eerste tijdvenster en of de locatie in een tweede tijdvenster open of gesloten was. Vervolgens testten ze het getrainde model op een andere subset van de gegevens om te zien hoe nauwkeurig het was.

Volgens de onderzoekers is hun model laat zien dat bij de beslissing wanneer en waar een bedrijf te openen, het is belangrijk om verder te kijken dan de statische kenmerken van een bepaalde buurt en na te denken over de manieren waarop mensen zich op verschillende tijdstippen van de dag naar en door die buurt verplaatsen. Ze willen nu bekijken hoe deze kenmerken in verschillende buurten variëren om de nauwkeurigheid van hun model te verbeteren.