science >> Wetenschap > >> Elektronica

Onderzoekers bouwen een model dat bedrijfssluitingen in steden voorspelt met 80% nauwkeurigheid

Gedoemd om te falen? Krediet:Shutterstock

In het afgelopen decennium is veranderingen in de manier waarop mensen winkelen hebben ertoe geleid dat steeds meer bedrijven hun deuren hebben gesloten, van kleine poppodia tot boekwinkels en zelfs grote warenhuizen. Deze trend wordt toegeschreven aan verschillende factoren, waaronder een verschuiving naar online winkelen en veranderende bestedingsvoorkeuren. Maar bedrijfssluitingen zijn complex, en vaak te wijten aan vele met elkaar verweven factoren.

Om een aantal van deze factoren beter te begrijpen en te verklaren, mijn collega's aan de Universiteit van Cambridge en Singapore Management University en ik hebben een machine learning-model gebouwd, die winkelsluitingen voorspelde in tien steden over de hele wereld met een nauwkeurigheid van 80%.

Ons onderzoek heeft gemodelleerd hoe mensen zich door stedelijke gebieden verplaatsen, om te voorspellen of een bepaald bedrijf zal sluiten. Dit onderzoek kan stadsbesturen en ondernemers helpen om betere beslissingen te nemen, bijvoorbeeld over licentieovereenkomsten en openingstijden.

Patroon spotten

Machine learning is een krachtig hulpmiddel dat automatisch patronen in gegevens kan identificeren. Een machine learning-model gebruikt die patronen om hypothesen te testen en voorspellingen te doen. Sociale media bieden een rijke bron van gegevens om de patronen van gebruikers te onderzoeken via hun berichten, interacties en bewegingen. De details in deze datasets kunnen onderzoekers helpen om robuuste modellen te bouwen, met een complex begrip van gebruikerstrends.

Met behulp van gegevens over consumentenvraag en transport, samen met grondwaarheidsgegevens over de vraag of bedrijven daadwerkelijk zijn gesloten, we bedachten metrische gegevens die ons machine learning-model gebruikte om patronen te identificeren. Vervolgens analyseerden we hoe goed dit model voorspelde of een bedrijf zou sluiten, alleen statistieken over dat bedrijf en het gebied waarin het zich bevond.

Onze eerste dataset was van Foursquare, een locatie-aanbevelingsplatform, die incheckgegevens van anonieme gebruikers bevatte en de vraag naar bedrijven in de loop van de tijd vertegenwoordigde. We gebruikten ook gegevens van taxitrajecten, die ons de ophaal- en inleverpunten van duizenden anonieme gebruikers gaf; deze vertegenwoordigden de dynamiek van hoe mensen zich verplaatsen tussen verschillende delen van een stad. We gebruikten historische gegevens van 2011 tot 2013.

We hebben gekeken naar een paar verschillende statistieken. Het buurtprofiel hield rekening met de omgeving van een bedrijf, zoals de verschillende soorten bedrijven die ook actief zijn, evenals concurrentie. Patronen van klantbezoeken gaven weer hoe populair een bedrijf was op een bepaald moment van de dag, vergeleken met zijn lokale concurrenten. En zakelijke kenmerken definieerden basiseigenschappen zoals de prijsklasse en het type bedrijf.

Met deze drie statistieken konden we modelleren hoe sluitingsvoorspellingen verschillen tussen nieuwe en gevestigde locaties, hoe de voorspellingen varieerden tussen steden en welke statistieken de belangrijkste voorspellers van sluiting waren. We waren in staat om de sluiting van gevestigde bedrijven nauwkeuriger te voorspellen, wat suggereerde dat nieuwe bedrijven te maken kunnen krijgen met sluiting door een grotere verscheidenheid aan oorzaken.

Voorspellingen doen

We ontdekten dat verschillende statistieken nuttig waren voor het voorspellen van sluitingen in verschillende steden. Maar in de tien steden in ons experiment – waaronder Chicago, Londen, New York, Singapore, Helsinki, Jakarta, Los Angeles, Parijs, San Fransciso en Tokio – we zagen dat drie factoren bijna altijd significante voorspellers waren van de sluiting van een bedrijf.

De eerste belangrijke factor was de periode waarin een bedrijf populair was. We ontdekten dat bedrijven die zich alleen richten op specifieke klantsegmenten, bijvoorbeeld een café dat populair is bij kantoormedewerkers tijdens de lunch – hebben meer kans om te sluiten. Het deed er ook toe wanneer een bedrijf populair was, vergeleken met zijn concurrenten in de buurt. Bedrijven die populair waren buiten de normale openingstijden van andere bedrijven in het gebied, hadden de neiging om langer te overleven.

We ontdekten ook dat wanneer de diversiteit van bedrijven afnam, de kans op sluiting nam toe. Bedrijven in buurten met een meer diverse mix van bedrijven hadden dus de neiging om langer te overleven.

Natuurlijk, zoals elke dataset, de informatie die we van Foursquare en taxi's hebben gebruikt, is in sommige opzichten bevooroordeeld, omdat de gebruikers mogelijk scheef zijn in de richting van bepaalde demografische gegevens of meer inchecken bij sommige soorten bedrijven dan bij andere. Maar door twee datasets te gebruiken die gericht zijn op verschillende soorten gebruikers, we hoopten die vooroordelen te verminderen. En de consistentie van onze analyse in meerdere steden gaf ons vertrouwen in onze resultaten.

We hopen dat deze nieuwe benadering voor het voorspellen van bedrijfssluitingen met zeer gedetailleerde datasets zal helpen nieuwe inzichten te onthullen over hoe consumenten zich door steden verplaatsen, en informeren over de beslissingen van ondernemers, lokale autoriteiten en stedenbouwkundigen over de hele wereld.

Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.

Crashen of uitwijken? Onderzoek laat zien welke acties van zelfrijdende auto's moreel verdedigbaar zijn

Geavanceerde sensoren houden bruggen, dammen en gebouwen veilig

Hoofdlijnen

Wetenschap

Elektronica
Biologie
Zonsverduistering
Wiskunde
French | Italian | Spanish | Portuguese | German | Dutch | Danish | Norway | Swedish |