science >> Wetenschap >  >> anders

Realistische beursgegevens genereren voor diepgaander financieel onderzoek

Krediet:CC0 Publiek Domein

Financiële markten behoren tot de best bestudeerde en nauwlettend gevolgde complexe systemen die er bestaan. Deze rijke literatuur over marktmodellering en -analyse heeft geleid tot veel belangrijke innovaties, zoals geautomatiseerde tools voor het opsporen van marktmanipulatie. Maar er bestaat nog steeds een grote kloof tussen de huidige state-of-the-art en de krachtige inzichten die nodig zijn om de complexe dimensies van marktgedrag volledig te begrijpen.

uiteindelijk, deze modellen hebben enorme hoeveelheden gegevens nodig, zelfs meer dan wat wordt geproduceerd uit echte voorraadorders. Real-world voorraadordergegevens bieden onderzoekers slechts een beperkte, historisch beeld van het gedrag dat de markt kan vertonen. Modellen vereisen ook hypothetische scenario's en vertakkingsmogelijkheden om dieper onderzoek te informeren.

Een team van de Universiteit van Michigan heeft een antwoord gegeven op deze behoefte in de vorm van automatisch gegenereerde, valse gegevens. Het team, onder leiding van Lynn A. Conway, hoogleraar computerwetenschappen en techniek Michael Wellman, stelt een benadering voor voor het genereren van realistische en betrouwbare aandelenmarktgegevens op basis van een diepgaande leertechniek die generatieve adversariële netwerken (GAN's) wordt genoemd. De resulterende synthetische orderstromen openen vele deuren voor financiële onderzoekers die enorme datasets nodig hebben om de complexe oorzaak-gevolgrelaties te bestuderen die zich elke dag in echte markten voordoen.

In een notendop, GAN's werken door twee leermodellen tegen elkaar te plaatsen, de ene noemde de 'generator' en de andere de 'discriminator'. De twee opereren in een competitieve relatie, waar de generator leert synthetische data uit te spugen op basis van wat hij krijgt, terwijl de discriminator leert het verschil te zien tussen de echte en valse datastromen.

Naarmate de discriminator beter wordt in het opsporen van vervalsingen, de generator wordt er beter in om zijn vervalsingen overtuigender te maken. Het eindresultaat is een generator die de doeldatasets zeer nauwkeurig kan nabootsen; in dit geval, voorraadorderstromen.

Genaamd Stock-GAN, de instantie die door het Michigan-team werd gebruikt, was getraind op twee soorten datasets die waren samengesteld uit aandelenorders:een van een op agenten gebaseerde marktsimulator en een andere van een echte aandelenmarkt. Ze evalueerden hun gegenereerde gegevens met behulp van een verscheidenheid aan statistieken, zoals de verdeling van de prijs en het aantal bestellingen, inter-aankomsttijden van bestellingen, en de evolutie van het beste bod en de beste vraag in de loop van de tijd. De resultaten toonden aan dat hun gegenereerde gegevens nauw overeenkwamen met de overeenkomstige statistieken in echte gegevens, voor zowel de gesimuleerde als de echte markten.

Hoewel dit werk slechts een eerste stap is in de richting van het genereren van realistische orderstromen, zegt Xintong Wang, een doctoraat leerling in het team, "Het uitvoeren van deze taak kan helpen om datasets voor te bereiden die andere taken mogelijk kunnen maken."

Vooral, nieuwe machine learning-algoritmen die gespecialiseerd zijn in geautomatiseerde handel kunnen worden getraind en gevalideerd op de gegenereerde datasets, en geautomatiseerde anomaliedetectie zou mogelijk kunnen worden gemaakt door gegenereerde gegevens te vergelijken met de werkelijke markt.

Zoals Wang het zegt, dit systeem stelt financiële onderzoekers in wezen in staat om alt-geschiedenis te doen, of contrafeitelijk, onderzoek - een techniek die niet mogelijk is wanneer deze wordt beperkt tot real-world orderstromen.

"Echt, historische marktgegevens kunnen worden gezien als één uit de vele mogelijke uitkomsten die door de natuur worden gerealiseerd, " ze legt uit, "en Stock-GAN kan nog veel meer genereren tegen lage kosten."

Naast het veranderen van de geschiedenis, volledig gerealiseerde synthetische aandelengegevens kunnen ook financiële onderzoekers helpen hypothetische scenario's te verkennen, het invoegen van specifieke gegevens in volgordestromen en het observeren van de resulterende permutaties van toekomstige gegevens.

"Dit stelt ons in principe in staat om gebeurtenissen in het systeem te injecteren en een contrafeitelijke evolutie van de markt te observeren, "Wan zegt, "Dat is iets dat we nooit rechtstreeks uit observatiegegevens kunnen halen."

Naast het detecteren van frauduleus of manipulatief gedrag, modellen die op deze gegevens zijn getraind, kunnen onderzoekers inzicht bieden in de verschillende soorten legitieme handelspraktijken die op markten worden uitgeoefend en welke resultaten die opleveren.

"We zouden graag meer in het algemeen willen weten welke soorten strategieën handelaren gebruiken, ", zegt Wellman. "Met die kennis, we konden bepalen wanneer een orderstroom bepaalde strategieën bevat."

De onderzoekers merken ook op dat het uitvoeren van financieel onderzoek naar synthetische gegevens de privacy- en beveiligingsproblemen overwint die gepaard gaan met het publiceren van echte handelsgegevens.

"Algemeen, " schrijven de auteurs, "Ons werk biedt een vruchtbare voedingsbodem voor toekomstig onderzoek op het snijvlak van deep learning en financiën."

Dit onderzoek is gepubliceerd in de paper "Generating Naturally Stock Market Order Streams" op de 2020 Association for the Advancement of Artificial Intelligence (AAAI) Conference.