science >> Wetenschap >  >> Elektronica

Big data-analyse voor dummies

Krediet:dani3315, Shutterstock

Big Data is nog steeds een elite-zaak:alleen de meest IT-vaardige en rijke bedrijven hebben een kans om het oppervlak van het potentieel ervan te doorbreken. Dit alles zou kunnen veranderen dankzij een Big Data-analyseplatform dat is ontwikkeld in het kader van het TOREADOR-project, die automatisch alle grote problemen met betrekking tot on-demand gegevensvoorbereiding afhandelt.

"De verwachtingen van Big Data zijn erg hoog, maar de kloof tussen ambitie en uitvoering is nog steeds groot, speciaal voor het MKB, " Dr. Ernesto Damiani zucht. En hij kan het weten:sinds begin 2016, Dr. Damiani heeft een 10-koppig consortium geleid dat de redenen voor deze gemengde fortuinen en de mogelijke oplossingen onderzocht.

Als relatief weinig MKB-bedrijven Big Data-analyse hebben opgenomen in hun aanbod of interne processen, het is voornamelijk om twee redenen. De eerste is een gebrek aan competentie in Big Data-analyse, zoals Dr. Damiani uitlegt. Een bedrijf dat graag bijvoorbeeld, om het aanbod af te stemmen op het gedrag van de klant met behulp van een gratis app zou een beroep moeten worden gedaan op zeer dure consultancy. Het is momenteel de enige manier om bedrijfsdoelen toe te wijzen aan een klasse van datawetenschaps- en technologieoplossingen.

"Concreet, de projectopdracht zou iets kunnen zijn in de trant van 'verzamel de gebeurtenissen die worden gegenereerd door de apps van kernklanten en gebruik ze om een ​​schaalbare random-forest classifier met meerdere categorieën van hun gedrag te trainen om te worden ingezet op een openbare cloudservice', " hij zegt.

De tweede reden is de lange uitroltijd en, opnieuw, de onbetaalbare kosten van Big Data-campagnes, zelfs wanneer de datawetenschapsbenadering al is geïdentificeerd. Samen, deze problemen hebben het MKB en niet-ICT-savvy bedrijven weggehouden van Big Data-analyses, hoewel ze een aanzienlijk deel van de productieruggengraat van de EU uitmaken.

De TOREADOR (TrustwOrthy model-aware Analytics Data platfORm)-methodologie en toolkit bieden een oplossing voor beide problemen:ze automatiseren en vermarkten Big Data-analyses, terwijl het afstemmen op domeinspecifieke klantvereisten veel gemakkelijker is dan voorheen.

Het TOREADOR-framework ondersteunt twee geautomatiseerde transformaties. De eerste gaat uit van een machineleesbaar declaratief model dat de doelen van de gegevenseigenaar verzamelt, en eindigt in een technologieonafhankelijk semantisch-bewust procedureel model dat de uit te voeren berekening beschrijft. Vervolgens, de tweede transformatie bouwt voort op het procedurele model om een ​​technologieafhankelijk implementatiemodel te berekenen. Dit laatste kan worden uitgevoerd op een Apache-platform, bij de klant, op commerciële clouddiensten zoals AWS, als uitvoerbare Python-code op het Azure-platform of als een Docker-container.

"Onze declaratieve modellen kunnen de bedrijfsdoelen van Big Data-campagnes interactief verzamelen en de TOREADOR-toolkit in staat stellen om automatisch advies te geven over de haalbaarheid van oplossingen. Onze procedurele modellen bieden vervolgens een innovatieve beschrijving van de Big Data-analyseberekening in de OWL/S-semantiek- bewuste normen, en onze compilers vertalen deze proceduremodellen naar volledig uitvoerbare workflows of zelfs naar native parallelle Python-code. We kijken naar een iteratief ontwikkelingsproces, waar niet-IT-vaardige gebruikers snel een campagne kunnen opzetten door een workflow-uitvoerbaar bestand te genereren op een openbare cloudservice, en vervolgens - indien nodig - ontwikkelaars in te schakelen voor het genereren van op zichzelf staande Python-code, " legt Dr. Damiani uit.

Projectpartners hebben al vier industriële pilots geïdentificeerd op het gebied van voorspellend onderhoud van vliegtuigmotoren, voorspellend beheer van zonne-energiecentrales, analyse van bedrijfstoepassingslogboeken, en clickstreams-analyse voor e-commercetoepassingen.

"Het TOREADOR-platform is beschikbaar en is geïmplementeerd op de vier proeflocaties. Het is ook beschikbaar gesteld als een gratis pre-release voor geselecteerde leden van de TOREADOR-gemeenschap, die is samengesteld uit Europese bedrijven (waarvan verschillende KMO's) die zijn aangeworven met de hulp van TAIGER (Spanje), een innovatieve kmo in het TOREADOR-consortium. Details over deze early adopters zijn beschikbaar op onze website. Daarnaast, de TOREADOR-methodologie is vrijgegeven voor andere Europese projecten met behulp van Big Data-campagnes zoals EVOTION, " zegt Dr. Damiani.

De oplevering van het project staat gepland voor eind 2018. het consortium is van plan de catalogus van beschikbare diensten op het platform te blijven uitbreiden en voorbeelden te geven van door TOREADOR ondersteunde Big Data-campagnes, inclusief training en implementatie van geavanceerde machine learning-modellen.