Wetenschap
Gegevens binnen handbereik hebben is niet genoeg - datawetenschappers moeten weten hoe ze deze moeten toepassen. Krediet:Gorodenkoff/Shutterstock
De wereld wordt overspoeld met data. Er is een virtuele tsunami van gegevens die over de hele wereld gaat, zichzelf dagelijks vernieuwend. Neem alleen de wereldwijde financiële markten. Ze genereren enorme hoeveelheden data – aandelenkoersen, grondstofprijzen, indices, optie- en futuresprijzen, om er een paar op te noemen.
Maar data heeft geen zin als er geen mensen zijn die ze kunnen verzamelen, verzamelen, analyseren en toepassen in het voordeel van de samenleving. Al die gegevens die door de wereldwijde financiële markten worden gegenereerd, worden gebruikt voor vermogens- en vermogensbeheer - en ze moeten goed worden geanalyseerd en begrepen om goede besluitvorming mogelijk te maken. Dat is waar datawetenschap om de hoek komt kijken.
Het primaire doel van data science is om inzicht te verkrijgen uit data in verschillende vormen, zowel gestructureerd als ongestructureerd. Het is een multidisciplinair vakgebied, met alles van toegepaste wiskunde tot statistiek en kunstmatige intelligentie tot machine learning. En het groeit. Dit komt door de vooruitgang in computertechnologie en verwerkingssnelheid, de relatief lage kosten om gegevens op te slaan, en de massale beschikbaarheid van gegevens van internet en andere bronnen, zoals wereldwijde financiële markten.
Om datawetenschap te laten plaatsvinden, natuurlijk, je hebt datawetenschappers nodig. Omdat datawetenschap zo breed is, datawetenschapper zijn omvat een scala aan beroepen. Dit zijn onder meer statistici, operatie onderzoekers, ingenieurs, computer wetenschappers, actuarissen, natuurkundigen en machineleerders.
Deze variëteit is niet per se een slechte zaak. Vanuit mijn eigen praktijkervaring, Ik leerde al snel dat bij het oplossen van datawetenschapsproblemen, je hebt een scala aan mensen nodig. Sommigen kunnen diepgaand aan de theorie werken en anderen kunnen het toepassingsgebied verkennen.
Maar hoe moeten deze datawetenschappers worden opgeleid zodat ze voorbereid zijn op de big data-uitdagingen die voor ons liggen?
Datawetenschappers gebruiken doorgaans innovatieve wiskundige technieken uit hun eigen deelgebieden om problemen in een bepaald toepassingsgebied op te lossen. De toepassingsgebieden – financiën, Gezondheid, landbouw en astronomie zijn slechts enkele voorbeelden - zijn heel verschillend. Dit betekent dat elk andere problemen met zich meebrengt, en dus hebben datawetenschappers kennis nodig over het specifieke toepassingsgebied.
Bijvoorbeeld, overweeg astrofysica en de Square Kilometre Array die wordt gebouwd op de zuidpunt van Afrika. Het zal 's werelds grootste radiotelescoop zijn als het medio 2020 wordt voltooid. Er wordt gezegd dat de reeks telescopen gegevens ontvangt met één terabyte per seconde en onderzoekers zijn doorgaans geïnteresseerd in het analyseren van de massa's gegevens om kleine signalen te detecteren die worden opgeslokt door witte ruis.
op het gebied van financiën, onderzoekers benutten grote databases heel anders:bijvoorbeeld om meer te weten te komen over het kredietgedrag van hun klanten.
De meest gevestigde deelgebieden van datawetenschap zijn statistiek en operationeel onderzoek en het kan de moeite waard zijn om te leren van de gevestigde trainingsprogramma's op deze gebieden. Trainen universiteiten voldoende afgestudeerden op deze gebieden? En is die opleiding goed genoeg?
Hoewel studenten op deze gebieden academisch goed zijn opgeleid, veel afgestudeerden in statistiek en operationeel onderzoek missen kennis over de gebieden waarop ze de wiskundige technieken moeten toepassen. Ze hebben ook de neiging om te vechten met echte probleemoplossende vaardigheden, evenals het ontbreken van vaardigheden op het gebied van numeriek programmeren en gegevensverwerking. Dit komt doordat die vaardigheden in veel curricula onvoldoende aan bod komen.
Dus, puttend uit deze tekortkomingen en de lessen van gevestigde datawetenschapssubvelden, wat moeten universiteiten aspirant-datawetenschappers leren? Hier is mijn lijst.
Deze lijst zou op postdoctoraal niveau kunnen worden uitgebreid. En, of het nu op bachelor- of postdoctoraal niveau is, al deze cursussen moeten een praktisch element hebben. Hierdoor kunnen studenten zowel professionaliteit als probleemoplossende vaardigheden ontwikkelen.
Bijvoorbeeld, bij het Centre for Business Mathematics and Informatics aan de North-West University in Zuid-Afrika, mijn collega's en ik hebben een professioneel trainingsprogramma georganiseerd waarbij studenten zes maanden bij een klantbedrijf werken om een specifiek brancheprobleem op te lossen. Deze problemen liggen vooral op financieel gebied; bijvoorbeeld, modellen om het vermogen en de bereidheid van een klant om te betalen te voorspellen, modellen voor het verbeteren van incasso's en modellen voor fraude-identificatie.
Dit helpt studenten om de nodige vaardigheden te ontwikkelen om in de werkende wereld te functioneren, omgaan met echte gegevens en deze toepassen op echte problemen in plaats van alleen op theoretisch niveau te werken. Het ook, zoals een collega en ik in eerder onderzoek hebben betoogd, helpt de kloof tussen de academische wereld en de industrie te dichten en maakt zo datawetenschap relevanter. De BMI-programma's zijn erkend en geprezen door internationale experts.
gegevenswetenschap, als een veld, zal de komende decennia alleen maar groeien. Het is absoluut noodzakelijk dat universiteiten afgestudeerden opleiden die enorme hoeveelheden data aankunnen, werk nauw samen met de industrieën die deze gegevens produceren en toepassen - en maak van gegevens iets dat de wereld ten goede kan veranderen.
Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.
Wetenschap © https://nl.scienceaq.com