science >> Wetenschap >  >> Elektronica

Zal de overstap naar de commerciële cloud sommige datagebruikers achterlaten?

Georgia Tech assistent-professor Mariel Borowitz wordt getoond met satellietcommunicatieapparatuur. Een dramatische groei in het genereren en verzamelen van gegevens zal de manier veranderen waarop federale agentschappen gegevens beschikbaar stellen. Krediet:Allison Carter, Georgië Tech

Als onderdeel van hun missies, federale agentschappen genereren of verzamelen enorme hoeveelheden gegevens uit bronnen zoals aardobservatiesatellieten, sensornetwerken en genomics-onderzoek. Veel van die informatie is nuttig voor commerciële en academische instellingen, die nu meestal gratis toegang hebben tot deze openbaar gegenereerde gegevens van de servers van het bureau.

Maar naarmate het datavolume blijft groeien, veel bureaus overwegen het gebruik van commerciële cloudservices om deze op te slaan en beschikbaar te maken voor gebruikers. Hoewel bureaus verschillende strategieën kunnen hebben, deze nieuwe partnerschappen kunnen ertoe leiden dat gebruikersvergoedingen worden geheven op downloads en analyses die worden uitgevoerd op de gegevens terwijl deze in de cloud blijven.

Schrijven in een beleidsforumartikel gepubliceerd op 8 februari in het tijdschrift Wetenschap , een onderzoeker op het gebied van ruimtebeleid van het Georgia Institute of Technology die dergelijk gegevensgebruik bestudeert, dringt aan op voorzichtigheid bij het ontwerp van deze commerciële cloudpartnerschappen en het mogelijk opleggen van gebruikersvergoedingen.

“Onder het huidige systeem gratis en open overheidsgegevens worden door wetenschappers gebruikt om onderzoek te doen, door ondernemers om nieuwe bedrijven op te richten, en door burgers en andere organisaties om de transparantie van de overheid te bevorderen, " zei Mariel Borowitz, een assistent-professor aan de Sam Nunn School of International Affairs van Georgia Tech. "Als gebruikers vergoedingen moeten betalen om de gegevens te downloaden of te analyseren, dit zal het vermogen van deze gebruikers om toegang te krijgen tot en te werken met gegevens verminderen. Ervaringen uit het verleden suggereren dat de gevolgen van deze afname van het datagebruik groot kunnen zijn, zowel voor individuele gebruikers als voor de samenleving als geheel."

Het verplaatsen van gegevens naar commerciële cloudsystemen zou waarschijnlijk bredere toegang en efficiëntere analyse-opties bieden, maar ze waarschuwt dat die voordelen kunnen worden gecompenseerd door de kosten, vooral voor organisaties met kleine budgetten.

"Agentschappen lopen het risico een deel van de voordelen van deze overgang te verliezen door niet te budgetteren voor de kosten die gepaard gaan met het downloaden en analyseren van gegevens, tot een redelijk niveau, " zei Borowitz. "Velen die geïnteresseerd zouden zijn in het gebruik van de gegevens, kunnen de bijbehorende vergoedingen misschien niet betalen. onderzoekers, non-profitorganisaties en anderen die niet direct profiteren van het gebruik van deze gegevens worden het meest getroffen."

Borowitz werkte onlangs twee jaar bij NASA en was getuige van zowel de ontwikkeling van systemen die het verzamelen van gegevens drastisch zullen vergroten als discussies over toekomstige gegevensopslag. Onlangs schreef ze een boek, Open Space:de wereldwijde inspanning voor open toegang tot milieusatellietgegevens, uitgegeven door MIT Press.

Ze zou graag zien dat de instanties die gegevens verstrekken de kosten blijven dragen, tot een "redelijk niveau, " om ervoor te zorgen dat de gegevens gemakkelijk beschikbaar blijven voor alle gebruikers. Als alternatief voor commerciële diensten, sommige agentschappen overwegen om hun eigen te ontwikkelen, op maat gemaakte cloudoplossingen, en zal de kosten van baten van de verschillende opties moeten afwegen. Er zullen ook technische, organisatorische en beleidskwesties te overwegen.

"Agentschappen nemen ernstige problemen op het gebied van beveiliging en langetermijnbewaring van gegevens, " Borowitz toegevoegd. "Bij het werken met commerciële providers, sommigen maken zich zorgen over de mogelijkheid om 'aangesloten' te raken bij één provider, vanwege de hoge kosten van het migreren van gegevens van het ene systeem naar het andere. Het is mogelijk dat kosten en mogelijkheden in de loop van de tijd veranderen. Anderzijds, commerciële cloudproviders hebben een groot personeelsbestand en een uitgebreide infrastructuur waarmee ze diensten en mogelijkheden kunnen bieden die veel verder gaan dan wat een enkel bureau zou kunnen onderhouden."

Borowitz merkt op dat de meeste bureaus nog geen definitieve beslissingen hebben genomen over hun cloudgebaseerde programma's, er moet dus voldoende tijd zijn om deze problemen op te lossen.

Georgia Tech assistent-professor Mariel Borowitz wordt getoond met satellietcommunicatieapparatuur. Een dramatische groei in het genereren en verzamelen van gegevens zal de manier veranderen waarop federale agentschappen gegevens beschikbaar stellen. Krediet:Allison Carter, Georgië Tech

"De meeste bureaus die gegevens openbaar maken, met name wetenschappelijke bureaus, al in gesprek zijn en/of beginnen met de overstap naar cloudsystemen, "zei ze. "Echter, deze programma's - bij bureaus zoals NSF, NIH, NASA en NOAA - bevinden zich nog in de beginfase, en er is nog ruimte voor feedback en aanpassingen in de programma's."

Het bestaan ​​van vergoedingen voor toegang tot overheidsgegevens is niet zonder precedent, maar Borowitz stelt dat ervaringen uit het verleden suggereren dat gebruikersvergoedingen leiden tot aanzienlijk minder gebruik. Voordat Landsat-gegevens - satellietbeelden van de aarde - in 2008 vrij beschikbaar werden gesteld niet meer dan 25, Uit de collectie werden jaarlijks 000 beelden aangekocht. "Binnen een paar jaar na de implementatie van het vrije en open databeleid, de regering verdeelde 250, 000 afbeeldingen per maand, " ze zei.

Dat cijfer geeft een idee van waar de vaak krappe bureaus mee te maken hebben. Volgens het blad, de National Oceanic and Atmospheric Administration (NOAA) herbergt meer dan 100 petabyte (PB) aan gegevens en genereert meer dan 30 PB per jaar van satellieten, radars, computermodellen en andere bronnen. NASA voorspelt dat zijn archief tegen 2025 zal groeien tot 250 PB. En de hoeveelheid genomische gegevens bij de National Institutes of Health groeit exponentieel.

Een petabyte is 1, 024 terabyte, of een miljoen gigabyte. Een gigabyte is 1, 024 megabyte. voor schaal, een gemiddelde foto gemaakt door een geavanceerde mobiele telefooncamera kan in de buurt van 10 megabyte zijn. Laptopcomputers kunnen tot enkele terabytes aan gegevens opslaan.

Borowitz ziet de overgang naar cloud computing als zowel een kans als een uitdaging voor de toekomstige beschikbaarheid van overheidsgegevens. "De beslissingen die nu worden genomen over de structuur van deze programma's hebben het potentieel om een ​​aanzienlijke impact te hebben op onderzoekers en de samenleving als geheel, dus het is belangrijk om het bewustzijn en de betrokkenheid bij deze kwesties te vergroten."