Wetenschap
De ontwikkeling is gestart op het softwareplatform Tapis, die tot doel heeft onderzoekers te helpen gemakkelijker krachtige supercomputers te gebruiken en gegevens uit verschillende en verre bronnen te integreren en te beheren. Krediet:TACC/UH
Wetenschappers die hun complexiteit voor onderzoek willen verminderen en een nieuwe rekentool aan hun gereedschapsriem willen toevoegen, kunnen het Tapis-project verkennen. Het Tapis-softwareplatform is bedoeld om onderzoekers te helpen gemakkelijker krachtige supercomputers te gebruiken en gegevens uit verschillende en verre bronnen te integreren en te beheren.
De National Science Foundation (NSF) heeft een subsidie van $ 2,9 miljoen toegekend aan het Texas Advanced Computing Center (TACC) en de Universiteit van Texas in Austin (UT Austin), naast een prijs van $ 1 miljoen aan de Universiteit van Hawaï (UH). De NSF-awards zijn in september 2019 gestart en ondersteunen de verdere ontwikkeling van Tapis, afkorting voor TACC-API's en speelt af van het woord tapijt - diensten en mogelijkheden samenvoegen. Een Application Programming Interface (API) is een interface naar een softwaresysteem dat is gebouwd of ontwikkeld voor gebruik door een ander programma.
"Tapis is een onderzoekscomputerplatform voor computationele wetenschap en computationeel onderzoek, " zei hoofdonderzoeker (PI) Joe Stubbs, die de Cloud en Interactive Computing Group bij TACC beheert. "Tapis is een softwaresysteem dat onderzoekers helpt bij het gebruik van de supercomputers en andere soorten computerbronnen die we hier bij TACC en op andere plaatsen hebben."
"De gemakkelijkste manier om Tapis te beschrijven, is dat het een webgebaseerde applicatie is die alle tools biedt die een moderne wetenschapper nodig heeft om data-intensieve, rekenintensief onderzoek, " zei Co-PI Gwen A. Jacobs, directeur cyberinfrastructuur, Universiteit van Hawaï Systeem. "Een van de dingen die anders is aan Tapis, is dat het alle belangrijke tools verweeft die de onderzoeker nodig heeft. Dat is de echte kracht van Tapis."
Tapis zal een diverse groep gebruikers bedienen met verschillende expertise in het gebruik van computationele tools voor hun onderzoek. Aan de ene kant van het spectrum bevinden zich 'power users' met uitgebreide ervaring op het gebied van geavanceerde computerbronnen en programmeren. Tapis helpt hen bij het automatiseren en stroomlijnen van hun grote workflows of pijplijnen van softwareapplicaties.
Aan de andere kant van het spectrum beginnen wetenschappers net de mogelijkheden aan te boren om geavanceerde computers toe te passen op hun onderzoek. "Wat we voor hen proberen te doen met Tapis, " zei Stubbs, "Het is de gemakkelijkste weg om toegang te krijgen tot het uitvoeren van computerprogramma's op de supercomputers."
En dan is er de groep in het midden, typisch grote softwareontwikkelingsprojecten gericht op specifieke onderzoeksdomeinen, zoals immunologie, astronomie, of bio-informatica.
"Het doel van Tapis is om onderzoekers in staat te stellen op een gebruiksvriendelijkere manier toegang te krijgen tot deze computerbronnen, ' zei Stubbs.
De door het NSF gefinancierde computerbronnen worden algemeen omschreven als cyberinfrastructuur, het online ecosysteem dat door onderzoekers wordt gedeeld, ondersteund door geavanceerde computerbronnen, gehost in datacenters, en ondersteund door deskundigen. "Teams van webontwikkelaars en andere ontwikkelaars van die cyberinfrastructuurprojecten kunnen Tapis gebruiken om hun cyberinfrastructuurproject sneller te bouwen."
Om deze doelen, een voorbeeld is de TAPIS API-framework-ondersteuning voor het streamen van sensorgegevens, waar in een complexe workflow, een evenement, zoals een detectie op een sensorarray, kan een andere gebeurtenis activeren, enzovoort, of zelfs meerdere analyseroutines.
"Gebeurtenisgestuurd computergebruik, " legde Jacobs uit, "betekent dat de workflow niet de hele tijd draait. Dat is een geweldige functie voor wetenschappers die hun gegevens sporadisch moeten verkrijgen, waar ze gegevens krijgen van bronnen zoals sensoren en gegevensuploads. Dit betekent dat ze niet alle code handmatig hoeven uit te voeren. Zodra de workflow is ingesteld, het kan handsfree computeren zijn, op een manier, handsfree analyse."
Tapis zal de Cloud-Hosted Real-time Data Services voor het Geosciences (CHORDS) project integreren, onderdeel van de NSF-gefinancierde EarthCube, event-driven computing te realiseren.
De op de wetenschap toegepaste API's zorgen ervoor dat verschillende systemen met elkaar kunnen praten, in zekere zin. "Het idee met Tapis, " zei Stubbs, "is het hebben van een machineleesbare en verbruikbare interface voor computerbronnen, zoals supercomputers, maar ook hoogwaardige opslagsystemen, zoals ons Corral-opslagsysteem, of ons wereldwijde bestandssysteem, Veehouderij, en andere bestandssystemen in het hele land. We willen een interface hebben die gemakkelijk toegankelijk is en kan worden gemanipuleerd in andere programma's."
Een andere functie die Tapis zal bieden, is een nieuwe beveiligingskernel, die fungeert als een poort die de toegang tot systeembronnen regelt. De Tapis-beveiligingskernel wordt gedecentraliseerd, waardoor wetenschappers gemakkelijker hun eigen applicaties kunnen opzetten en lokale controle over vertrouwelijke gegevens kunnen behouden.
"De nieuwe beveiligingskernel stelt ons in staat om alle beheerde beveiliging, authenticatie, en autorisaties die in het verleden zijn gedaan, " zei Co-PI Sean Cleveland, een onderzoeker op het gebied van cyberinfrastructuur aan de Universiteit van Hawaï. "Maar het zal datacenters en instellingen ook in staat stellen hun eigen beveiligingskernel te implementeren, zodat ze hun eigen gebruikersgegevens kunnen gebruiken en hun eigen beveiliging op hun eigen manier kunnen beheren, en om individuele componenten van het raamwerk in hun instelling in te zetten, en in staat zijn om gebruik te maken van een deel van het gecentraliseerde werk. Het is een nieuwe, hybride systeem van het gebruik van de science-as-a-service, platform-as-a-service, maar als u meer controle en maatwerk wilt, u kunt kleinere stukken ter plaatse inzetten en toch gebruik maken van enkele van de grotere, beheerde componenten voor verschillende behoeften."
Tapis geeft gebruikers de mogelijkheid om het proces van het maken van applicaties te vereenvoudigen, een krachtig hulpmiddel voor wetenschappers. "Als je een workflow kunt programmeren en die workflow kunt laten draaien op een platform als Tapis, dat maakt het proces eenvoudiger omdat alle componenten gemakkelijker met elkaar kunnen praten, ' zei Jacobs. 'Dat betekent dat de onderzoeker die workflow een keer moet bouwen. Die workflow slaan ze vervolgens op als applicatie binnen de Tapis-infrastructuur en hergebruiken ze."
Door alle parameters van de softwareomgeving op te slaan, kunnen wetenschappers ook teruggaan en de gegevensanalyse op een later tijdstip opnieuw uitvoeren, die de wetenschappelijke reproduceerbaarheid bevordert.
"Dit is echt een volledige samenwerking tussen TACC en de Universiteit van Hawaï, ’ legt Stubbs uit.
TACC brengt uitgebreide expertise in high performance computing en in het bouwen van gedistribueerde softwaresystemen. De componenten van Tapis zelf kunnen op grondstoffen draaien, of kant-en-klare servers, hoewel sommige componenten bij TACC op de door NSF gefinancierde Jetstream-cloud zullen draaien.
Teamleden van UH dragen bij aan de ontwikkeling, ontwerp, en architectuur van het Tapis-systeem. Bovendien, ze bieden toegang tot een overvloed aan belangrijk domeinonderzoek dat uniek is voor Hawaï op gebieden zoals klimaat, oceaan, koraalrif, menselijk microbioom, en bevolkingsonderzoeken rond gezondheidsverschillen.
"Het Tapis-project voor ons hier in Hawaï is een enorme bewustwordingsboost voor het toepassen van geavanceerde cyberinfrastructuur op data-intensieve wetenschap, ", zei Jacobs. "Zonder een project als dit, veel van onze onderzoekers zijn misschien niet op de hoogte van deze bronnen."
Een van de belangrijkste mijlpalen waar de onderzoekers naartoe werken, is een eindejaarsworkshop voor early adopters in de zomer van 2020. "Het idee is om de workshop te hebben waar we de onderzoekers uitnodigen om te komen, hun datasets meenemen, om presentaties te geven over hun wetenschap en use case, maar ook voor het Tapis-team om tegen het einde van het eerste jaar een presentatie te geven over de mogelijkheden van het systeem, ' zei Stubbs.
"We zijn erg verheugd om het nieuwe door NSF gefinancierde Tapis-project te lanceren, " zei Co-PI Maytal Dahan, Director of Advanced Computing Interfaces bij TACC. "Tapis zal de productiviteit van wetenschappers transformeren door de ontdekking te vergemakkelijken, toegang tot en gebruik van krachtige cyberinfrastructuurmogelijkheden en -diensten. We willen de complexiteit verminderen om wetenschap tot stand te brengen en de time-to-science te verbeteren door een verscheidenheid aan veilige en robuuste API-services aan te bieden die onze gebruikers kunnen ondersteunen in een omgeving van productiekwaliteit.
Het TACC-team zal aan verschillende aspecten van het project werken:de ontwikkeling van een beveiligingskernel, streaming data-API's en integratie, kwaliteitsborging en continue integratietesten, overtreffen, opleiding en personeelsontwikkeling. Ik ben echt trots op het team, zowel bij TACC als UH, en we zijn allemaal enthousiast om vanaf het begin samen te werken met de wetenschappelijke gemeenschap via ons early adopters-programma om diensten te creëren die een positieve impact hebben op de wetenschappelijke gemeenschap."
Het Tapis-project wordt gefinancierd als onderdeel van de Cyberinfrastructure for Sustained Innovation (CSII), een transversaal NSF-programma onder leiding van het Office of Advanced Cyberinfrastructure (OAC). "CSSI ondersteunt de ontwikkeling van innovatieve cyberinfrastructuur die gemeenschappen van onderzoekers in staat stelt de vooruitgang in alle fundamentele wetenschappelijke en technische domeinen die door NSF worden ondersteund, voort te zetten en te versnellen, " zei dr. Stefan Robila, de programmadirecteur in OAC die de prijs beheert. "Door voort te bouwen op eerder werk en gebruik te maken van bestaande computerbronnen voor leiderschap, zoals die beschikbaar zijn bij TACC, Tapis draagt bij aan continue versterking van de nationale cyberinfrastructuur, en tegelijkertijd de drempels om toegang te krijgen te verlagen."
Wetenschap © https://nl.scienceaq.com