Wetenschap
Dit is een mimetisch diagram (a) van 3D-gegevensvermenigvuldiging via CuboidMM en een mimetisch diagram (b) van gegevensverwerkingsberekening met behulp van GPU. Krediet:DGIST
DGIST kondigde op 4 juli aan dat het team van professor Min-Soo Kim in de afdeling Informatie- en Communicatietechniek de DistME-technologie (Distributed Matrix Engine) heeft ontwikkeld die 100 keer meer gegevens kan analyseren, 14 keer sneller dan de bestaande technologieën. Deze nieuwe technologie zal naar verwachting worden gebruikt in machine learning waarvoor big data-verwerking of verschillende industriegebieden nodig zijn om in de toekomst grootschalige gegevens te analyseren.
'Matrix'-gegevens, die getallen in rij en kolom uitdrukt, is de meest gebruikte vorm van gegevens op verschillende gebieden, zoals machine learning en wetenschappelijke technologie. Terwijl 'SystemML' en 'ScaLAPACK' worden beoordeeld als de meest populaire technologieën om matrixgegevens te analyseren, maar de verwerkingscapaciteit van bestaande technologie heeft onlangs zijn grenzen bereikt met de groeiende hoeveelheid gegevens. Het is vooral moeilijk om vermenigvuldigingen uit te voeren, die nodig zijn voor de gegevensverwerking, voor big data-analyse met de bestaande methoden omdat ze geen elastische analyse en verwerking kunnen uitvoeren en een enorme hoeveelheid netwerkgegevensoverdracht vereisen voor verwerking.
In antwoord, Het team van professor Kim ontwikkelde een methode voor gedistribueerde matrixvermenigvuldiging die verschilt van de bestaande. Ook wel CuboidMM genoemd, deze methode vormt matrixvermenigvuldiging in een 3D-hexahedron en verdeelt en verwerkt vervolgens tot meerdere stukken die kubussen worden genoemd. De optimale grootte van de kubus wordt flexibel bepaald, afhankelijk van de kenmerken van de matrices, d.w.z., de grootte, de dimensie, en schaarste van matrix, om de communicatiekosten te minimaliseren. CuboidMM omvat niet alleen alle bestaande methoden, maar kan ook matrixvermenigvuldiging uitvoeren met minimale communicatiekosten. In aanvulling, Het team van professor Kim bedacht een informatieverwerkingstechnologie door te combineren met GPU (Graphics Processing Unit) die de prestaties van matrixvermenigvuldiging drastisch verbeterde.
De DistME-technologie die is ontwikkeld door het team van professor Kim heeft de verwerkingssnelheid verhoogd door CuboidMM te combineren met GPU, dat is respectievelijk 6,5 en 14 keer sneller dan ScaLAPACK en SystemML en kan 100 keer grotere matrixgegevens analyseren dan SystemML. Verwacht wordt dat het nieuwe toepasbaarheid van machine learning zal openen op verschillende gebieden die grootschalige gegevensverwerking nodig hebben, waaronder online winkelcentra en SNS.
Professor Kim van de afdeling Informatie- en Communicatietechniek zei:'Machine Learning Technology, die wereldwijd de aandacht heeft getrokken, heeft beperkingen in de snelheid voor big data-analyse in matrixvorm en de omvang van de analyseverwerking. De informatieverwerkingstechnologie die deze keer is ontwikkeld, kan dergelijke beperkingen overwinnen en zal niet alleen nuttig zijn voor machinaal leren, maar ook voor toepassingen in bredere reeksen van toepassingen voor gegevensanalyse van wetenschappelijke technologie."
Dit onderzoek werd uitgevoerd door Donghyoung Han, een doctoraat student bij de afdeling Informatie- en Communicatietechnologie als eerste auteur en werd op 3 juli gepresenteerd in ACM SIGMOD 2019, het gerenommeerde academische congres op databasegebied in Amsterdam, Nederland.
De productie van energie uit organische verbindingen, zoals glucose, door oxidatie met behulp van chemische (meestal organische) verbindingen uit een cel als "elektronenacceptoren" wordt fermentatie genoemd. D
Wetenschap © https://nl.scienceaq.com