science >> Wetenschap >  >> Elektronica

Ontgrendelen van effecten op pakketgeheugens op wetenschappelijke kernels met hoge prestaties

Waarschijnlijkheidsdichtheid voor haalbare prestaties (GFlop/s) met 1024 monsters met verschillende tegels en probleemgroottes. Met eDRAM (DRAM =dynamisch willekeurig toegankelijk geheugen), de functiekromme als geheel verschuift naar rechtsboven, wat inhoudt dat meer monsters een bijna-piek kunnen bereiken (bijvoorbeeld 90 procent) prestatie. Met andere woorden, het hebben van eDRAM vergroot de kans voor minder geoptimaliseerde applicaties om "door de leverancier geclaimde" prestaties te bereiken. Echter, de rechter grens beweegt maar een beetje, wat aangeeft dat eDRAM de ruwe piekprestaties niet significant kan verbeteren. Krediet:US Department of Energy

Geheugen met hoge bandbreedte kan de prestaties van een computer verbeteren. On-package memory (OPM) is een populaire optie in veel commerciële systemen. Voordat deze poging er was weinig bekend over de gevolgen van OPM voor snelheid en stroomverbruik. Het team heeft moderne OPM-opslag experimenteel gekarakteriseerd en geanalyseerd. Ze gaven richtlijnen voor het afstemmen van het geheugen om high-performance computing (HPC)-toepassingen te versnellen.

Deze studie over OPM's is zowel essentieel als fundamenteel voor geavanceerde computersystemen. Bijvoorbeeld, het motiveert software-architectuur co-design verkenning. Verder, het valideert modellen en simulaties. Het heeft ook geresulteerd in algemene optimalisatierichtlijnen. Het werk laat zien hoe applicaties en architecturen kunnen worden afgesteld voor de beste prestaties op platforms met bepaalde OPM's.

De onderzoekers voerden een grondige experimentele evaluatie uit om te onderscheiden hoe moderne OPM's de prestaties en energie-efficiëntie van belangrijke wetenschappelijke HPC-kernels beïnvloedden, die het kernbesturingssysteem van een computer vormen. Ze onderzochten verschillende afstemmingsmodi van OPM en hoe deze het afstemmen van applicaties beïnvloedden voor de beste systeemprestaties. Het team van Pacific Northwest National Laboratory, Universiteit van Kopenhagen, en Virginia Tech evalueerden diverse HPC-kernels op twee Intel OPM's, eDRAM op multicore Broadwell en MCDRAM op Manycore Knights Landing, met een grote set van hun representatieve invoermatrices (bijvoorbeeld 968 matrices voor schaarse kernels). Dankzij deze studie kon het team een ​​intuïtief visueel analytisch model afleiden om complexe architecturale scenario's beter uit te leggen, evenals algemene richtlijnen voor toekomstige architectuuroptimalisaties en efficiëntieafstemming.