science >> Wetenschap >  >> Elektronica

De eerste open-source dataset voor machine learning-applicaties in snel chipontwerp

Voorbeeld van het door Google voorgestelde macro-plaatsingsalgoritme. Krediet:Science China Press

Electronic Design Automation (EDA) of computer-aided design (CAD) is een categorie softwaretools voor het ontwerpen van elektronische systemen, zoals geïntegreerde schakelingen (IC's). Met EDA-tools kunnen ontwerpers de ontwerpstroom van zeer grootschalige geïntegreerde (VLSI)-chips met miljarden transistors voltooien. EDA-tools zijn essentieel voor modern VLSI-ontwerp vanwege de grote schaal en hoge complexiteit van elektronische systemen.

Onlangs, met de opkomst van kunstmatige intelligentie (AI) algoritmen, onderzoekt de EDA-gemeenschap actief AI voor IC-technieken voor het ontwerp van geavanceerde chips. Veel onderzoeken hebben op machine learning (ML) gebaseerde technieken onderzocht voor voorspellingstaken in verschillende fasen in de ontwerpstroom om snellere ontwerpconvergentie te bereiken. Google heeft bijvoorbeeld een artikel gepubliceerd in Nature in 2021 getiteld "A graph placement methodologie for fast chip design", gebruikmakend van wapeningsleren (RL) om macro's in een chipontwerp te plaatsen.

Het basisidee is om de chiplay-out te beschouwen als een Go-bord, terwijl elke macro als een steen. Op deze manier kan een RL-agent vooraf worden getraind met 10.000 interne ontwerpvoorbeelden en leren om één macro tegelijk te plaatsen. Door de agent op elk ontwerp gedurende ongeveer 6 uur te finetunen, kan het de prestaties van conventionele EDA-tools op de TPU-chips van Google overtreffen en betere prestaties, kracht en oppervlakte (PPA) bereiken.

Het is te zien dat "AI voor EDA" actief wordt verkend in de ontwerpautomatiseringsgemeenschap. Hoewel het bouwen van ML-modellen meestal een grote hoeveelheid gegevens vereist, kunnen de meeste onderzoeken slechts kleine interne datasets genereren voor validatie, vanwege het ontbreken van grote openbare datasets en de moeilijkheid bij het genereren van gegevens. Hiertoe is een open-source dataset gewijd aan ML-taken in EDA dringend gewenst.

Algehele stroom voor gegevensverzameling en functie-extractie. Krediet:Science China Press

Om dit probleem aan te pakken, heeft de onderzoeksgroep van de Universiteit van Peking de eerste open-source dataset uitgebracht, CircuitNet genaamd, die is gewijd aan AI voor IC-toepassingen in VLSI CAD. De dataset bestaat uit meer dan 10K-samples en 54 gesynthetiseerde circuitnetlijsten van zes open-source RISC-V-ontwerpen, biedt holistische ondersteuning voor voorspellingstaken over meerdere fasen en ondersteunt taken zoals voorspelling van routeringscongestie, ontwerpregelcontrole (DRC) overtredingsvoorspelling en IR daling voorspelling. De belangrijkste kenmerken van CircuitNet kunnen als volgt worden samengevat:

  1. Grootschalig:de dataset bestaat uit meer dan 10K-samples die zijn geëxtraheerd uit veelzijdige reeksen commerciële EDA-tools met commerciële PDK's (momenteel in 28nm-technologieknooppunt en zal binnenkort 14nm-technologie ondersteunen).
  2. Diversiteit:verschillende instellingen in logische synthese en fysiek ontwerp worden geïntroduceerd om verschillende situaties in de ontwerpstroom weer te geven.
  3. Meerdere taken:de dataset ondersteunt drie voorspellingstaken, d.w.z. congestievoorspelling, DRC-schendingsvoorspelling en IR-dalingsvoorspelling. De dataset bevat functies die algemeen worden toegepast in de modernste methoden en is gevalideerd door middel van experimenten.
  4. Gebruiksvriendelijke indelingen:functies worden voorverwerkt en omgezet in Numpy-arrays, waarbij beperkte informatie is verwijderd. Gebruikers kunnen de gegevens eenvoudig laden via Python-scripts.

Drie cross-stage voorspellingstaken:congestie, DRC-overtredingen en IR-drop. Krediet:Science China Press

Om de effectiviteit van CircuitNet te evalueren, valideren de auteurs de dataset door experimenten op drie voorspellingstaken:congestie, DRC-overtredingen en IR-drop. Elk experiment neemt een methode uit recente onderzoeken en evalueert het resultaat op CircuitNet met dezelfde evaluatiestatistieken als de originele onderzoeken. Over het algemeen zijn de resultaten consistent met de originele publicaties, wat de effectiviteit van CircuitNet aantoont. Een gedetailleerde tutorial over de experimentele opstelling is beschikbaar op GitHub. In de toekomst zijn de auteurs van plan om meer datasamples met grootschalige ontwerpen op te nemen in geavanceerde technologieknooppunten om de schaal en diversiteit van de dataset te verbeteren.

Het onderzoek is gepubliceerd in Science China Information Sciences . + Verder verkennen

City digital twins helpen bij het trainen van deep learning-modellen om gevels van gebouwen te scheiden