science >> Wetenschap >  >> Fysica

Large Hadron Collider drijft computergebruik tot het uiterste

Rekken met computers in het rekencentrum van CERN vormen slechts een fractie van de hardware die nodig is om de gegevens van de LHC op te slaan en te verwerken. Krediet:Anthony Grossir/CERN

Eind 2018, de Large Hadron Collider (LHC) voltooide zijn tweede meerjarige run ("Run 2"), waarbij de machine een proton-protonbotsingsenergie van 13 TeV bereikte, de hoogste ooit bereikt door een deeltjesversneller. Tijdens deze loop van 2015 tot 2018, LHC-experimenten produceerden ongekende hoeveelheden gegevens, waarbij de prestaties van de machine alle verwachtingen overtroffen.

Dit betekende uitzonderlijk gebruik van computers, met veel records gebroken op het gebied van data-acquisitie, datasnelheden en datavolumes. Het CERN Advanced Storage-systeem (CASTOR), die vertrouwt op een op tape gebaseerde backend voor permanente gegevensarchivering, bereikte 330 PB aan data (gelijk aan 330 miljoen gigabyte) opgeslagen op tape, een equivalent van meer dan 2000 jaar 24/7 HD-video-opname. Alleen al in november 2018 er werd een record van 15,8 PB aan gegevens op band vastgelegd, een opmerkelijke prestatie aangezien het overeenkomt met meer dan wat werd geregistreerd tijdens het eerste jaar van de LHC's Run 1.

Het gedistribueerde opslagsysteem voor de LHC-experimenten overschreed 200 PB aan onbewerkte opslag met ongeveer 600 miljoen bestanden. Dit systeem (EOS) is op schijf gebaseerd en open-source, en is bij CERN ontwikkeld voor de extreme LHC-computervereisten. Zo goed als dit, 830 PB aan gegevens en 1,1 miljard bestanden werden over de hele wereld overgedragen via een bestandsoverdrachtservice. Om deze computeruitdagingen het hoofd te bieden en de CERN-experimenten tijdens Run 2 beter te ondersteunen, de volledige computerinfrastructuur, en met name de opslagsystemen, heeft de afgelopen jaren grote upgrades en consolidatie ondergaan.

Gegevens (in terabytes) die maandelijks bij CERN op band zijn vastgelegd. Deze grafiek toont de hoeveelheid data die op band is opgenomen, gegenereerd door de LHC-experimenten, andere experimenten, verschillende back-ups en gebruikers. in 2018, in totaal meer dan 115 PB aan gegevens (inclusief ongeveer 88 PB aan LHC-gegevens) op band opgenomen, met een recordpiek van 15,8 PB in november. Krediet:Esma Mobs/CERN

Er zijn al nieuwe IT-onderzoeks- en -ontwikkelingsactiviteiten begonnen ter voorbereiding van de LHC's Run 3 (gepland voor 2021 tot 2023). "Onze nieuwe software, genaamd CERN Tape Archive (CTA), is het nieuwe tape-opslagsysteem voor de bewarende kopie van de natuurkundige gegevens en een vervanging voor zijn voorganger, CASTOR. Het belangrijkste doel van CTA is om efficiënter gebruik te maken van de tapedrives, om de verwachte hogere gegevenssnelheid tijdens Run 3 en Run 4 van de LHC aan te kunnen, " legt de Duitse Cancio uit, wie leidt de band, Opslagsectie voor archivering en back-ups in de IT-afdeling van CERN. CTA zal worden ingezet tijdens de aan de gang zijnde tweede lange sluiting van de LHC (LS2), ter vervanging van CASTOR. Vergeleken met het laatste jaar van Run 2, gegevensarchivering zal naar verwachting twee keer zo hoog zijn tijdens run 3 en vijf keer of meer tijdens run 4 (voorzien van 2026 tot 2029).

De computer van de LHC zal blijven evolueren. De meeste gegevens die in het datacenter van CERN worden verzameld, zijn zeer waardevol en moeten worden bewaard en bewaard voor toekomstige generaties natuurkundigen. De IT-afdeling van CERN zal daarom profiteren van LS2, het huidige onderhoud en de upgrade van het versnellercomplex, om de vereiste consolidatie van de computerinfrastructuur uit te voeren. Ze zullen de opslaginfrastructuur en software upgraden om de waarschijnlijke schaalbaarheids- en prestatie-uitdagingen het hoofd te bieden wanneer de LHC in 2021 opnieuw wordt opgestart voor Run 3.