Wetenschappers Gebruiken Minder Dan 1% Van De Gegevens Die Zijn Verzameld Door De Large Hadron Collider - Alternatieve Mening

Wetenschappers Gebruiken Minder Dan 1% Van De Gegevens Die Zijn Verzameld Door De Large Hadron Collider - Alternatieve Mening
Wetenschappers Gebruiken Minder Dan 1% Van De Gegevens Die Zijn Verzameld Door De Large Hadron Collider - Alternatieve Mening

Video: Wetenschappers Gebruiken Minder Dan 1% Van De Gegevens Die Zijn Verzameld Door De Large Hadron Collider - Alternatieve Mening

Video: Wetenschappers Gebruiken Minder Dan 1% Van De Gegevens Die Zijn Verzameld Door De Large Hadron Collider - Alternatieve Mening
Video: Брайан Кокс про суперколлайдер ЦЕРНа 2024, Maart
Anonim

Het is duidelijk wanneer er een probleem is om wetenschappelijke gegevens te verkrijgen. Maar het blijkt dat er een probleem is om ze op te slaan en te verwerken.

De hele reeks spraakmakende ontdekkingen die met de collider zijn gedaan, waren gebaseerd op de analyse van gegevens, waarvan het volume minder dan één procent is van het totale volume aan gegenereerde gegevens.

De rest van de gegevens gaat onherstelbaar verloren.

De 26,7 kilometer lange botsertunnel wordt gebruikt om deeltjes dichtbij de lichtsnelheid te versnellen. Twee deeltjesstromen die in tegengestelde richtingen bewegen, botsen op punten in de ruimte die worden bewaakt door gevoelige sensoren. Zelfs bij de laagste dichtheid van protonenbundels die elk 120 miljard protonen bevatten, is het aantal botsingen 30 miljoen botsingen per seconde.

Volgens informatie die is gepubliceerd op de website van de Europese Organisatie voor Nucleair Onderzoek CERN, zorgt een miljard botsingen per seconde voor een datastroom van 1 petabyte per seconde. En dit is op dit moment het grootste probleem, aangezien een datastroom met een dergelijke snelheid simpelweg onmogelijk is op te slaan, laat staan goed te verwerken. “Bij minimaal 30 miljoen botsingen hebben we 2.000 petabytes nodig om de resultaten van een typische botsingsfase van 12 uur op te slaan. Bij 150 lanceringen van collider per jaar zou het 400.000 petabytes, 400 exabytes aan data kosten om alle data op te slaan, een enorm volume dat we op dit moment niet eens kunnen opslaan”, zegt Andreas Hoecker, wetenschapper bij CERN.

De oplossing voor het probleem van een grote hoeveelheid gegevens is natuurlijk een drastische vermindering van hun volume. En dit gaat niet ten koste van enige algoritmen voor informatiecompressie, hiervoor is er niet genoeg kracht van alle processors van bestaande supercomputers. Dankzij de mogelijkheden van de computertechnologie die beschikbaar is bij CERN, kunnen de resultaten van slechts 1200 botsingen voor elke 30 miljoen van dergelijke gevallen worden opgeslagen. Dit is 0,004 procent van het totale volume en de resterende 99,996 procent, zoals hierboven vermeld, gaat voor altijd verloren.

Image
Image

Deze gang van zaken lijkt een vreselijke verspilling, maar niet alles is zo triest. Verschijnselen die voor wetenschappers van werkelijk belang zijn, doen zich in dit tempo niet voor. Het Higgs-deeltje verschijnt bijvoorbeeld met een snelheid van één keer per seconde, terwijl andere gebeurtenissen plaatsvinden met een frequentie van tientallen of honderden keren per seconde. Om de meest interessante van de hele datastroom te benadrukken, zijn er speciale "triggers" bij betrokken, apparaten die voorlopige gegevensfiltering uitvoeren, voornamelijk op hardwareniveau. Deze triggers zijn ontwikkeld voor elk specifiek geval en worden afgestemd in overeenstemming met de eigenschappen van de gezochte deeltjes, zoals het Higgs-deeltje, echte quark, W- en Z-bosonen, enz.

Promotie video:

Bij een dergelijke implementatie van voorlopige gegevensverwerking gaan natuurlijk enkele van de interessante gegevens verloren, samen met een berg onnodige en oninteressante "rotzooi". Maar de overige informatie bevat voornamelijk significante gegevens, en het relatief bescheiden volume maakt al een voldoende diepgaande verwerking mogelijk, zelfs in realtime.

En tot slot moet worden opgemerkt dat de oplossing voor het hierboven beschreven probleem geenszins de mogelijkheid biedt om grotendeels nutteloze gegevens op te slaan. De oplossing voor het probleem is om nieuwe sensoren voor de botser te maken, die gebruik zullen maken van de nieuwste verworvenheden van moderne technologieën en die zullen kunnen doordringen tot in de diepten van de momenteel onontgonnen gebieden van de fysica. Overigens zullen sommige van deze sensoren bij de botser verschijnen in de loop van de volgende modernisering die nu wordt uitgevoerd. En de lancering van de gemoderniseerde collider staat gepland voor 2025.

Aanbevolen: