Zinātnieki Izmanto Mazāk Nekā 1% No Datiem, Ko Savācis Lielais Hadronu Sadursme - Alternatīvs Skats

Zinātnieki Izmanto Mazāk Nekā 1% No Datiem, Ko Savācis Lielais Hadronu Sadursme - Alternatīvs Skats
Zinātnieki Izmanto Mazāk Nekā 1% No Datiem, Ko Savācis Lielais Hadronu Sadursme - Alternatīvs Skats

Video: Zinātnieki Izmanto Mazāk Nekā 1% No Datiem, Ko Savācis Lielais Hadronu Sadursme - Alternatīvs Skats

Video: Zinātnieki Izmanto Mazāk Nekā 1% No Datiem, Ko Savācis Lielais Hadronu Sadursme - Alternatīvs Skats
Video: RTU zinātnieki izstrādās tehnoloģijas hadronu paātrinātājam 2024, Aprīlis
Anonim

Ir skaidrs, kad rodas problēmas iegūt zinātniskus datus. Bet izrādās, ka ir problēma tos saglabāt un apstrādāt.

Visas ar sadursmes ierīci veiktās augsta profila atklājumu sērijas tika balstītas uz datu analīzi, kuru apjoms ir mazāks par vienu procentu no ģenerēto datu kopējā apjoma.

Pārējie dati tiek neatgriezeniski zaudēti.

26,7 kilometru garu sadursmes tuneli izmanto, lai paātrinātu daļiņas gaismas ātrumam tuvu. Vietās, kur novēro jutīgus sensorus, kosmosa vietās saduras divas daļiņu plūsmas, kas pārvietojas pretējos virzienos. Pat zemākā protonu staru kūļa blīvuma līmenī, kas katrs satur 120 miljardus protonu, sadursmju skaits ir 30 miljoni sadursmju sekundē.

Saskaņā ar informāciju, kas publicēta Eiropas Kodolpētījumu organizācijas CERN tīmekļa vietnē, viens miljards sadursmju sekundē rada datu plūsmu ar 1 petabaitu sekundē. Un tā ir pašreiz lielākā problēma, jo šāda ātruma datu straumi vienkārši nav iespējams uzglabāt, nemaz nerunājot par tās pareizu apstrādi. “Vismaz 30 miljonu sadursmju gadījumā mums ir nepieciešami 2000 petabaitu, lai saglabātu tipiskās 12 stundu garā sadursmes fāzes rezultātus. Ar 150 sadursmju ierīču palaišanu gadā visu datu glabāšanai būtu nepieciešami 400 000 petabaitu, 400 datu eksabāti, kas ir milzīgs apjoms, kuru patlaban nevaram pat uzglabāt,”saka CERN zinātnieks Andreass Hoekers.

Liela datu apjoma problēmas risinājums, protams, ir krass to apjoma samazinājums. Un tas netiek darīts uz jebkādu informācijas saspiešanas algoritmu rēķina, jo tam nepietiek visu esošo superdatoru procesoru jaudas. CERN pieejamās datortehnoloģijas iespējas ļauj saglabāt tikai 1200 sadursmju rezultātus uz katriem 30 miljoniem šādu gadījumu. Tas ir 0,004 procenti no kopējā apjoma, un atlikušie 99,996 procenti, kā minēts iepriekš, tiek zaudēti uz visiem laikiem.

Image
Image

Šis stāvoklis šķiet kā briesmīga izšķērdība, bet ne viss ir tik skumji. Fenomeni, kas zinātniekus patiesi interesē, nerodas šādā tempā. Piemēram, Higsa bozons parādās ar ātrumu vienreiz sekundē, bet citi notikumi notiek ar frekvenci desmitiem vai simtiem reižu sekundē. Lai izceltu visinteresantāko no visas datu straumes, tiek iesaistīti īpaši "sprūdaini" - ierīces, kas sākotnēji filtrē datus galvenokārt aparatūras līmenī. Šie sprūda ir izstrādāti katram konkrētajam gadījumam un tiek noregulēti atbilstoši meklēto daļiņu īpašībām, piemēram, Higsa bozonam, patiesajam kvarkam, W un Z bozonam utt.

Reklāmas video:

Protams, šādi ieviešot sākotnējo datu apstrādi, tiek zaudēti daži interesanti dati, kā arī nevajadzīgu un neinteresantu "atkritumu" kalns. Bet pārējā informācija satur galvenokārt nozīmīgus datus, un tās salīdzinoši nelielais apjoms jau ļauj pietiekami dziļu apstrādi pat reālajā laikā.

Un nobeigumā jāatzīmē, ka iepriekš aprakstītās problēmas risinājums nekādā ziņā nenodrošina iespēju uzglabāt galvenokārt bezjēdzīgus datus. Problēmas risinājums ir radīt jaunus sadursmes sensorus, kas izmantos jaunākos mūsdienu tehnoloģiju sasniegumus un kas spēs iekļūt pašreiz neizpētīto fizikas jomu dziļumos. Starp citu, daži no šiem sensoriem parādīsies sadursmē tā nākamās modernizācijas laikā, kas tiek veikta šobrīd. Un modernizētā sadursmes kuģa palaišana ir paredzēta 2025. gadā.