Neironu Tīkli Ir Iemācījušies Lasīt Domas Reālā Laikā. Kas? Nē! - Alternatīvs Skats

Neironu Tīkli Ir Iemācījušies Lasīt Domas Reālā Laikā. Kas? Nē! - Alternatīvs Skats
Neironu Tīkli Ir Iemācījušies Lasīt Domas Reālā Laikā. Kas? Nē! - Alternatīvs Skats

Video: Neironu Tīkli Ir Iemācījušies Lasīt Domas Reālā Laikā. Kas? Nē! - Alternatīvs Skats

Video: Neironu Tīkli Ir Iemācījušies Lasīt Domas Reālā Laikā. Kas? Nē! - Alternatīvs Skats
Video: Экологическая катастрофа: стихийные бедствия, затрагивающие экосистемы 2024, Aprīlis
Anonim

Pirms pāris dienām portāls bioRxiv.org publicēja krievu pētnieku darbu no Maskavas Fizikas un tehnoloģijas institūta un uzņēmumiem Neurobotics un Neuroassistive Technologies, kuri nodarbojas ar neiromotoru saskarņu izveidi. Rakstā tiek apgalvots, ka zinātniekiem un izstrādātājiem ir izdevies reāllaikā iemācīt algoritmu, lai rekonstruētu video, kuru persona ir skatījusi, izmantojot EEG signālus. Izklausās tiešām forši un interesanti - gandrīz kā prāta lasīšana. Patiesībā viss, protams, nav tik vienkārši: datori nav iemācījušies lasīt domas. Īsāk sakot, dators mācījās no EEG ierakstīšanas, lai noteiktu, kuru attēlu no piecām iepriekš zināmajām klasēm subjekts redzēja. Par to, kā tika uzbūvēts eksperiments, kādus uzdevumus izvirzīja zinātnieki un kāpēc domāšanas lasīšana diez vai tiks realizēta tuvākajā nākotnē, mēs stāstām savā emuārā.

Image
Image

Vispārīgi runājot, ideja nolasīt smadzeņu elektrisko signālu un to atšifrēt, lai jūs varētu redzēt, ko konkrētajā brīdī domā vai dara cilvēks, ņemot vērā pašreizējā tehnoloģiskā progresa tempu, nešķiet tik grūta. Šeit ir signāls, un šeit ir tas, ko šis signāls nozīmē: pievienojiet divus un divus, apmāciet klasifikatoru un iegūstiet mums nepieciešamo rezultātu.

Rezultāts ir tāds, ko futūristi un nezinoši cilvēki sauc par “prāta lasīšanu”. Un šķiet, ka šāda tehnoloģija varētu atrasties daudzos pielietojumos: sākot no ideālām smadzeņu un datora saskarnēm, kas ļauj kontrolēt viedās protēzes, līdz pat sistēmas izveidošanai, kas beidzot pasaka, ko par tavu kaķi domā.

Patiesībā, protams, viss nemaz nav tik vienkārši, un ideja par šāda algoritma izveidi gandrīz uzreiz sabojājas uz galvenā šķēršļa: mums ir jātiek galā ar smadzenēm. Smadzenes ir ļoti sarežģīta lieta: tām ir vairāk nekā 80 miljardi neironu, un savienojumi starp tām ir vairākus tūkstošus reižu vairāk.

Pat nespeciālistam ir skaidrs: tas ir par daudz, lai mēs saprastu, par ko katra šūna un to kopums ir atbildīgs. Zinātnieki vēl nav atšifrējuši cilvēka savienību - pat ja viņi to mēģina izdarīt ar relatīviem panākumiem.

Rodas loģisks jautājums: vai vispār ir jāsaprot katra neirona funkcijas, lai precīzi atspoguļotu smadzenēs notiekošo? Vai tiešām, piemēram, nav pietiekami daudz funkcionālu karšu?

Faktiski atbildei uz šo jautājumu vajadzētu būt "jā", bet pat šeit tas nav tik vienkārši. Ja cilvēce paļautos uz savienojuma atšifrēšanu kā vienīgo atslēgu smadzeņu noslēpuma atklāšanai, mēs šodien būtu pavisam tuvu. Tomēr mēs zinām kaut ko par to, kā darbojas mūsu smadzenes, un, protams, mēs to varam veiksmīgi izmantot.

Reklāmas video:

Viens no spilgtākajiem un acīmredzamākajiem zinātnieku uzkrāto zināšanu par smadzeņu darbu izmantošanu, protams, ir neiro interfeisi. Vispārīgi runājot, šodien patiešām ir tehnoloģijas, kas ļauj nolasīt smadzeņu darbību un izmantot to, lai, piemēram, kontrolētu datora peles kursoru vai pat protēzes kustības.

Ir divi veidi, kā panākt neironu interfeisa efektīvu darbību. Pirmajā metodē tiek izsaukti potenciāli: mēs aplūkojam noteiktu smadzeņu daļu elektriskās aktivitātes līkni un izvēlamies tajā signāla izmaiņas, kuras, kā mēs zinām dažiem, parādās noteiktā brīdī pēc stimula uzrādīšanas.

Otrs veids ir nepaļauties uz stimulēšanu, bet gan izmantot cilvēka iztēli, lai ģenerētu elektrisku signālu, ko var nolasīt. Piemēram, personai var lūgt iztēloties, kā viņa pārvieto kāju vai roku.

Abām metodēm ir ievērojami trūkumi. Pirmo kavē fakts, ka mums zināmo ticami izsaukto potenciālu skaits nav tik liels: to skaits nevar precīzi aptvert visas iespējamās personas veiktās darbības. Otrās puses trūkums ir tāds, ka, lai sasniegtu vismaz zināmu efektu, nepieciešama ilga apmācība.

Priekšizdrukas autori nolēma apvienot abas pieejas, lai izveidotu neirokomputeru saskarnes, pamatoti uzskatot, ka tas ietaupīs abas metodes no ievērojamiem ierobežojumiem un ļaus šodien izstrādāt jaunu un efektīvāko metodi darbam ar neirointerfeisiem.

Tika arī pieņemts, ka šī metode tiks slēgta (slēgta cilpa), tas ir, rezultāts, kas iegūts ar tās palīdzību, savukārt, ietekmēs algoritma darbību. Bet vairāk par to vēlāk.

Pašā sākumā algoritms visus attēlus sadala atsevišķās komponentu zīmēs, kas tiek sadalītas vektora telpā, un ar kuru palīdzību tos pēc tam var korelēt ar noteiktiem smadzeņu signāliem, kas ierakstīti, izmantojot EEG.

Šajā sākotnējā posmā tiek izmantots binārais klasifikators - rupji runājot, ļoti “divi un divi”: kam ir pietiekami tīrs signāls (EEG ieraksts tika notīrīts no motora artefaktiem), jūs varat izvēlēties vai nu vienu, vai otru ar precizitāti, kas ir augstāka par nejaušu trāpījumu.

Savos eksperimentos zinātnieki izmantoja piecu klašu objektu video: cilvēku attēlus, ūdenskritumus, abstraktas ģeometriskas formas, ekstrēmo sportu un Goldberga automašīnas. No vienas puses, šāds komplekts šķiet dīvains, bet, no otras puses, šķiet, ka visi šie objekti ir ļoti atšķirīgi viens no otra. Vai tiešām starp cilvēku sejām un abstraktajām ģeometriskajām formām ir kas kopīgs?

Tikmēr, pēc binārā klasifikatora domām, abstraktie skaitļi un cilvēku sejas nav atšķirami viens no otra: deviņu no 17 pētījuma dalībniekiem rezultāti liecina, ka neironu saskarne acīmredzot nav spējusi tos atšķirt. Bet Goldberga mašīnas un tās pašas sejas, no smadzeņu viedokļa, gluži pretēji, labi atšķiras viena no otras.

Klasifikācijas rezultāti. A - abstraktas formas, W - ūdenskritumi, HF - cilvēku sejas, GM - Goldberga automašīnas, ekstremālie sporta veidi
Klasifikācijas rezultāti. A - abstraktas formas, W - ūdenskritumi, HF - cilvēku sejas, GM - Goldberga automašīnas, ekstremālie sporta veidi

Klasifikācijas rezultāti. A - abstraktas formas, W - ūdenskritumi, HF - cilvēku sejas, GM - Goldberga automašīnas, ekstremālie sporta veidi.

No pirmā acu uzmetiena nav īsti skaidrs, kāpēc tas notiek: drīzāk tās pašas mašīnas un ģeometriskās formas nevar atšķirt viena no otras. Viss kļūst nedaudz skaidrāks, ja aplūkojat kadru piemērus no izmantotajiem video.

Paraugu attēli no piecām klasēm
Paraugu attēli no piecām klasēm

Paraugu attēli no piecām klasēm.

Visticamāk (mēs, protams, šeit varam tikai pieņemt), klasifikatora panākumi ir atkarīgi no tā, cik lielā mērā divās klasēs izmantotie attēli atšķiras viens no otra dažās virspusējās, pamatīpašībās - pirmkārt, krāsās. Tas arī labi korelē ar faktu, ka autoenkodā latentās vietas izmērs ir 10.

Kopumā, lai klasificētu piecu klašu attēlus, pietiek ar piecu dimensiju, taču šajā gadījumā tas tiks izdarīts maksimāli ar krāsu histogrammu - tas nozīmē, ka 10. dimensija pārāk neuzlabosies un precizēs rezultātu.

Nav īsti skaidrs, kāpēc autori desmit bināro klasifikatoru vietā nav izmantojuši lineāru klasifikatoru piecām klasēm uzreiz: visticamāk, tas būtu bijis labāk.

Tad seko iegūtā attēla rekonstrukcijas posms. Tas, ka tas iznāk izsmērēts, ir saprotams - punkts ir tajā pašā latentās telpas dimensijā. Bet šeit sajaucas divas lietas.

Pirmais ir tas, ka oriģinālie un rekonstruētie attēli ir ļoti līdzīgi viens otram. Šeit, protams, es nevēlos nevienu izjaukt (ieskaitot sevi - mēs visi esam progresa labā), bet tas nav saistīts ar faktu, ka signāls ir tik labi ierakstīts un atkodēts (un pat reālajā laikā!), Bet gan sakarā ar to, ka algoritms atjauno tieši tos attēlus, kas tam jau bija.

Turklāt tas ne vienmēr darbojas tik labi, kā mēs vēlētos: ja, piemēram, apskatīsit sistēmas video, pamanīsit, ka video ar raudošu vīrieti neirālais interfeiss kādu iemeslu dēļ redz sievieti. Tas notiek tāpēc, ka algoritms nevis rekonstruē attēlus, bet gan noteiktas klases objektus: pat ja tas tiek veikts pietiekami efektīvi, nekas neliedz algoritmam redzēt laivu motocikla tēlā - vienkārši tāpēc, ka tie pieder tai pašai klasei.

Tāpēc tas, kas ekrānā parādās rekonstrukcijas laikā, bieži ir tikai visu izmantoto klases objektu vidējais attēls.

Kas attiecas uz slēgtas sistēmas izmantošanas jēgu, tad ar to viss nav ļoti skaidrs: izpildot uzdevumu, cilvēks redz gan EEG signālu ierakstīšanu, gan attēlu, kas pamazām parādās no viņa galvas. Vai tas tiešām palīdz, ir grūti pateikt - autori nesalīdzināja saskarnes darbību ar un bez pastiprināšanas. Bet no pirmā acu uzmetiena šķiet, ka ne īsti. Ja tas palīdz, es tiešām gribu zināt, kā.

Kopumā mēs varam droši secināt, ka datori nav iemācījušies lasīt domas. Un viņi pat nemācēja atjaunot videoklipu. Viss, ko viņi ir iemācījušies darīt, pamatojoties uz zinātnieku darbu, ir klasificēt redzētos objektus piecās klasēs, pamatojoties uz dažiem pamatkritērijiem. Vai datori to ir spējuši izdarīt agrāk? Protams, viņi varēja. Vai te ir smadzenes? Protams, ir: bet redz smadzenes, nevis smadzenes, kas saprot to, ko tieši viņš redzēja.

Elizaveta Ivtushok

Ieteicams: