AI Dienā Patstāvīgi Iemācījos Spēlēt šahu Pārcilvēcīgā Līmenī - Alternatīvs Skats

Video: AI Dienā Patstāvīgi Iemācījos Spēlēt šahu Pārcilvēcīgā Līmenī - Alternatīvs Skats

Video: LSSO apmācību cikls (1): šaha pamatelementi un figūru gājieni. 2024, Aprīlis

2024 Autors: Keith Bush | [email protected]. Pēdējoreiz modificēts: 2023-12-16 14:32

AlphaZero algoritms bez cilvēku skolotāja 24 stundās apguva šahu un shogi spēli tā, ka tas pārspēja citas čempionu programmas, kuras iepriekš bija bez ierunām pieveikušas cilvēkus.

Uzņēmums Deep Mind, kas izstrādā mākslīgā intelekta (AI) algoritmus, ir publicējis datus par AlphaGo algoritma pārkvalifikācijas rezultātiem šaha un shogi spēlēšanai. Iepriekš AlphaGo spēja pārspēt pasaules čempionus izbraukuma spēlē. Mākslīgais intelekts spēja apgūt jaunas spēles vēl ātrāk. Atbilstošais darbs tiek izlikts uz Kornela universitātes pirmsdrukas serveri.

AlphaZero izmantoja pastiprināšanas mācīšanās metodi. Tas ir dziļas mašīnmācīšanās apakštips, kurā neizmanto cilvēku skolotāju, bet gan tikai spēles starp divām AI. Lai arī sākumā abi AI spēlē ļoti vāji, lielā ātruma dēļ (salīdzinājumā ar cilvēku skolotāju) viņi īsā laika posmā var spēlēt ļoti daudz spēļu un noteikt labi pārbaudītus gājienus un to secības noteiktās pozīcijās uz galda, kas dod algoritmu spēja ārkārtīgi ātri paaugstināt to līmeni.

Šajā gadījumā AlphaZero tikai 24 stundās sasniedza spēles līmeni, kas ir augstāks par jebkuru cilvēku. Tad viņai ļāva spēlēt ar Stockfish, labāko pieejamo šahistu, un Elmo, labāko shogi spēlētāju (ļoti modificēts šaha komplekts agrīnā viduslaiku Japānā).

Neskatoties uz ļoti īso apmācības periodu, AlphaZero 28 reizes pārspēja Stockfish un izdarīja vēl 72 reizes. Viņai izdevās uzvarēt pret Elmo 90 reizes, zaudēt 8 reizes un 2 reizes izdarīt. Šie ir ārkārtīgi augsti rezultāti. Gan šahs, gan shogi ļoti atšķiras gan no tā, kādam sākotnēji tika izveidots AlphaGo, gan arī viens no otra. Piemēram, "japāņu šahs" nozīmē ārkārtīgi eksotiskas iespējas, piemēram, spēlēt kādu no ienaidnieka "apēstiem" gabaliem. Goram izveidotā algoritma uzvara, tikai spēlējot ar pilnīgi identisku paša izstrādātu algoritmu, ko var sasniegt skolotājs

IVAN ORTEGA