Neironu Tīkls Ir Iemācījies ģenerēt Videoklipus, Pamatojoties Uz - Alternatīvs Skats

Neironu Tīkls Ir Iemācījies ģenerēt Videoklipus, Pamatojoties Uz - Alternatīvs Skats
Neironu Tīkls Ir Iemācījies ģenerēt Videoklipus, Pamatojoties Uz - Alternatīvs Skats

Video: Neironu Tīkls Ir Iemācījies ģenerēt Videoklipus, Pamatojoties Uz - Alternatīvs Skats

Video: Neironu Tīkls Ir Iemācījies ģenerēt Videoklipus, Pamatojoties Uz - Alternatīvs Skats
Video: ТЕРМИНАТОР: ТЁМНЫЕ СУДЬБЫ 2024, Maijs
Anonim

Mākslīgais intelekts rada skriptētus videoklipus - līdz šim īsus un neskaidrus, taču kādu dienu tas vien aizstās visu filmu studiju.

Neironu tīkli jau diezgan labi (un daudzos gadījumos labāk nekā cilvēki) atpazīst attēla modeļus un vispārīgi var aprakstīt visas ainas. Ģeneratīvie neironu tīkli veic apgrieztu transformāciju un var veidot attēlu, pamatojoties uz tā aprakstu, vai paredzēt nākamo kadru, pamatojoties uz iepriekšējiem.

Beļģijas izstrādātāji ir gājuši vēl tālāk, apvienojot šīs iespējas vienotā sistēmā, kas rada videoklipus "no nekā", balstoties uz viņu pašu pieredzi mašīnu apguvē un skriptu tekstu. Tinne Tuytelaars runāja par to mākslīgā intelekta attīstības asociācijas (AAAI) sanāksmē, kas notika Amerikas Savienotajās Valstīs.

Neironu tīkls darbojas divos posmos - pēc Tinnes domām, it kā atdarinot cilvēka radošo procesu: pirmajā posmā tiek izveidots neskaidrs, aptuvens katra kadra "skice", pēc kura tiek precizētas un pievienotas detaļas. Viena no svarīgām šādas sistēmas sastāvdaļām ir diskriminējošais neironu tīkls, kas rezultātu salīdzina ar "reāliem" video, kas piemēroti dotajam scenārijam, un ļauj novērtēt tā kvalitāti, uzlabojot sistēmas ģeneratīvās daļas darbu.

Neironu tīkls tika apmācīts uz 10 sižetiem ("golfa spēlēšana uz zāles", "pūķu sērfings jūrā" utt.) Un tika iemācīts atdalīt darbības un apstākļus viens no otra, kā arī varēja tos jebkurā veidā apvienot, izveidojot, piemēram, video "Golfs baseinā":

Image
Image

vai "burāšana sniegā":

Image
Image

Reklāmas video:

Protams, šādu animāciju kvalitāte vēl arvien nav pieņemama: apmēram sekundi ilgi "video" sastāv tikai no 32 kadriem ar izmēru 64x64 pikseļi.

Bet ar tādu pašu pārliecību ir iespējams garantēt, ka šie skaitļi strauji uzlabosies, jo ne tik sen kino pats varēja lepoties tikai ar dubļainu, raustīgu un mēmu attēlu. Ja šādu neironu tīklu var padarīt patiešām ātru un efektīvu, Holivuda var beigties: pietiks tikai uzņemt scenāriju, un filma ir gatava. Šī iespēja būs noderīga, veidojot lielas kopas citu neironu tīklu apmācībai un jaunu algoritmu izveidošanai straumēta video saspiešanai un pārraidīšanai.

Sergejs Vasiļjevs