Kā Darbojas Mākslīgais Intelekts: Runas Atpazīšana - Alternatīvs Skats

Satura rādītājs:

Kā Darbojas Mākslīgais Intelekts: Runas Atpazīšana - Alternatīvs Skats
Kā Darbojas Mākslīgais Intelekts: Runas Atpazīšana - Alternatīvs Skats

Video: Kā Darbojas Mākslīgais Intelekts: Runas Atpazīšana - Alternatīvs Skats

Video: Kā Darbojas Mākslīgais Intelekts: Runas Atpazīšana - Alternatīvs Skats
Video: LAMPA 2020: Cilvēcīgs mākslīgais intelekts 2024, Septembris
Anonim

Ikviens no mums ikdienā saskaras ar tik noslēpumainu parādību kā mākslīgais intelekts - tieši viņš ļauj balss palīgiem un meklētājprogrammām atpazīt cilvēku runu un uzminēt lietotāju vēlmes. Šodien mēs runāsim par to, kā tieši šī tehnoloģija ir sakārtota un kādas perspektīvas tuvākajā nākotnē sagaida šo attīstības jomu.

Mākslīgais intelekts ir ļoti plašs termins, kura ietvaros daudzi algoritmi jau pastāv un joprojām tiek izstrādāti, kas paredzēti plaša spektra praktisko uzdevumu veikšanai. Bet uz ko mūsdienu mākslīgā intelekta programmas patiesībā ir spējīgas, un pēc kādiem principiem tās ievēro darba laikā? Šodien mēs runāsim par vienu no mašīnprāta galvenajām iezīmēm, ar kurām katrs no mums regulāri saskaras ikdienas dzīvē, - balss palīgu spēju atpazīt cilvēka runu.

Balss atpazīšana

Balss mērīšanai programma izmanto vairākus skaņas parametrus: skaņas viļņa frekvenci un garumu noteiktā laikā. Piemēram, kad jūs tērzējat ar populāro balss palīgu Alexa, programmatūra jūsu balsi sadala 25 milisekundēs slaidos un pēc tam katru no segmentiem pārveido par ciparparakstiem. Pēc tam parakstu bloki tiek salīdzināti ar programmas skaņu iekšējo katalogu, līdz sakritību skaits ir pietiekami liels, lai AI varētu "tulkot" numurus saprotamā alfabētiskā vaicājumā.

Image
Image

Skatieties sava tālruņa ekrānu, kamēr izmantojat Siri vai Google palīgu, un jūs redzēsit, ka, runājot vārdus, vārdu krājums mainās. Tas notiek tāpēc, ka ar katru nākamo "soli" programmatūra arī salīdzina iegūto rezultātu ar iekšējo datu bāzi un veido vārdus atkarībā no sakritībām. Saskaņā ar Rohit Prasad, galvenā Amazon's Alexa nodaļas zinātnieku, "valodas modelis iemācās daudzus miljardus vārdu teksta formā". Svarīga loma ir arī vārdu kārtībai: to var pamanīt, izmantojot parasto Google meklētājprogrammu, kas dažreiz sniedz atšķirīgus datus par identiskiem vaicājumiem, kuros tikai pāris vārdi tiek pārkārtoti.

Reklāmas video:

Runas atpazīšanas perspektīvas

Alans Melns no Kārnegi valodas tehnoloģiju institūta apgalvo, ka visiem lielo uzņēmumu profesionāļiem visinteresantākais ir atrast savas sistēmas robežu. “Kad programma saka:“Es to nevaru izdarīt”, tad situācija kļūst patiešām interesanta,” viņš joko. Tomēr tā patiešām ir taisnība: reaģēšana uz neparedzamiem lietotāju pieprasījumiem ir pat viens no galvenajiem uzdevumiem, ko pēta studentu aprindas, kas konkurē par Alexa balvu - un tas ir milzīgi 2,5 miljoni USD -. Viņu uzdevums ir izveidot tērzētavu, kas paredzēta saziņai ar cilvēkiem, kuri uzdod konsekventus un jēgpilnus jautājumus. Informācija šajā gadījumā tiek atjaunināta ik pēc 20 minūtēm. Izklausās pēc diezgan viegla uzdevuma pat vidusmēra programmētājam,bet praksē programmas komunikācija ar reāliem cilvēkiem vienmēr ir saistīta ar novirzēm no dialoga tēmas, spontānām frāzēm un citiem pārkāpumiem. Programma, kas iemācās strādāt ar viņiem, kā arī ar reālu cilvēku, būs milzīgs sasniegums visai AI nozarei.

Vasilijs Makarovs