Zinātnieki Ir Apmācījuši Neironu Tīklu, Lai No Rakstītā Teksta Noteiktu Cilvēka Dzimumu - Alternatīvs Skats

Zinātnieki Ir Apmācījuši Neironu Tīklu, Lai No Rakstītā Teksta Noteiktu Cilvēka Dzimumu - Alternatīvs Skats
Zinātnieki Ir Apmācījuši Neironu Tīklu, Lai No Rakstītā Teksta Noteiktu Cilvēka Dzimumu - Alternatīvs Skats

Video: Zinātnieki Ir Apmācījuši Neironu Tīklu, Lai No Rakstītā Teksta Noteiktu Cilvēka Dzimumu - Alternatīvs Skats

Video: Zinātnieki Ir Apmācījuši Neironu Tīklu, Lai No Rakstītā Teksta Noteiktu Cilvēka Dzimumu - Alternatīvs Skats
Video: Ilze Jurkāne, finanšu eksperte (24.05.18.) 2024, Maijs
Anonim

Nacionālās pētniecības kodolenerģijas universitātes "MEPhI", Nacionālā pētniecības centra "Kurchatov Institute" un Voroņežas Valsts universitātes zinātnieku komanda ir izstrādājusi metodi, kas māca datoru atpazīt cilvēka dzimumu no viņa rakstīta teksta ar 80 procentu precizitāti. Zinātniskā attīstība pieder pie skaitļošanas valodniecības jomas. Pētījums tika veikts ar Krievijas Zinātnes fonda dotāciju. Rezultāti tiek publicēti žurnālā Procedia Computer Science.

Neskaitāmi zinātniski pētījumi rāda, ka rakstīts teksts neizbēgami atspoguļo tā autora īpašības - dzimumu, psiholoģiskās īpašības, izglītības līmeni. Runa ir vērtīgs psihodiagnostikas rīks, ko izmanto lielo uzņēmumu cilvēkresursu speciālisti, kā arī drošības dienesti.

Balstoties uz runas analīzi, ir iespējams diagnosticēt noteiktu slimību klātbūtni cilvēkā (demenci, depresiju) un noslieci uz pašnāvniecisku izturēšanos. Nepieciešamība noteikt teksta autora raksturlielumus pieaug arī attīstoties interneta komunikācijai: uzņēmumiem ir svarīgi zināt, kurām cilvēku grupām patīk viņu produkti un pakalpojumi.

Šajā jomā strādājošie zinātnieki (valodnieki, psihologi, informācijas tehnoloģiju speciālisti), pamatojoties uz dažādu teksta parametru skaitliskajām vērtībām, veido matemātiskus modeļus noteiktu personības parametru diagnosticēšanai.

Ekspertu grupa analizēja dažādu mašīnmācīšanās tehnoloģiju efektivitāti, izmantojot teksta analīzei neironu tīklus.

Pētījuma laikā viņi salīdzināja tekstu dzimuma identifikācijas problēmas risināšanas precizitāti, balstoties uz divām pieejām datu bāzētai modelēšanai: no vienas puses, mašīnmācīšanās algoritmi (atbalsta vektora mašīna un gradienta palielināšana), no otras puses, dziļi mācoties neironu tīkli (konvolūcijas neironu tīkli un atkārtoti neironu tīkli ar ilgu īstermiņa atmiņu).

“Mēs esam sasnieguši augstus rezultātus, nosakot teksta autora dzimumu, pateicoties uzlabotajiem neironu tīkla modeļiem, apstākļos, kad autors neslēpj savu dzimumu. Nākamais uzdevums ir noteikt dzimumu tā tīšas slēpšanas ziņā,”saka Aleksandrs Sbojevs, NRNU MEPhI asociētais profesors.

Tātad šādos tekstos, kas sākotnēji tika ievietoti iepazīšanās vietnē, neironu tīkls viegli atrod nozveju desmit no desmit gadījumiem, turklāt autors ar parakstu apzināti liek pretējā dzimuma vārdu.

Reklāmas video:

Tekstu uzrakstīja meitene: “Esmu izskatīgs, muskuļots vīrietis 30 gadu vecumā. Es strādāju lielā naftas un gāzes uzņēmumā, kas atrodas labā stāvoklī ar pienācīgu algu. Es dzīvoju savā dzīvoklī Maskavā. Īpašumam ir arī neliela, bet glīta māja vienā no Itālijas ciematiem. Man patīk sports, jo īpaši futbols. Man ļoti patīk doties brīvdienās, es ienīstu mājās. Meitenei, kura man derētu, vajadzētu būt ar pieticīgu izturēšanos, labu izskatu un pievilcīgu figūru pēc mūsdienu standartiem. Viņai vajadzētu dalīties manās interesēs, viņai nevajadzētu būt greizsirdīgai un nemēģināt likt man justies greizsirdīgai. Es meiteni neatbalstīšu, jo uzskatu, ka abiem jāstrādā ģimenē. Es arī labprātāk paturētu budžetu atsevišķi. Es nepieļaušu nodevību."

Teksta autors bija vīrietis: “Sveiki! Esmu ārkārtīgi nelaimīga, ārkārtīgi! Kāpēc jūs ar mums tā uzvedaties ?! Arī mēs esam cilvēki, visi esam vienlīdzīgi! Vai tu esi seksists? Es to vairs neņemšu! Es visu sabojāšu jūsu automašīnu, krāsošu to. Pagaidi, necilvēcīgi. Es pabeigšu šo ceļu."

Šī pētījuma rezultāti parādīja, ka visoptimālākā ir pieeja, kas balstīta uz konvolūciju neironu tīklu un dziļu mācību metožu izmantošanu, lai atpazītu tekstu rakstījušās personas dzimumu.

Tagad pētnieku grupa strādā pie vecuma atzīšanas problēmas.