Wetenschappers Hebben Een Neuraal Netwerk Getraind Om Het Geslacht Van Een Persoon Te Bepalen Uit De Geschreven Tekst - Alternatieve Mening

Wetenschappers Hebben Een Neuraal Netwerk Getraind Om Het Geslacht Van Een Persoon Te Bepalen Uit De Geschreven Tekst - Alternatieve Mening
Wetenschappers Hebben Een Neuraal Netwerk Getraind Om Het Geslacht Van Een Persoon Te Bepalen Uit De Geschreven Tekst - Alternatieve Mening

Video: Wetenschappers Hebben Een Neuraal Netwerk Getraind Om Het Geslacht Van Een Persoon Te Bepalen Uit De Geschreven Tekst - Alternatieve Mening

Video: Wetenschappers Hebben Een Neuraal Netwerk Getraind Om Het Geslacht Van Een Persoon Te Bepalen Uit De Geschreven Tekst - Alternatieve Mening
Video: Neurale Netwerken 2024, Mei
Anonim

Een team van wetenschappers van de National Research Nuclear University "MEPhI", het National Research Center "Kurchatov Institute" en de Voronezh State University hebben een methode ontwikkeld die een computer leert het geslacht van een persoon te herkennen aan de hand van een door hem geschreven tekst met een nauwkeurigheid van 80 procent. Wetenschappelijke ontwikkeling behoort tot het gebied van computationele taalkunde. Het onderzoek is uitgevoerd met subsidie van de Russian Science Foundation. De resultaten zijn gepubliceerd in het tijdschrift Procedia Computer Science.

Talrijke wetenschappelijke studies tonen aan dat een geschreven tekst onvermijdelijk de kenmerken van de auteur weerspiegelt - geslacht, psychologische kenmerken, opleidingsniveau. Spraak is een waardevol psychodiagnostisch hulpmiddel dat wordt gebruikt door HR-specialisten van grote bedrijven, evenals door veiligheidsdiensten.

Op basis van de analyse van spraak is het mogelijk om de aanwezigheid van bepaalde ziekten bij een persoon (dementie, depressie) en een neiging tot suïcidaal gedrag te diagnosticeren. De behoefte om de kenmerken van de auteur van de tekst vast te stellen, groeit ook met de ontwikkeling van internetcommunicatie: het is belangrijk voor bedrijven om te weten welke groepen mensen hun producten en diensten mooi vinden.

Wetenschappers die in deze richting werken (taalkundigen, psychologen, informatietechnologiespecialisten) bouwen op basis van de numerieke waarden van verschillende parameters van de tekst wiskundige modellen voor het diagnosticeren van bepaalde persoonlijkheidsparameters.

Een team van experts analyseerde de effectiviteit van verschillende machine learning-technologieën met behulp van neurale netwerken voor tekstanalyse.

In de loop van de studie vergeleken ze de nauwkeurigheid van het oplossen van het probleem van genderidentificatie van teksten op basis van twee benaderingen van gegevensgebaseerde modellering: enerzijds algoritmen voor machine learning (ondersteuning van vectormachine en gradiëntverhoging), anderzijds deep learning neurale netwerken (convolutionele neurale netwerken en terugkerende neurale netwerken met lang kortetermijngeheugen).

“We hebben hoge resultaten behaald bij het bepalen van het geslacht van de auteur van de tekst dankzij geavanceerde neurale netwerkmodellen, in omstandigheden waarin de auteur zijn geslacht niet verbergt. De volgende taak is om het geslacht te bepalen in termen van opzettelijke verhulling”, zegt Alexander Sboev, universitair hoofddocent bij NRNU MEPhI.

Dus in de volgende teksten, in eerste instantie gepost op een datingsite, vindt het neurale netwerk gemakkelijk een vangst in tien van de tien gevallen, bovendien zet de auteur opzettelijk de naam van het andere geslacht in de handtekening.

Promotie video:

De tekst is geschreven door een meisje: “Ik ben een knappe, gespierde man van 30 jaar. Ik werk voor een groot olie- en gasbedrijf in een goede positie met een behoorlijk salaris. Ik woon in mijn eigen appartement in Moskou. Het pand heeft ook een klein maar mooi huis in een van de dorpen in Italië. Ik ben dol op sport, in het bijzonder voetbal. Ik hou van uitgaan in het weekend, ik haat thuisblijven. Een meisje dat bij mij past, moet een bescheiden karakter hebben, er goed uitzien en naar moderne maatstaven een aantrekkelijk figuur hebben. Ze moet mijn interesses delen, niet jaloers zijn en niet proberen me jaloers te maken. Ik ga het meisje niet steunen, omdat ik vind dat ze allebei in het gezin moeten werken. Ik houd ook het budget liever apart. Ik zal geen verraad tolereren."

De tekst is geschreven door een man: “Hallo! Ik ben buitengewoon ongelukkig, buitengewoon! Waarom gedraag je je bij ons zo ?! Wij zijn ook mensen, we zijn allemaal gelijk! Ben je seksistisch? Ik neem dit niet meer aan! Ik zal je auto helemaal kapot maken, schilderen. Wacht, onmenselijk. Ik zal op deze manier eindigen."

De resultaten van deze studie toonden aan dat een benadering gebaseerd op het gebruik van convolutionele neurale netwerken en deep learning-methoden voor het herkennen van het geslacht van de persoon die de tekst heeft geschreven het meest optimaal is.

Nu werkt een groep onderzoekers aan het probleem van leeftijdsherkenning.

Aanbevolen: