Kunstmatige Intelligentie Heeft Geleerd Om Spraak Correct Te Herkennen Tussen Lawaai - Alternatieve Mening

Kunstmatige Intelligentie Heeft Geleerd Om Spraak Correct Te Herkennen Tussen Lawaai - Alternatieve Mening
Kunstmatige Intelligentie Heeft Geleerd Om Spraak Correct Te Herkennen Tussen Lawaai - Alternatieve Mening

Video: Kunstmatige Intelligentie Heeft Geleerd Om Spraak Correct Te Herkennen Tussen Lawaai - Alternatieve Mening

Video: Kunstmatige Intelligentie Heeft Geleerd Om Spraak Correct Te Herkennen Tussen Lawaai - Alternatieve Mening
Video: Kunnen we kunstmatige intelligentie nog doorgronden? 2024, Mei
Anonim

Virtuele assistenten en spraakherkenningssystemen hebben geleerd te ‘herkennen’ wat iemand tegen hen zegt en zijn bevelen op te volgen. Maar voor de juiste werking van dezelfde Siri en Cortana kan externe ruis een groot probleem zijn. Deskundigen van Mitsubishi Electric kunnen helpen bij het oplossen van deze technische fout, die een nieuwe technologie presenteerden om de spraak van één persoon te scheiden van het algemene lawaai.

De technologie van het Japanse bedrijf heet Deep Clustering, waarvan de werking is gebaseerd op de principes van machine learning. Om te beginnen leerde kunstmatige intelligentie om de spraak van één persoon onafhankelijk te scheiden van de algemene stroom van verschillende geluiden en geluiden. Het neurale netwerk scheidt de binnenkomende audiodata in verschillende elementen en analyseert elk afzonderlijk, waarna het de menselijke stem al kan verwerken. Soortgelijk werk wordt waargenomen wanneer twee of meer gesprekspartners "verbonden" zijn.

Tijdens een demonstratie van de technologie van een Japans bedrijf was het systeem in staat om de spraak van twee mensen die dezelfde zin in verschillende talen spraken, te scheiden in één microfoon. Alle verwerking werd in realtime uitgevoerd en de vertraging was niet langer dan drie seconden. De herkenningsnauwkeurigheid was 90 procent, en toen drie mensen in de microfoon begonnen te spreken, daalde het percentage "treffers" tot 80, wat ook een goed resultaat is. Volgens de auteurs van het project Anthony Vetro en Yohei Okato,

"In tegenstelling tot het scheiden van spraak en achtergrondgeluiden, is het scheiden van de spraak van één persoon en het" stem "-geluid van mensen die tegelijkertijd spreken een zeer moeilijke taak, aangezien de geluiden van de stemmen van verschillende mensen veel eigenaardigheden hebben. In de meeste systemen wordt het probleem van stemscheiding opgelost door twee of meer microfoons te installeren, maar in het geval dat slechts één microfoon wordt gebruikt, kan alleen kunstmatige intelligentie de taak van stemscheiding aan. Deze technologie kan overal worden gebruikt waar een hoge nauwkeurigheid van spraakherkenning vereist is. Bijvoorbeeld in spraakbesturingssystemen voor auto's, liften, huishoudens en andere elektronische apparaten."

VLADIMIR KUZNETSOV

Aanbevolen: