Hoe Kunstmatige Intelligentie Werkt: Spraakherkenning - Alternatieve Mening

Inhoudsopgave:

Hoe Kunstmatige Intelligentie Werkt: Spraakherkenning - Alternatieve Mening
Hoe Kunstmatige Intelligentie Werkt: Spraakherkenning - Alternatieve Mening

Video: Hoe Kunstmatige Intelligentie Werkt: Spraakherkenning - Alternatieve Mening

Video: Hoe Kunstmatige Intelligentie Werkt: Spraakherkenning - Alternatieve Mening
Video: AI | Hoe werkt zelflerende kunstmatige intelligentie? 2024, September
Anonim

Ieder van ons wordt in het dagelijks leven geconfronteerd met zo'n mysterieus fenomeen als kunstmatige intelligentie - hij is het die stemassistenten en zoekmachines in staat stelt menselijke spraak te herkennen en de wensen van gebruikers te raden. Vandaag zullen we het hebben over hoe deze technologie precies is ingericht en welke vooruitzichten dit ontwikkelingsgebied in de nabije toekomst te wachten staan.

Kunstmatige intelligentie is een zeer brede term, waarbinnen veel algoritmen al bestaan en nog in ontwikkeling zijn, ontworpen om een breed scala aan praktische taken uit te voeren. Maar waar zijn moderne kunstmatige intelligentieprogramma's eigenlijk toe in staat en op welke principes worden ze tijdens hun werk gestuurd? Vandaag zullen we praten over een van de belangrijkste kenmerken van de machine-geest, die we allemaal regelmatig tegenkomen in het dagelijks leven: het vermogen van stemassistenten om menselijke spraak te herkennen.

Spraakherkenning

Om de stem te meten, gebruikt het programma een aantal geluidsparameters: de frequentie en lengte van de geluidsgolf op een bepaald tijdstip. Wanneer u bijvoorbeeld chat met de populaire stemassistent Alexa, splitst de software uw stem op in dia's van 25 milliseconden en zet vervolgens elk van de segmenten om in digitale handtekeningen. Daarna worden de handtekeningblokken vergeleken met de interne catalogus van programmageluiden totdat het aantal overeenkomsten hoog genoeg is om de AI de getallen te laten "vertalen" in een alfabetische zoekopdracht die het begrijpt.

Image
Image

Bekijk uw telefoonscherm terwijl u Siri of Google Assistant gebruikt en u zult zien dat de woordenschat verandert terwijl u de woorden uitspreekt. Dit komt doordat de software bij elke volgende "stap" ook het verkregen resultaat vergelijkt met de interne database en woorden opbouwt afhankelijk van de overeenkomsten. Volgens Rohit Prasad, hoofdwetenschapper bij de Alexa-divisie van Amazon, "leert het taalmodel vele miljarden woorden in de vorm van tekst." Ook de woordvolgorde speelt een belangrijke rol: dit kan worden opgemerkt met behulp van de gebruikelijke Google-zoekmachine, die soms verschillende gegevens geeft bij identieke zoekopdrachten, waarbij slechts een paar woorden worden herschikt.

Promotie video:

Perspectieven van spraakherkenning

Alan Black van het Carnegie Institute for Language Technology stelt dat het voor alle professionals in grote bedrijven het meest interessante is om de limiet van hun eigen systeem te vinden. "Als het programma zegt: 'Ik kan dit niet', dan wordt de situatie pas echt interessant", grapt hij. Dit is echter inderdaad waar: reageren op onvoorspelbare verzoeken van gebruikers is zelfs een van de belangrijkste taken die studentenkringen die strijden om de Alexa-prijs - en dit is maar liefst $ 2,5 miljoen - onderzoeken. Het is hun taak om een chatbot te maken die is ontworpen om te communiceren met mensen die consistente en zinvolle vragen stellen. De informatie wordt in dit geval elke 20 minuten bijgewerkt. Klinkt als een vrij gemakkelijke taak, zelfs voor een gemiddelde programmeur,maar in de praktijk wordt de communicatie van het programma met echte mensen altijd geassocieerd met afwijkingen van het onderwerp dialoog, spontane zinnen en andere overtredingen. Een programma dat zowel met hen als met een echt persoon leert werken, zal een enorme doorbraak zijn voor de hele AI-industrie.

Vasily Makarov