Het Neurale Netwerk Werd Geleerd De Menselijke Stem Bijna Perfect Te Kopiëren - Alternatieve Mening

Video: Het Neurale Netwerk Werd Geleerd De Menselijke Stem Bijna Perfect Te Kopiëren - Alternatieve Mening

Video: Heesheid. Stemcheck KNO. Vocal-TV. Deel 1 "Ontstemd" Zangeres Sophie op zoek naar een oplossing. 2024, April

2024 Auteur: Keith Bush | [email protected]. Laatst gewijzigd: 2023-12-16 14:35

Vorig jaar deelde het kunstmatige intelligentiebedrijf DeepMind details over zijn nieuwe project WaveNet, een diepgaand lerend neuraal netwerk dat wordt gebruikt om realistische menselijke spraak te synthetiseren. Onlangs is er een verbeterde versie van deze technologie uitgekomen, die zal worden gebruikt als basis voor de digitale mobiele assistent Google Assistant.

Een spraaksynthesesysteem (ook bekend als een tekst-naar-spraakfunctie, TTS) is meestal opgebouwd rond een van de twee basismethoden. De aaneenschakelingsmethode (of compilatiemethode) omvat de constructie van zinnen door afzonderlijke stukken opgenomen woorden en delen die eerder zijn opgenomen met de betrokkenheid van een stemacteur te verzamelen. Het grootste nadeel van deze methode is de noodzaak om de geluidsbibliotheek constant te vervangen wanneer er updates of wijzigingen worden aangebracht.

Een andere methode wordt parametrische TTS genoemd en de functie ervan is het gebruik van parametersets waarmee de computer de gewenste frase genereert. Het nadeel van de methode is dat het resultaat zich meestal manifesteert in de vorm van onrealistisch of zogenaamd robotgeluid.

WaveNet daarentegen produceert vanaf nul geluidsgolven met behulp van een convolutioneel neuraal netwerksysteem waarbij geluid in verschillende lagen wordt gegenereerd. Ten eerste, om het platform te trainen voor het synthetiseren van "live" spraak, wordt het een enorme hoeveelheid samples "gevoed", waarbij wordt opgemerkt welke geluidssignalen realistisch klinken en welke niet. Dit geeft de spraaksynthesizer de mogelijkheid om naturalistische intonatie en zelfs details zoals smakkende lippen te reproduceren. Afhankelijk van welke spraakmonsters door het systeem worden gevoerd, kan het hierdoor een uniek "accent" ontwikkelen, dat op lange termijn kan worden gebruikt om veel verschillende stemmen te creëren.

Scherp op de tong

Misschien was de grootste beperking van het WaveNet-systeem dat het een enorme hoeveelheid rekenkracht vereiste om te werken, en zelfs als aan deze voorwaarde was voldaan, verschilde het niet in snelheid. Het kostte bijvoorbeeld ongeveer 1 seconde tijd om 0,02 seconden geluid te genereren.

Na een jaar werken hebben DeepMind-ingenieurs nog steeds een manier gevonden om het systeem te verbeteren en te optimaliseren, zodat het nu in staat is om in slechts 50 milliseconden een rauw geluid van één seconde te produceren, wat 1000 keer sneller is dan de oorspronkelijke mogelijkheden. Bovendien slaagden de specialisten erin om de audiobemonsteringsfrequentie te verhogen van 8-bit naar 16-bit, wat een positief effect had op de tests met luisteraars. Deze successen hebben de weg geëffend voor WaveNet om te integreren in consumentenproducten zoals Google Assistant.

Promotie video:

Momenteel kan WaveNet worden gebruikt om Engelse en Japanse stemmen te genereren via Google Assistant en alle platforms die deze digitale assistent gebruiken. Aangezien het systeem een speciaal type stemmen kan creëren, afhankelijk van welke set samples het voor training heeft gekregen, zal Google in de nabije toekomst hoogstwaarschijnlijk ondersteuning introduceren voor het synthetiseren van realistische spraak in WaveNet in andere talen, inclusief het in aanmerking nemen daarvan. lokale dialecten.

Spraakinterfaces komen steeds vaker voor op een breed scala aan platforms, maar hun uitgesproken onnatuurlijke aard van het geluid schakelt veel potentiële gebruikers uit. De inspanningen van DeepMind om deze technologie te verbeteren, zullen zeker bijdragen aan de bredere acceptatie van dergelijke spraaksystemen, evenals de gebruikerservaring door het gebruik ervan verbeteren.

Voorbeelden van Engelse en Japanse gesynthetiseerde spraak met behulp van het WaveNet neurale netwerk zijn te vinden door deze link te volgen.

Nikolay Khizhnyak

Aanbevolen:

Het Ministerie Van Binnenlandse Zaken En De Onderzoekscommissie Van De Russische Federatie Werken Samen Met Helderzienden, Maar Deze Statistieken Worden Niet Bekendgemaakt

De moderne psychologische wetenschap en natuurkundigen erkennen het bestaan van paranormale vermogens of vormen van perceptie niet. De Amerikaanse National Science Foundation en de RAS Commission on Combating Pseudoscience classificeren buitenzintuiglijke waarneming als pseudowetenschappelijke waanvoorstellingen. De

Academicus Van De Russische Academie Van Wetenschappen, Die Een Middel Tegen Ouderdom Heeft Ontwikkeld: Over Een Paar Jaar Zal Het Mogelijk Zijn Om Het Bij Een Apotheek Te Kopen &

De beroemde biochemicus Vladimir Skulachev hield een lezing in Yekaterinburg over hoe octopussen en knaagdieren wetenschappers hielpen om het probleem van de dood bijna op te lossen. Is er een chemische stof naar jou vernoemd? Maar ter ere van Vladimir Petrovich genoemd

De Rabbijnen Geloven Dat De Recente Aardbeving Met Een Kracht Van 4,5 Op De Schaal Van Richter In Yellowstone - Het Is Een Teken Van Het Einde Der Dagen - Alternatiev

In één oogopslag beeft Zijn aarde, bij de aanraking van Zijn bergen rook. Hij liet hen hagelen in plaats van regen en laaiend vuur - naar hun land

Het Neurale Netwerk Werd Geleerd De Menselijke Stem Bijna Perfect Te Kopiëren - Alternatieve Mening

Inhoudsopgave:

Video: Het Neurale Netwerk Werd Geleerd De Menselijke Stem Bijna Perfect Te Kopiëren - Alternatieve Mening

Scherp op de tong

Aanbevolen:

Het Ministerie Van Binnenlandse Zaken En De Onderzoekscommissie Van De Russische Federatie Werken Samen Met Helderzienden, Maar Deze Statistieken Worden Niet Bekendgemaakt

Academicus Van De Russische Academie Van Wetenschappen, Die Een Middel Tegen Ouderdom Heeft Ontwikkeld: Over Een Paar Jaar Zal Het Mogelijk Zijn Om Het Bij Een Apotheek Te Kopen &

De Rabbijnen Geloven Dat De Recente Aardbeving Met Een Kracht Van 4,5 Op De Schaal Van Richter In Yellowstone - Het Is Een Teken Van Het Einde Der Dagen - Alternatiev

Supervulkaanexplosie Bedreigt Italië - Alternatieve Mening

De Paranormaal Begaafde Voorspelde De Explosie Van De Yellowstone-supervulkaan - Alternatieve Mening

Een Vertraging In De Circulatie Van Oceaanstromingen Bedreigt De Wereld Met Een Nieuwe Ijstijd - Alternatieve Mening

Vulkaan Yellowstone - Laatste Nieuws - Alternatieve Mening

Yellowstone - 120 Aardbevingen In 28 Dagen - Alternatieve Mening

The Bloody Countess - Elizabeth Bathory - Alternatieve Mening

Eirik De Bloedige Bijl - Alternatieve Mening

Het Wrak Van De Titanic Of De Bloedige Essentie Van De Eeuw - Alternatieve Mening

Elizabeth Bathory: De Bloedige Gravin - Alternatieve Mening

Het Bloedige Verhaal Van Iplikator Kuznetsov - Alternatieve Mening

Het Mysterieuze Fenomeen Dat Met Bevruchting Gepaard Gaat, Werd Ontdekt Door Wetenschappers - Alternatieve Mening

Vijf Verrassend Hilarische Feiten Over NASA - Alternatieve Mening

Vanuit Het Standpunt Van Een Bij, Leeft Ze Gewoon Haar Leven En Beschouwt Ze Zichzelf Als Vrij - Alternatieve Mening

Het Spontane Ontstaan van Leven In De Oceanen Is Bewezen - Alternatieve Mening

Leven - Wat Is Het? - Alternatieve Mening