Kunstmatige Intelligentie Begon 10 Keer Sneller En Efficiënter Te Leren - Alternatieve Mening

Kunstmatige Intelligentie Begon 10 Keer Sneller En Efficiënter Te Leren - Alternatieve Mening
Kunstmatige Intelligentie Begon 10 Keer Sneller En Efficiënter Te Leren - Alternatieve Mening
Anonim

De afdeling kunstmatige intelligentie van Google heeft de creatie aangekondigd van een nieuwe methode voor het trainen van neurale netwerken, waarbij het gebruik van geavanceerde algoritmen en oude videogames wordt gecombineerd. Oude Atari-videogames worden gebruikt als leeromgeving.

De ontwikkelaars van DeepMind (herinner me dat deze mensen het AlphaGo neurale netwerk hebben gecreëerd, dat herhaaldelijk de beste spelers in het logische spel go heeft verslagen) geloven dat machines op dezelfde manier kunnen leren als mensen. Met behulp van het DMLab-30-trainingssysteem, gebaseerd op de Quake III-shooter en Atari-arcadespellen (er worden 57 verschillende games gebruikt), hebben ingenieurs een nieuw IMPALA-algoritme (Importance Weighted Actor-Learner Architectures) machine learning ontwikkeld. Het stelt afzonderlijke onderdelen in staat om meerdere taken tegelijk uit te voeren en vervolgens onderling kennis uit te wisselen.

Image
Image

In veel opzichten was het nieuwe systeem gebaseerd op het eerdere Asynchronous Actor-Critic Agents (A3C) architectuursysteem, waarin individuele agents de omgeving onderzoeken, vervolgens wordt het proces gepauzeerd en wisselen ze kennis uit met de centrale component, de "student". Wat IMPALA betreft, het kan meer agenten hebben en het leerproces zelf vindt op een iets andere manier plaats. Daarin sturen agenten informatie naar twee "studenten" tegelijk, die vervolgens ook gegevens met elkaar uitwisselen. Bovendien, als in A3C de berekening van de gradiënt van de verliesfunctie (met andere woorden, de discrepantie tussen de voorspelde en verkregen parameterwaarden) wordt gedaan door de agenten zelf, die informatie naar de centrale kern sturen, dan wordt deze taak in het IMPALA-systeem gedaan door de "studenten".

Een voorbeeld van een persoon die het spel speelt:

Dit is hoe het IMPALA-systeem dezelfde taak afhandelt:

Een van de grootste uitdagingen bij het ontwikkelen van AI is tijd en de behoefte aan hoge rekenkracht. Zelfs wanneer ze autonoom zijn, hebben machines regels nodig die ze kunnen volgen in hun eigen experimenten en het vinden van manieren om problemen op te lossen. Omdat we niet alleen robots kunnen bouwen en ze laten leren, gebruiken ontwikkelaars simulaties en deep learning-technieken.

Om moderne neurale netwerken iets te laten leren, moeten ze een enorme hoeveelheid informatie verwerken, in dit geval miljarden frames. En hoe sneller ze het doen, hoe minder tijd het kost om te leren.

Promotie video:

Met voldoende processors, zegt DeepMind, haalt IMPALA 250.000 frames per seconde, oftewel 21 miljard frames per dag. Volgens The Next Web is dit een absoluut record voor dit soort taken. De ontwikkelaars geven zelf aan dat hun AI-systeem de taak beter aankan dan vergelijkbare machines en mensen.

In de toekomst kunnen vergelijkbare AI-algoritmen worden gebruikt in robotica. Door machine learning-systemen te optimaliseren, passen robots zich sneller aan hun omgeving aan en werken ze efficiënter.

Nikolay Khizhnyak

Aanbevolen: