В научном журнале Nature опубликовали статью с описанием последних достижений нейросети MuZero, развитием которой занимается компания Deepmind. Программа научилась одинаково хорошо играть в шахматы и компьютерные игры. При этом ей даже не пришлось объяснять правила. MuZero учится самостоятельно, просто наблюдая за ходом игры.
Нейросети от Deepmind стали известны миру в 2016 году, когда AlphaGo в 4 партиях из 5 победила одного из сильнейших игроков мира в го. Ранее эта китайская настольная игра считалась слишком сложной для компьютеров. Более мощная версия нейросети, AlphaZero, научилась совершенствоваться без участия человека. Программа играла сама с собой, осваивая одну игру за другой.
В алгоритме MuZero используется подход, аналогичный AlphaZero. Для обучения нейросеть играет сама с собой. Также её противником становилась программа AlphaZero. Всего за 12 часов тренировок и 800 млн игровых сессий MuZero достигла уровня AlphaZero в шахматах, го и других настольных играх, а также превзошла все существующие нейросети, кроме Agent57, при прохождении Pac-Man и других компьютерных игр.
Источник: