Каспаров электронного мира: как ИИ обыграл сильнейших конкурентов
AlphaZero, искусственный интеллект, созданный компанией DeepMind — дочерним предприятием Google, — первая в мире шахматная программа, научившаяся играть менее, чем за 4 часа, сообщает The Guardian
Программа, которая обыграла лучшую в мире программу-игрока в го AlphaGo , теперь переориентировалась и готова изучать другие игры. Всего четырех часов обучения хватило ей, чтобы переиграть лучшую в мире шахматную программу Stockfish 8, проведя 100 партий. Все 100 партий она выиграла.
«Начиная с рандомной игры и не зная основ, владея только правилами, AlphaZero добилась за 24 часа сверхчеловеческого уровня игры в шахматы и сёги (аналогичную японскую настольную игру), а также го и убедительно победила чемпиона мира в каждом случае», — пишут авторы статьи.
Среди них — основатель DeepMind Демис Хассабис, который был шахматным вундеркиндом и достиг уровня мастера в возрасте 13 лет.
«Это заметное достижение, даже если бы мы ожидали этого от программы после победы над AlphaGo», — заявил чемпион мира по шахматам Гарри Каспаров. «Мы всегда считали, что шахматы требуют слишком много эмпирических знаний, чтобы машина играла так хорошо с нуля, без каких-либо человеческих знаний».
Компьютерные программы смогли победить лучших шахматистов мира, а самого Каспарова 12 мая 1997 года победил суперкомпьютер IBM Deep Blue.
В DeepMind рассказали, что разница между AlphaZero и ее конкурентами заключается в том, что эта программа использует чисто машинный подход ,не имея никакого человеческого вклада, кроме основных правил шахмат. В остальном она играет сама с собой снова и снова, самообучаясь. В результате AlphaZero проявляет, возможно, более человеческий подход к поиску ходов, обрабатывая всего около 80 тыс. позиций в секунду, в то время, как сайт Stockfish 8 обрабатывает 7 млн.
Программа одержала победу в 25 шахматных партиях против Stockfish 8, начиная с белых, с преимуществом первого броска, еще три, начиная с черных и сведя в ничью еще 72 игры. AlphaZero также научилась сёги за два часа до победы над ведущей программой Elmo в 100 играх подряд. AlphaZero выиграла 90 игр, проиграла восемь и сыграла в ничью 2.
Новая AlphaZero также смогла победить «сверхчеловеческую» версию самого AlphaGo в китайской игре го после восьмичасового самообучения. Выиграла 60 игр и проиграла 40.
Эксперты заявили, что результаты впечатляют и имеют потенциал в широком спектре применений, дополняющих человеческие знания. Профессор Джоанна Брайсон, ученый-компьютерщик и исследователь ИИ из Университета Бата, предупредила, что это «все еще дискретная задача» .
Еще никто не комментировал данный материал.
Написать комментарий