Код креативности. Как искусственный интеллект учится писать, рисовать и думать - Маркус Дю Сотой Страница 12
Код креативности. Как искусственный интеллект учится писать, рисовать и думать - Маркус Дю Сотой читать онлайн бесплатно
AlphaGo это направление атаки, по-видимому, совершенно не беспокоило. К 70-му ходу комментаторы уже начали замечать, что AlphaGo снова одерживает верх. Об этом свидетельствовала и последовательность ее осторожных ходов, которые означали, что AlphaGo уверена в своем преимуществе. Чтобы снова перехватить инициативу, Ли Седолю нужно было придумать нечто необычное.
Если 37-й ход второй партии был моментом проявления творческого гения AlphaGo, то 78-й ход четвертой стал ответным ударом Ли Седоля. В течение 30 минут он сидел за доской, рассматривая картину своего поражения, а затем неожиданно поставил белый камень в необычное положение, между двумя черными камнями AlphaGo. Общее мнение по этому поводу выразил Майкл Редмонд, комментировавший игру на YouTube-канале: «Этот ход застал меня врасплох. Я уверен, что он застал бы врасплох большинство противников. Мне кажется, что он застал врасплох и AlphaGo».
Впечатление создалось именно такое. Ответный ход Alpha-Go был странным: казалось, что программа не заметила, что произошло в игре. Еще через несколько ходов AlphaGo поняла, что проигрывает. Сотрудники DeepMind, смотревшие за кулисами на свои экраны, наблюдали крах своего творения. Выглядело это так, будто 78-й ход вызвал в программе короткое замыкание. И это привело к полному распаду игры AlphaGo – она сделала целую серию губительных для себя ходов. По-видимому, это тоже характерно для программных алгоритмов игры в го. Как только они видят, что проигрывают, их поведение становится совершенно иррациональным.
Когда Силвер, главный программист, увидел очередной ход, который предложила AlphaGo, он даже вздрогнул: «По-моему, они будут смеяться». И действительно, корейские комментаторы принялись хихикать над ходами, которые делала Alpha-Go. Теперь ее ходы не удовлетворяли условиям теста Тьюринга. Никакой человек, обладающий хотя бы зачатками чувства стратегии, не играл бы таким образом. Игра продолжалась до 180-го хода, после чего AlphaGo вывела на экран сообщение о капитуляции. Весь пресс-центр взорвался аплодисментами.
Род человеческий отыграл одно очко. Счет в матче Alpha-Go – человечество стал 3: 1. Улыбка, сиявшая на лице Ли Се-доля на вечерней пресс-конференции этого дня, была красноречивее всяких слов. «Эта победа настолько ценна, что я не променял бы ее ни на что на свете». Журналисты бешено ликовали. «Ее обеспечили ваша поддержка и ваше сочувствие».
Гу Ли, комментировавший этот матч в Китае, приписал 78-й ход Ли Седоля «божественному вмешательству». Этот ход шел вразрез с традициями игры, и в конечном счете именно это придало ему такую потрясающую силу. Но именно этим и отличается подлинное человеческое творчество. Это хороший пример преобразовательного творчества по Боден, в рамках которого к новым идеям можно прийти путем взлома существующей системы.
На пресс-конференции Хассабис и Силвер не смогли объяснить, почему AlphaGo потерпела поражение. Чтобы понять, почему программа так бездарно ответила на 78-й ход Ли Се-доля, им нужно было проанализировать предыдущие данные.
Оказалось, что опыт игры против людей внушил AlphaGo, что о таком ходе не стоит даже думать. По оценке программы вероятность использования его в игре составляла не более одной десятитысячной. По-видимому, программа даже не озаботилась изучить возможные ответы на такой ход, так как придавала большее значение другим ходам, более вероятным и, следовательно, более достойным разработки ответной тактики.
Возможно, Ли Седолю просто нужно было узнать своего противника. Возможно, в более долгом матче он сумел бы перехватить у AlphaGo инициативу. Сможет ли он сохранить свое преимущество в пятой, последней, партии? Проигрыш со счетом 3: 2 был бы совсем не тем же, что проигрыш со счетом 4: 1. Последняя партия все еще стоила приложения всех сил. Если бы он сумел выиграть вторую партию, это позволило бы усомниться в способности AlphaGo удержать превосходство.
Но AlphaGo извлекла из своего поражения ценный урок. Сейчас применение хода Ли Седоля, вероятность которого не превышает одной десятитысячной, в игре против ее алгоритма уже не дает победы. В этом и состоит сила алгоритмов такого рода. Они учатся на своих ошибках.
Это не значит, что алгоритм не может совершать новых ошибок. В некоторый момент в самом начале пятой партии казалось, что AlphaGo совершенно не знакома со стандартным набором ходов, который используется в формировавшейся на доске позиции. Хассабис, находившийся за кулисами, писал в твиттере: «#AlphaGo допустила серьезную ошибку на раннем этапе игры (она не знала хорошо известного тэсудзи [20]), но теперь пытается выбраться из ловушки… положение безумно напряженное».
На этом этапе Ли Седоль был впереди. Игра шла полным ходом. Постепенно AlphaGo удалось выбраться из ловушки. Но до самого конца партии сотрудники DeepMind не были уверены, выигрывает ли их программа. Наконец, на 281-м ходу – после пяти часов игры – Ли Седоль сдался. На этот раз за кулисами ликовали. Хассабис триумфально воздел руки. Все члены команды жали друг другу руки и обнимались. Победа, которую Ли Седоль одержал в четвертой партии, неожиданно возродила в них дух соревнования. Им было важно не проиграть и эту партию.
Вспоминая этот матч, многие признают, насколько необычайным было это событие. Кое-кто сразу же объявил его переломным моментом в истории искусственного интеллекта. Конечно, эта машина всего лишь умела играть в настольную игру, и тем не менее в ее способности к обучению и адаптации внимательные наблюдатели увидели нечто принципиально новое. Хассабис подытожил достигнутый результат в сообщении, опубликованном в твиттере после победы в первой партии: «ПОБЕДА #AlphaGo!!!! Мы высадились на Луну». Сравнение было удачным. Высадка на Луну не дала нам какой-либо потрясающей новой информации о Вселенной, но ее дали технологии, которые мы разработали для получения этого результата. После финальной игры матча Южнокорейская ассоциация го удостоила программу Alpha-Go почетного девятого профессионального дана – высшей почести для игрока в го.
С холма на горную вершину
37-й ход второй партии был настоящим творческим достижением. Он был решением новаторским и, несомненно, неожиданным, и дальнейший ход игры доказал его ценность. Это необычайное творческое решение, раздвинувшее границы игры до новых пределов.
Один из важных аспектов игры го заключается в том, что ценность новаторского хода можно оценить объективно. Придумать нечто новое, творческое на вид, может кто угодно. Подлинное искусство – и по-настоящему трудная задача – состоит в изобретении чего-то не просто нового, но и ценного. В чем же состоит эта ценность? Она может быть очень субъективной и меняться со временем. Произведение, которое критики разносили в момент его появления, может быть признано следующими поколениями революционным творческим достижением. Слушатели XIX века не понимали Пятой симфонии Бетховена, а сейчас она входит в основной репертуар. При жизни Ван Гогу с трудом удавалось продавать свои картины – по большей части он обменивал их на еду или художественные принадлежности, – а теперь они покупаются за миллионы. В игре го есть более осязаемый и быстродействующий критерий ценности хода: помогает ли он выиграть партию? 37-й ход обеспечил AlphaGo победу во второй партии. У нас есть объективная мера, позволяющая определить ценность новизны этого хода.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.
Comments