Хамэтэ и предел рейтинга
ОС и ИИ
О хамэтэ со стороны идеального игрока (будем обозначать его через ИИ - как-то не хочется употреблять "божественных" названий; также
обозначается обычно и "искусственный интеллект", что в общем близко по сути). Есть общая теорема теории антагонистических игр двух лиц с полной информацией, в соответствии с которой в го (вернее, в формализованной игре двух лиц, моделирующей реальное го) существует оптимальная стратегия (ОС; тут я не знаю, что имел ввиду Алексей под АОС? Оптимальная стратегия либо существует, либо нет, но причем здесь "абсолютность"?).
Надо определить, что такое ИИ. Будем понимать под ИИ алгоритм (может реализованный в виде программы даже), реализующий ОС в игре го (не важно, за какую из сторон и с какой начальной позицией; если ОС есть, то ее можно применять не обязательно с первого хода - игра однородна и нет оснований подозревать исключительность начальной позиции - пустой доски - в смысле существования ОС).
В рамках введенных понятий теряет смысл говорить о хамэтэ в игре ИИ против человека. С точки зрения достижения цели - выигрыша партии - ИИ нет смысла изощряться, если уже и так достигнута выигрышная позиция (отсутствует такая ветка в алгоритме). Вполне возможно, однако, говорить об ОС для специальных случаев, когда вводится дополнительная информация о сопернике, его слабых и сильных сторонах, но это уже несколько другая игра, и эта информация не абсолютно достоверна, т.е. ее можно использовать только на вероятностной основе и пр. А тогда вопрос о существовании ОС в так модифицированной игре остается открытым. Хотя указанный подход и ближе к реальной игре двух игроков го.
ПРЕДЕЛ РЕЙТИНГА
Теперь несколько слов о пределе по рейтингу - рейтинге ИИ и пр.
Да, правильно: внутри системы со свободным параметром - точкой отсчета и внутренним свойством линейности и однородности (обычные рейтиги типа ЭЛО), если нет специальных стабилизаторов, препятствующих дрейфу, невозможно определить, плывет система куда-то или нет. Так, в системе ЭЛО заложено правило сохранения суммы рейтинга в отдельных партиях. Это - внутренний стабилизатор системы ЭЛО и она не может куда-то существенно уплыть в принципе, хотя отдельные игроки могуть существенно менять свои границы колебаний рейтинга. В системе ЭЛО рейтинг может только "рождаться" при вводе новых игроков или "утекать" при выбывании. Внутри же системы происходит только перераспределение рейтинга, а на каждом интервале времени, где нет притоков-оттоков, суммарный рейтинг в системе сохраняется. Но не сохраняется суммарная сила игры - она растет (мы оптимисты). По крайней мере, изменяется.
В такой ситуации вообще говорить о каких-то абсолютных точках отсчета бессмысленно - это действительно свободный параметр. И об ИИ здесь тоже сложно говорить, так как непонятно как его рейтинг привязать к очень подвижной в своих различных частях шкале.
Теперь вернемся к ИИ и задумаемся, что означает само существование ОС и ИИ?
Во многих сферах деятельности существуют физические ограничения, а для спорта - физиологические: никто не сможет прыгать выше 5 м без перерождения генетического или еще какого, бегать быстрее звука и т.д. То есть, существуют верхние пределы совершенствования практически во всех сферах, где можно установить количественные параметры, отвечающие за эту самую "степень совершенства", т.е. приближения к идеальному спортсмену, исполнителю и т.п. Что означает это в применении к го с его ИИ? Высшая степень совершенства - отсутствие ошибок в игре, которые приводят к потерям очков результата. Это и реализуется в ИИ. Поскольку действия любого человека "далеки от совершенства", он совершает ошибки (в отличие от ИИ), которые носят случайный характер и мы можем изучать свойства распределений таких случайных величин. Этим занимается прикладная математическая статистика (не только в го или других играх). По сути определения ошибки в игре - эта величина почти всегда больше нуля (будем считать именно потерянные очки), кроме случая ИИ, который не ошибается. Отсюда вывод: степень совершенства можно определять по среднему уровню ошибок, совершаемых тем или иным игроком. Свойства распределений ошибок можно изучать методами мат. статистики, на этом основаны в том числе почти все рейтинг-системы. Что такое проигрыш? Это тоже проявление свойств тех же самых распределений. Здесь естественно предположить, что распределения если и не точно соответствуют нормальному закону, но близки к нему, т.к. сладываются из множества факторов, каждый из которых не имеет доминирующего влияния на результаты. Да и в партиях результат складывается из множества ходов, при каждом из которых делаются сравнительно небольшие ошибки (не рассматриваем сейчас случаи грубых ошибок - они выпадают из рассмотрения в статистике). В турнирах реализуются схемы Бернулли, имеющие асимптотически тоже нормальные свойства. В общем, Гаусс всюду нас обложил... В этих условиях предел возможностей ассоциируется со снижением дисперсии неких нормальных распределений и это естественно. Для го - это ошибки в партии, и тот, у кого дисперсия ошибок меньше, имеет и более низкую среднюю величину ошибки при каждом ходе. Отсюда и возникает та самая верхняя граница, "предел совершенствования в силе игры в го", вопрос лишь в том, где назначить точку отсчета? Естественно, в рейтинге, соответствующем ИИ. Мы задали его в новом проекте РС равным 3000, что было обосновано существующими реально на сегодня соотношениями в статистических данных по результатам партий в Европе. Хотя в принципе это не так важно - можно задать любое число, но как оно будет связано с существующими классификациями? И какие могут быть гарантии, что РС не уплывет, или еще хуже - не перепрыгнет вдруг через этот потолок?
И здесь вступает в силу то, что дисперсия ошибок монотонно снижается с ростом уровня игры. Это проявляется статистически в том, что частоты побед более сильных игроков в партиях без форы при какой-то одной фиксировнной разнице в рейтинге (ранге) монотонно растут при приближении к отметке в 3000 пунктов (10 ама-дан или 13 про-дан). Обработка статистики ЕГФ вообще дала с очень высокой степенью достоверности формулу зависимости вероятности побед от рейтингов соперников в виде линейно-гиперболической функции (см. стр. Рейтинг в ГБ). Если предполагать существование предела, то он должен проявляться в этой зависисмости в виде асимптоты, для каждого значения разницы рейтингов одной и той же. Именно это и проявилось при обработке статистики ЕГФ! Все гиперболы имеют примерно (статистически) одну и ту же асимптоту (или прямые - при инверсии по зависимой переменной - одну и ту же точку пересечения с горизонтальной осью).
Это значение рейтинга было вычислено и оказалось равным 3000 - для сегодняшней статистики ЕГФ (может через 10 лет оно станет другим?). Но факт остается фактом. Если взять и зафиксировать точку отсчета 3000 пунктов, и далее применять формулу с линейно-гиперболической зависимостью вероятности от рейтингов (их разницы и среднего расстояния до 3000 - см. описание проекта РС в ГБ), то система не будет никуда ползти в принципе (почему?). Вот вам ответ про относительность, скорость поезда и планет, дрейф рейтинг-систем и прочее. И отсюда же следует невозможность скачков, о которых говорил Илья и пр., так как дисперсия может только снижаться с ростом уровня в целом всех игроков, лучшего понимания игры, развития теории и т.д. А зазор между сегодняшними профи и ИИ конечен и известен (примерно). Выше этого зазора скачков быть не может.
Отправка отредактированного (14/01/05 10:58)