Издательство Готовая книга




Правила Го, задачи для начинающих, партии мастеров Го.
Подфорум курирует А. Динерштейн  

Статистика из базы Биго

breakfast на rugo.ru Эксперт Го
19, January, 2005 19:22   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Черные выиграли 498.241 партий
Черные +R 291.425
Черные + 0.5 -7769
+1.5 -7794
+2.5 -7313
+3.5 -7412
+4.5 -6336
+5.5 -6403
+6.5 -5834
+7.5 -5621
+8.5 -4969
+9.5 -4700
+10.5-4381
+20.5-1694
+30.5-552
+40.5-240
+50.5-70
+100.5-0
Белые выиграли 583.739 партий
Белые +R -335.949
Белые +0.5 -8402
+1.5 -7790
+2.5 -7875
+3.5 -6909
+4.5 -7320
+5.5 -6629
+6.5 -6378
+7.5 -6064
+8.5 -5704
+9.5 -5388
+10.5-4947
+20.5-2158
+30.5-777
+40.5-285
+50.5-94
+100.5-1
Есть ли предположения, что происходит с победой 1.5 и 3.5 очка? Просто случайность?



Александр Динерштейн,
Go lessons [breakfast.go4go.net]
Разобранные партии [www.go4go.net]
Журнал "Гоама" [gogame.info]
Новости с серверов Го [GoSensations.com]

Re: Статистика из базы Биго
Barman на rugo.ru Гость
20, January, 2005 03:55   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Статистика весьма уважительная - более миллиона партий.
Белые выиграли у черных с перевесом в 85 498
Произвел в связи с этим следующий расчет. Если в партиях, где белые выиграли с перевесом меньше 6 очков (от 0.5 до 5.5) отобрать у них коми, то выиграют черные. Таких партий набирается 44 925.
Добавляем это количество к победам черных - получаем в итоге 543 166.
А из актива белых, наоборот, вычитаем это число - получаем 538 814, т.е. практически, абсолютное равенство.

Можно теперь обсуждать средний уровень играющих, но результат впечатляет в любом случае. Ранее, этот эффект, связанный с коми, уже обсуждался - см. "Как выбирать цвет в партии", но внятной оценки так и не получил. Может быть, в свете этих цифр продолжить обсуждение с подключением более широкого круга игроков - слишком уж вызывающий получился результат?



{Го – это роскошь, которую могут позволить себе немногие}

Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 08:24   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Результат ни чуть не вызывающий, а, как говорят в статистике, "не противоречащий" гипотезам о параметрах распределений. Для полного анализа ситуации здесь не хватает информации по распределению чисел по уровням игры. Это важно, так как верятность победы при сдвиге в полкамня (коми) зависит от этого уровня. Если считать статистику абсолютно точным выражением партий двух неких усредненных игроков с разницей ровно в пол-камня (коми) по уровню игры, то отсюда можно вычислить этот их средний уровень (вообще-то ошибка может быть в 1-2 ранга, а может быть и больше, за счет нелинейностей разного рода).

Действительно, возьмем формулу вероятностей в той форме, как она в новом проекте (замечу, что в данной ситуации точная форма кривой, будь то линейно-гипорболическая или экспорненциальная, не так важна, а важна производная в точке DR = 0, которая у всех используемых вероятностных кривых почти одинакова).

Итак, p = 0.5 + DR/dcp. Приравниваем к полученной частоте 54% (= 0.54) и находим:

dcp = 50/0.04 = 1250, т.е. между 3-м и 4-м кю (Rcp = 3000 - 1250 = 1750). Осталось проверить точность такой оценки. Для этого нужно вычислить средний ранг всех игроков, с учетом числа партий ими сыгранных в качестве статистических весов.

И несколько слов о дисперсии и оценке ошибки (возможной) в приведенной статистике за счет чисто вероятностных причин, а не ошибок в рейтинг-системе и пр. Рассматривая данную выборку как результат более миллиона испытаний в партии гипотетических соперников с разницей в полкамня в силе игры, получаем схему Бернулли, в которой среднее (мат. ожидание) равно Nхp, а дисперсия равна Np(1-p), или стандартное отклонение (корень из дисперсии) S ~ 500. Известно, что биномиальное распределение, порождаемое схемой Бернулли, является асимптотически нормальным с указанным S (предельная теорема Муавра-Лапласа). Размер выборки огромен, поэтому асимптотика применима с очень маленькой погрешностью. Это значит, что можно воспользоваться нормальностью распределения для оценок. Т.е. воспользоваться формулами для нормально распределенных величин.

Вероятность, что сумма отклонится от математического ожидания Np не более чем на некоторую величину Е равна тогда

P = 2 Фо(Е/S), где Фо - функция распределения Гаусса. Из таблиц находим, что для достоверности 95% Е должно быть равно ~ +- 1000, или в частоте около 0.1%.



Отправка отредактированного (20/01/05 09:20)

Re: Статистика из базы Биго
breakfast на rugo.ru Эксперт Го
20, January, 2005 09:15   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Имеет смысл продолжить статистику, так как на корейских игровых серверах в форовых партиях коми, как правило, составляет 0 очков,
что допускает возможность ничьих. Круглые результаты возможны и в турнирах по правилам Инга.
Ничьи -8080
Черные +1 - 60270
+2-29891
+3-18011
+4-12835
+5-11011
+6-9620
+7-9110
+8-7967
+9-7660
+10-7001
Белые +1 -69208
+2-36506
+3-20808
+4-15267
+5-12176
+6-10746
+7-9903
+8-9152
+9-8671
+10-7935

Примечание 1. В базе содержатся только те партии, где хотя бы один из соперников имеет разряд 4д или выше.
Примечание 2. База включает в себя 42233 партии, где хотя бы один из соперников профи.



Александр Динерштейн,
Go lessons [breakfast.go4go.net]
Разобранные партии [www.go4go.net]
Журнал "Гоама" [gogame.info]
Новости с серверов Го [GoSensations.com]

Re: Статистика из базы Биго
breakfast на rugo.ru Эксперт Го
20, January, 2005 09:40   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Еще один интересный момент.
Белые выиграли по времени 45740 партий
Черные 32362. Мне казалось, что эти числа должны быть близки.
Выводы могут быть такими:
1.Сильный игрок (который ,как правило, берет Белые) в безнадежных положениях сдается, а слабый
чаще доводит дело до падения флага.
2.Чем сильнее человек играет в Го, тем надежнее у него интернет соединение :)



Александр Динерштейн,
Go lessons [breakfast.go4go.net]
Разобранные партии [www.go4go.net]
Журнал "Гоама" [gogame.info]
Новости с серверов Го [GoSensations.com]

Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 09:49   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Возвращаясь к первой статистике (Биго), замечу, что она симметрична, если принять результат белых +0.5 как ничью. Отклонения в процентах побед наблюдаются и в статистике ЕГФ, поэтому вопрос о частотах для результата +3.5 и +0.5 - относится к рассеиванию в статистических частотатах при группировании для гистограмм. Здесь какая-то дисперсия и должна быть, а как же без нее?


Re: Статистика из базы Биго
godsword на rugo.ru Знаток Го
20, January, 2005 10:43   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Мне кажется, что Саша думает тут в провильном направлении.

Статистика, в основном, интернетная. Здесь надо искать корреляцию совсем с другими параметрами, нежели игровые.



"You see, dear Watson, but You don’t observe"

Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 11:45   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

По корейской статистике получаем без учета ничьих процент побед белых - 53.6%. Если считать ничьи в пользу белых, то 54.6%. Эти числа хорошо согласуются со статистикой Биго (54%+-0.4% с максимальным интервалом достоверности +-4S по частоте). Верятно, что средний уровень игроков по всем партиям в обеих статистиках примерно одинаков.


Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 11:52   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Учитывая, что белые изначально имеют преимущество в полкамня, должна быть корреляция с общим процентом побед белых. Вот что получилось: 45740/78102 = 58.6%. Т.е. в оба работают в одну сторону: фактор психологии складывается с преимуществом в полкамня, что и повышает процент - все сходится.


Re: Статистика из базы Биго
breakfast на rugo.ru Эксперт Го
20, January, 2005 12:29   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

С. Павлову. Поясняю,в базе всего около 1 100 000 партий, часть из них не имеет результата. Партии взяты с игровых серверов IGS, KGS, Cyberkiwon, Orozone, Neostone и Dashn, лишь небольшой процент из базы занимают турнирные партии профи и любителей вне интернета.
Есть такой вопрос:
По традиции, с случае ничейного исхода в форовой партии считается, что Белые выигрывают 0.5 очка.
Глядя на статистику по форовым партиям, кажется, что логичнее было бы сделать наоборот. В чем же причина этой традиции?



Александр Динерштейн,
Go lessons [breakfast.go4go.net]
Разобранные партии [www.go4go.net]
Журнал "Гоама" [gogame.info]
Новости с серверов Го [GoSensations.com]

Re: Статистика из базы Биго
Сахабутдинов на rugo.ru Знаток Го
20, January, 2005 12:44   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Оч-ч-ч-чень любопытная статистика... О сколько нам открытий чудных!...



Значение коми должно быть пересмотрено!

Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 14:21   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Статистика согласуется со сдвигом в полкамня форы, которые "недокомпенсируют" белые при форовой игре на серверах, если там нет точного выравнивания с помощью коми, а лишь по разнице рангов определяется гандикап. Есть серверы, где компенсация точна (WING). Вот оттуда бы статистику вытащить.

Теперь про пол-очка. Статистика Биго визуально симметрична относительно +0.5 в пользу белых. У корейской статистики симметрии такой уже нет. Это объясняется следующими факторами (имхо).

При абсолютно точном соответствии распределения очкового результата партии нормальному (гауссовскому) закону гистограммы должны быть симметричны относительно сдвига, т.е. полкамня или точного значения коми. Если принять его равным 7 очков, то нет симметрии ни в первой, ни во второй статистике. А суммарные величины отражают сдвиг порядка полкамня. В чем тут дело?

Значит, нет нормальности (строгой), но все равно близко к ней, со сдвигом. Это похоже на то, о чем говорил Бармен: коми в равной игре влияет по-разному на белых и черных. А в форовой игре аналогичный эффект может проявляться относительно такого же сдвига в полкамня - в пользу белых, а именно в том, что до какого-то порогового числа ходов о сдвиге незадумываются и играют в свою силу, причем если результат определится до этого попрога - партия заканчивается сдачей и в статистике сдвиг присутствует в чистом, так сказать, виде без психологических наслоений.

Если же к порогу результат близкий, то как-бы игра начинается снова, но почти с нулевой суммой (сдвиг исчез или очень мал, порядка 1-2 очка). Коми дополнительного нет, есть только 0.5 очка в пользу белых при равном результате. В итоге статистика результатов при малой разнице итоговых очков приобретает симметричный вид. Но партий с результатом под сдачу гораздо больше, чем в любой другой группе по очкам, и эти партии содержат неявно сдвиг в полкамня, который перевешивает "симметризованную часть" по вкладу в статистику. В итоге имеем то, что имеем - порядка 54% процентов в среднем по всем партиям.

Корейская статистика может имеет более низкую дисперсию из-за меньшего влияния всяких других факторов, вносящих дополнительную дисперсию на других игровых серверах. Это предположение.


Re: Статистика из базы Биго
Сергей Павлов на rugo.ru Знаток Го
20, January, 2005 15:02   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Еще замечание. Для корректной обработки статистики нужно знать число партий на равных, или эта статистика (Биго и корейская) равные партии не содержит?

Для равных партий нужно статистику отдельно обрабатывать, т.к. там коми и сдвигов никаких нет. А из статистики форовых игр такие партии надо выкинуть.




Извините, только зарегистрированные пользователи могут писать в этом форуме.

  Путь Го       Го-портал       Новости Го



Галерея И — уникальные наборы игры Го Книги по игре Го