Learn Go Game
Общение любителей и Мастеров игры Го

Шкала рейтинга

Serpov на rugo.ru Ценитель Го
15, October, 2003 09:19   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

В различных темах, в первую очередь по системам проведения турниров, так или иначе затрагиваются вопросы по рейтингу. Один из наиболее дискуссионных вопросов - какова реальная шкала рейтинг-очков в сопоставлении со шкалой разрядов и с игровыми очками? Что должна давать "идеальная" рейтинг-система (РС) и что наблюдается в РС РФГ, ЕГФ и других?

> 10-ти игровым очкам соответствует 1 шаг рейтинга на КГС , а также в РФ Го и в Европейской рейтинг-системе

Цитата взята из письма. Подразумевается, по-видимому, шаг в один дан или кю.

Итак, сколько?

В "идеале", как задумано изобретателями форового принципа (не воспринимайте слишком буквально :), один разряд должен соответствовать одному камню в том смысле, что изменение силы вашего соперника на один дан должно в точности компенсироваться изменением гандикапа на один камень (я буду называть это "Принципом гандикапа" или "Форовым принципом"). Один камень должен быть эквивалентен примерно удвоенному коми при пересчете в очковый результат партии (13-14 очков при малой форе, 15-16 очков в среднем).

Если в РС играются в достаточном количестве форовые рейтинг-партии с форой, устанавливаемой по разнице разрядов с линейной формулой "один дан - один камень", то рано или поздно шаг рейтинг-шкалы, соответствующий одному разряду, будет соответствовать одному камню (оговорюсь, что это только в правильных, достаточно сбалансированных РС, к каковым ни РС сервера КГС, ни сегодняшнюю РС РФГ я не отношу). Справедливость данного утверждения с достаточной точностью проверена для РС ЕГФ, об этом уже упоминалось. Доля форовых рейтинг-партий там около 13%. Процент побед белых при разнообразной форе колеблется от 58% до 60% для всех уровней игроков. Такая стабильность процента и является подтверждением соответствия форовому принципу, так как фора назначается формально со сдвигом на полкамня.

Почему РС должна стабилизироваться на шаге в один камень? Ведь и полкамня вот вспомнили. Потому что ошибки в назначении форы распределены симметрично относительно нуля и на большой статистике средняя ошибка (математическое ожидание) равна нулю. Это и подтвердила статистика ЕГФ.

В РС РФГ никто сейчас не знает, скольким игровым очкам соответствует шаг в 100 очков рейтинга, который "должен" соответствовать шагу в один камень форы, если принимается форовый принцип как основа РС. По крайней мере, это не 10 игровых очков в целом для всей РС, хотя для отдельных групп игроков это может быть и так. Уже многократно обсуждались в темах по рейтингу причины деформаций и механизмы их действия (вспомним, каков сейчас рейтинг Динерштейна в РС РФГ и в Европе).

В РС КГС шаг в один разряд, по видимому, близок к 10 игровым очкам вблизи отметки 1 дан - по экспертным оценкам. Хотя там ведь играюся рейтинг-партии на форе! А это значит, что при такой большой статистике, как на КГС, все должно утрясаться вокруг разницы в 15-16 игровых очков. Парадокс, не так ли?

Происхождение этого парадокса - из инертности РС. Хроническое отставание рейтинга игроков от соответствующего их силе разряда порождается слишком длинным хвостом учитываемых партий (учет по сроку, а не по числу; срок равен полгода). То есть за полгода активный игрок может сыграть сотню-другую рейтинг-партий, а некоторые умудряются наиграть и больше тысячи. РС же никак не учитывает изменение силы игры за этот период - наоборот, молча предполагается в алгоритме пересчета, что сила всех игроков за период обсчета (полгода) НЕИЗМЕННА, независимо от числа сыгранных партий.



Смотри в корень

О соответствии различных рейтинг-систем
Serpov на rugo.ru Ценитель Го
15, October, 2003 10:13   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

> РС КГС в целом соответствует нынешней РС РФ Го

Если взять почти любые две РС, то легко обнаружить "в целом соответствие" между ними. Даже на игровых серверах (с необходимым линейным сдвигом иногда).



Смотри в корень

Re: Шкала рейтинга
Илья Ветров на rugo.ru Ценитель Го
15, October, 2003 15:10   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

> Процент побед белых при разнообразной форе колеблется от 58% до 60% для всех уровней игроков. Такая стабильность процента и является подтверждением соответствия форовому принципу, так как фора назначается формально со сдвигом на полкамня.

Спасибо , Сергей . Очень убедительно . Я не знал этих данных . Просто для окончательной точки : сейчас в рейтинговых форовых турнирах ЕГФ фора устанавливается как разница рангов , т.е. например 1-й дан играет с 1-м кю белыми без форовой расстановки и без коми , так ?

Если так , то конечно РС РФ Го надо согласовывать с РС ЕГФ и для этого перенять практику форовых рейтинговых игр с прямой форой , может быть с поправкой на коми .

> В РС КГС шаг в один разряд, по видимому, близок к 10 игровым очкам вблизи отметки 1 дан - по экспертным оценкам.

Конечно одного прошедшего С.-Ф. турнира на КГС маловато , но в нем фора назначалась в предположении , что шаг ранга равен 10 игровым очкам . Белые выиграли в 17 форовых партиях , черные - в 14 . Весьма возможно , что фора была слегка заниженной , и шаг ранга на КГС равен 11 или 12 очков . Если в ЕГФ шаг ранга = 16 очков , а в РФ Го около 14 , то отличие от шага 12 трудно заметить .

> Хотя там ведь играюся рейтинг-партии на форе! А это значит, что при такой большой статистике, как на КГС, все должно утрясаться вокруг разницы в 15-16 игровых очков. Парадокс, не так ли?

На КГС играется мало рейтинговых партий с большими форами (сужу по себе и по тем игрокам , за которых болею) . Типичные форы 1 или 2 , но коми в форовых партиях сервер устанавливает в ноль , и обычно игроки соглашаются . Если бы все играли на форе 1 , шаг ранга получился бы около 7 очков , если бы все играли на форе 2 , шаг ранга был бы около 12 очков , большие форы дают некоторый вклад , и в итоге шаг ранга чуть больше 10 игровых очков .

> Один камень должен быть эквивалентен примерно удвоенному коми при пересчете в очковый результат партии (13-14 очков при малой форе, 15-16 очков в среднем).

Все-таки по-моему правильнее считать ценность всех форовых камней одинаковой - 16 очков . Мы знаем общепринятое коми 6.5 (которое принято волевым решением и вроде бы по-прежнему не обеспечивает равенство шансов) и малонадежную оценку форы 9 камней в 140 очков . Этих данных слишком мало , чтобы строить по ним нелинейный график .

А линейная формула (16*Ф-8) укладывается в границы точности и дает значение коми 8 , что соответствует коми по Ингу и вообще кажется более точным . Из этого не следует реформа турнирного коми , оно может оставаться 6.5 , и тогда формула ценности форы будет (16*Ф-9.5) . Но "эталонное коми" вероятно = 8 , и ценность форового камня = 16 .

С уважением , Илья



Отправка отредактированного (15/10/03 16:15)

Наш рот всегда открыт для диалога (c) Владимир ВишневскийOkruzhor (экс-Игозавр)

Нет возражений
Serpov на rugo.ru Ценитель Го
15, October, 2003 21:07   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Единственно, что хочу добавить: нельзя по статистике малой форы судить, что уменьшается шаг в игровых очках. Если я правильно понимаю строение РС, то какая бы фора не давалась, вероятность-то все равно правильно будет учитываться. Значит этот сдвиг форы не сказывается непосредственно.

Все обсуждение проекта РС велось как раз вокруг того, как бы ввести в практику форовые турниры. Нужны решения на уровне президиума. Чтобы в календарь включались такие турниры в обязательном порядке.

А проценты эти (59% побед белых) я уже публиковал на форуме и раньше, при обсуждении РС.

Ошибка симметрична
Serpov на rugo.ru Ценитель Го
16, October, 2003 10:08   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

> На КГС играется мало рейтинговых партий с большими форами (сужу
> по себе и по тем игрокам , за которых болею) . Типичные форы
> 1 или 2 , но коми в форовых партиях сервер устанавливает в ноль ,
> и обычно игроки соглашаются . Если бы все играли на форе 1 ,
> шаг ранга получился бы около 7 очков , если бы все играли
> на форе 2 , шаг ранга был бы около 12 очков ,
> большие форы дают некоторый вклад ,
> и в итоге шаг ранга чуть больше 10 игровых очков .

Величина форы, чаще употребляемой, не влияет на шкалу. Если я даю фору с недобором, то потом и получаю также - ошибка симметрична и в среднем погашается. Кроме того, РС правильно учитывает несоответствие форы и разницы рейтингов: в формуле вероятности поправка на фору дает неравные шансы. Поэтому при пересчете рейтинга все должно было бы получаться автоматически правильно, независимо от этих ошибок. Суть искажений все-таки в инертности (см. предыдущее).



Отправка отредактированного (16/10/03 12:38)

Смотри в корень

Еще и формула вероятностей вносит вклад
Serpov на rugo.ru Ценитель Го
16, October, 2003 10:56   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Кроме инертности, вклад в деформацию шкалы вносит сама формула вероятностей. Это уже анализировалось при обсуждении РС. Какова формула на КГС? Мы знаем только общий вид, но не знаем параметров. От них все и зависит. Если вероятность победы более сильного занижена, то происходит растягивание шкалы (разница в один разряд по "каменному" эквиваленту соответствует более чем одной рейтинг-ступени). Или при разнице в К "данов КГС" фора, уравнивающая шансы, меньше чем К камней + коми за полкамня. Похоже, такая ситуация сейчас и имеет место.

В российской РС аналогичное явление наблюдается только в верхней части рейтинг-листа (Динерштейн и игроки около него). Но формула РС РФГ гораздо точнее формулы, прменявшейся в ЕГФ до 1998 года, так как ее параметры были выбраны на основе статистической обработки результатов дан-партий в советских турнирах второй половины 80-х (я сам это делал). Использованная статистика (усредненно по всем данам) хорошо согласуется с европейской статистикой (расхождение в пределах 1%).

Как выбирались параметры в РС КГС? В АГА (American Go Association) тоже используется РС Томпсона (итерационная система типа РС КГС), но там статистические данные, опубликованные на сайте АГА в разделе по рейтингу, не вызывают доверия. Превышение вероятности победы более сильного над 50% там почти вдвое выше, чем в Европе (в АГА - 83% при разнице в 1 дан против среднего по всем данам 67% для Европы и России). Такой процент по формуле из нового проекта РС справедлив только для игроков, не ниже 7-го дана. Статистика АГА показывает, по-видимому, накопленное за многие годы искажение шкалы. Такое завышение вероятности должно уплотнять шкалу и мы наблюдаем немеряное число 6-данов в рейтинг-листе АГА.



Смотри в корень

Признак занижения
Serpov на rugo.ru Ценитель Го
16, October, 2003 11:06   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

В рейтинге КГС уже стало обыденным наблюдать игроков с 8-м, 9-м и выше данами (судя по публикуемому графику). По аналогии с задиранием рейтинга Динерштейна и других в РС РФГ, это может говорить о заниженной вероятности победы более сильного игрока, по крайне мере для верхней части рейтинг-листа. Не думаю, что все эти высокие даны действительно соответствуют про-уровню (7д = 1р, 8д = 5р, 9д = 9р).



Отправка отредактированного (16/10/03 11:07)

Смотри в корень

Re: Признак занижения
Максим Подоляк на rugo.ru Любитель Го
16, October, 2003 15:09   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Заметка: на ИГС есть игрок tobe 8d, он откуда-то из Южной Америки. До этого уровня он дотопал пешком, это рейтинг ИГС. На сервере хранятся его партии с Рю Найвэй 9 дан и ещё с парой-тройкой профессионалов высших данов (он видно в их тусовке).

Я люблю посмотреть его партии - он оччень сильно играет, хотя всегда проигрывал профи (за единичными исключениями).

Полагаю, это оченьоченьоченьочень сильный любитель, готовый стать профессионалом. Новсё равно проигрывает.

Re: Шкала рейтинга
Scarlet на rugo.ru Любитель Го
16, October, 2003 16:21   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Эх, когда же я такимтакимтакимтаким буду :(

Re: Признак занижения
Salivan на rugo.ru Гость
28, October, 2003 20:38   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

А как считает рейтинг Панда (IGS) ? чтото никак не могу врубиться ? по-моему, меня давно пора повысить ... :(

IGS
KOCMOHABT на rugo.ru Гость
28, October, 2003 23:38   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

> Заметка: на ИГС есть игрок tobe 8d

Хочу поправить: tobe - 12d на IGS. Я тоже смотрел партии tobe: у профессионалов он выигравал и проигрывал им, кроме того он ставил большие форы сильным любителям и часто выигрывал, поэтому я думаю, что tobe - профессионал

> А как считает рейтинг Панда (IGS) ? чтото никак не могу
> врубиться ? по-моему, меня давно пора повысить ... :(

Чтобы узнать как считается рейтинг на IGS наберите команды:
help calculated - там подробно описана схема пересчета
help math - математическая часть расчета рейтинга
help example, help example2 - примеры

Re: Шкала рейтинга
bamigo на rugo.ru Гость
29, October, 2003 01:08   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Ходят слухи, что tobe это Jimmy Cha, 4 дан про из США

Объяснение появлению высоких данов
Serpov на rugo.ru Ценитель Го
29, October, 2003 12:43   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Я пока не смотрел формулы рейтинга ИГС, но обычно завышенные даны - следствие неправильной формулы вероятностей, занижающей вероятность победы, в том числе и на форе, причем чем больше фора - тем больше может быть несоответствие. Тогда ранг среднего профи без других близких по силе игроков может действительно задраться, как и рейтинг Динерштейна в российском РЛ (завышение около 150 очков).



Отправка отредактированного (29/10/03 15:47)

Смотри в корень

Выписка из протокола
Serpov на rugo.ru Ценитель Го
01, November, 2003 16:15   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Наконец-то получил долгожданный протокол заседания Президиума, на котором обсуждалась реформа рейтинг-системы. Вот выписка из протокола заседания Президиума РФГ(Б) от 27.06.2003.

Повестка дня:

2. О рейтинг-системе РФГ(Б) (докл. С. Павлов, Ю. Беляев)

Постановили:

По 2-му вопросу:
– Принять предложенную Павловым редакцию рейтинг-системы (РС) РФГ(Б).
– Поручить Ю. Беляеву написать компьютерную программу на основе новой редакции РС РФГ(Б) (срок – октябрь 2003 г.),
– Ввести в действие новую РС РФГ(Б) после тестирования программы и уточнения ее параметров,
– Создать рейтинг-комиссию (РК). Назначить председателем РК С. Павлова.
– Поручить председателю РК ввести в РК необходимых членов РФГ(Б) и разработать систему мероприятий для нормального функционирования РС РФГ(Б).

Справка: рабочий вариант программы уже написан, готовится база турниров и партий для тестирования и уточнения параметров РС.

Re: Шкала рейтинга
Максим Подоляк на rugo.ru Любитель Го
01, November, 2003 23:17   Об авторе Фотографии автора Партии автора Набор Го автора
 +    0     

Гип-Гип Урррра! Уррррра! Урррра!



Извините, только зарегистрированные пользователи могут писать в этом форуме.

  cassino online brasil   apuestas online en chile   Go game in Russia   Online Go lessons   How to Play Go