Re: Ст. отклонения в Драгуниаде
Алексей, была же дискуссия на форуме, проект в ГБ в новой редакции лежит уже несколько месяцев (я думал, все читали :). Но напомню суть.
Стандартное отклонение нормального закона распределения (такова основополагающая гипотеза всех рейтинг систем относительно случайной величины, моделирующей (описывающей) силу игры, уровень мастерства на отдельном рейтинговом интервале (не путать со случайной величиной ошибок в партии! - Та ошибка "ненормальна"). Вывод о нормальности распределения для случайной величины - "отклонения рейтинга от истинной силы" - проистекает из асимптотической нормальности распределения "схемы Бернулии", т.е. биномиального распределения. Поэтому при всех научных исследованиях рейтинг-систем рассматривают нормально распределенные случайные величины, для которых строят оценки их "среднего" (рейтинг) и в некоторых РС, таких как РС Гликмана - также и оценки "ст. отклонения".
В данном случае использованы результаты М.Гликмана и мои собственные, и при некоторых упрощениях (об этом - в ГБ) получены значения нового рейтинга и ст. отклонения. Что это конкретно значит?
У Межова - S=70. То есть 95% доверительный интервал равен +-140 пунктов, а если брать только +-S (+-70), то доверительная вер-ть только 68%. И т.д. Или вот Вам "физический смысл" достоверности: это есть вероятность, что такой-то интервал с центром в значении рейтинга ("оценка" мат. ожидания) "накрывает" истинное значение "силы игры" . Постепенно, с участием в новых турнирах, каждый игрок будет сокращать свой доверительный интервал (формально нет ограничения снизу). В среднем этот интервал пропорционален расстоянию рейтинга от 3000 пунктов (от рейтинга идеального игрока). Относительно бОльшую дисперсию (квадрат стандартного отклонения) имеют те игроки, кто показал более "аномальные" результаты. В целом дисперсия в ст. отклонении по всей совокупности участников (если ее "пронормировать" на расстояние от идеального игрока) совсем незначительная. Т.е. после первого же турнира наблюдается достаточно равномерная достоверность (с учетом естественного роста ширины интервалов при росте кю), Хотя в турнире было два - аномальных на 100% результата и еще три - частично аномальных. В следующем турнире при том же составе частота (оценка вероятности) аномалок резко упадет, что и должно происходить при "установлении" достоверного рейтинга.