Собственно рейтинговалка для F3K сложилась

Спасибо всем, кто по крупицам собирал данные…

Система сложена так, чтобы накапливать рейтинги. Система ни в коей мере не является основой для каких-либо раздач слонов. Она лишь позволяет вычислить некоторый ранк одного пилота, по отношению к другому.

Базой ( B ) - выбрано 100 пунктов, которые получает любой вновь прибывший спортсмен. Соответственно менее ста пунктов, рейтинг никогда не опускается.

В расчетах рейтинга принимает участие т.н. рейтинг турнира (Ct), который является производной от рейтингов участников турнира и количества туров (от пяти). Никакого субъективизма нет и рейтинг турнира может быть посчитан заранее, на основе данных о зарегистрированных участниках. Рейтинги самых первых турниров 2010 были низкими, поскольку ни у кого из участников вообще не было рейтингов выше 100 очков базы. Рейтинг каждого следующего турнира, как правило, несколько возрастает.

Система сделана так, чтобы существенно поднимать рейтинг хорошо выступившим пилотам с низким рейтингом, в то же время - не давая им существенно обгонять топ-пилотов, когда они лишь соревнуются между собой.

Топ-пилоты же, когда соревнуются лишь между собой, всего лишь перегоняют очки своего рейтинга между собой. Кто-то теряет, кто-то находит.

Математика

B - база рейтинга, принята раной 100

n - количество участников турнира

K - количество туров, идущих в зачет при подсчёте суммы суммы за турнир

tn - количество очков, набранное участником по результатам турнира. Очки рассчитываются так, как в у нас в кубке. Т.е. берутся не проценты, а достигнутый от максимально возможного результат. Для чего требуется знать количество зачетных туров К. tn равна итоговой сумме очков с учётом штрафов, деленная на максимально допустимую сумму и умноженная на тысячу.

Xm - выборочное среднее, вычисляемое как сумма очков, деленная на количество участников.

S2 - выборочная дисперсия, вычисляемая как сумма квадратов разностей, деленная на количество выступавших пилотов. Разностями - здесь являются разность очков, полученных пилотом за турнир tn и выборочное среднее Xm

rx - индивидуальный рейтинг спортсмена

Rm - средний рейтинг участников турнира. Вычисляется, как среднее арифметическое рейтингов участников турнира ®, на момент начала соревнований.

Ct - стоимость или рейтинг самого турнира. Вычисляется как произведение среднего рейтингаучастников, количества участников минус один, и квадратного корня - sqrt() из количества туров минус путь.

Т.е. Ct = Rm * (n-1) * sqrt( K-5 )

Kerr = коэффициент ошибки при расчете дисперсии в плотном распределении финальных результатов. Равен 10.

dR - изменение рейтинга участника по результатам турнира

                        (tn - Xm)  *  Сt
dR =  _____________________________________________

               rx *  ( S2 + Kerr ) * 2 * sqrt(2)

dR может быть как положительной, так и отрицательной величиной. По окончанию турнира dR складывается с rx и получается новое значение rx

rx = rx + dR , если новый rx становится менее 100 (базы), то значение вновь вычисленного rx полагается равным 100.

Вот экселевская таблица для всевозможных игрищ и прикидок о том, что станет с рейтингом после того или иного локального/глобального турнира.

К сожалению, я физически не смог включить туда абсолютно всех пилотов. Впрочем это не мешает включить их позднее, поскольку очень многие пилоты, так и не смогли существенно оторваться от положенной базы.

  • 558
Comments
Юрий_68

Вить, молодец. Хорошая работа.
Вот смотрю на это все и пытаюсь понять: а для чего нам это нужно? 😃
Шучу. 😃

Wasily

Долго вникал, что есть что! Чувствуется человек долго думал 5 баллофф 😃
P.S. Вот что значит человек оторван от общества - есть время подумать!

SEAL

Виктор, ну ты просто прелесть!

😇 тока прости,но я ни как в толк не возьму: а в виде чего должен выглядеть “выхлоп” твоего итересного труда??? Что мы хотим улучшить в нашем спорте отслеживанием рейтинга каждого спортсмена?

Taboo

А мне не понравилось.
Человек на соревнованиях облетывает больше половины участников, а его рейтинг падает ниже плинтуса. Причем на столько, что рейтинг надо обнулять. Это не правильно.
Второе, это неустойчивая система. Взять побольше соревнований и влиять на рейтинг будут только пару последних. Тоже не правильно.

rajalex

Вить поясни плиз откуда взял цифры -5 и -1 в расчете рейтинга турнира. Если их отбросить, то немного увеличивается дельта, но итоговая расстановка пилотов не меняется.

wws

Всем привет. Отвечать буду в обратном порядке

С -1 совсем все просто. Минимальное количество участников соревнований это двое, и для такого соревнований множитель минимален, т.е. 1. Вот и выходит (n-1)

С пятеркой - все еще проще.

квадратного корня - sqrt() из количества туров минус путь.

т.е. считаем все, что от 6 и более туров. Менее - не обсчитываем. Цифры была подобрана в процессе анализа разных “интересных вариаций” с составом участников, количеством туров и т.п. Обратная квадратичная зависимость оказалась очень удобна тем, что при увеличении числа туров не дает огромного роста рейтингу турнира.

Человек на соревнованиях облетывает больше половины участников

Зависит не от того сколько там он облётывает, а с какими процентами он их облётывает. Но ты конкретно про какую конкретно ячейку в табличке говоришь? С радостью посмотрю и проанализирую. Может действительно лажа. А может, так и задумывал.

Второе, это неустойчивая система. Взять побольше соревнований и влиять на рейтинг будут только пару последних.

Не совсем так… зависит от того, КАКИЕ это будут соревнования. Если региональные, на которых не будет толпы лидеров - то они почти не повлияют. А вот если соревнования а-ля последний Ульяновск - то разумеется - повлияют очень сильно. С другой стороны, если мы с Андрюхой надумаем полетать друг с другом, то нифига мы рейтинг не накрутим. Один из нас за такие неудачные (мало наберет) полетушки быстро расплатиться своим рейтингом, и вылезти опять наверх будет проблематично. А вот если мы Липыча пригласим и он, вдруг, нас облетает. То ему будет неплохо так прибавлено.

Короче, нужны конкретные примеры. Присылай/выкладывай - будем обсуждать.

в виде чего должен выглядеть “выхлоп” твоего итересного труда?

Вообще, рейтинги существуют исключительно для того, чтобы как-то сравнить спортсменов. Использовать рейтинги могут самые разные люди и самыми разными способами. Вот ты, например, понятия не имеешь как рассчитывается рейтинг WTA, однако за тем куда там поднялась или опустилась Шарапова или Дементьева узнаешь по телеку. Короче - пока это не более чем “пипкомер”, как я и написал в первом абзаце.

У рейтингов есть своя прелесть. Например, когда рейтинговые агентства рассчитывают кредитные и прочие рейтинги для стран, кто-то (финансисты) ими пользуются. Влиятельные же политики (даже самих этих стран) нихрена не могут поделать, потому как, рейтинги считать не запретишь 😃

Вот пример:

Предоставляя независимое, обоснованное и компетентное мнение, кредитный рейтинг помогает эмитенту расширить доступ к заемным средствам и другим источникам капитала, тем самым повышая финансовую гибкость эмитента.
Кредитный рейтинг представляет собой независимую и надежную оценку кредитоспособности эмитента, на основе которой участники рынка могут принимать обоснованные финансовые решения.

Лично мне, нравится наблюдать сам процесс во-времени. И для себя и для других. Я вот еще хочу попытаться учесть, например, результаты российских пилотов в GO… Ну так - для того чтобы убедиться, что Дима Ломовцев должен все-таки оказаться несколько повыше, чем он сейчас оказался. На GO он очень хорошо выступил.

Теперь замечания к табличке. У меня чуть не хватило времени и я вчера не успел поправить несколько вещей.

  1. В таблице есть две ошибки, которые не влияют на правильность результатов, но могут навести ошибки, при использовании таблицы. Одна - это Ульяновск-1, где я не видел полной версии таблицы. Другая - в одном месте коэффициент (множитель 😎 введен не параметром, а абсолютным значением 100. Я поправлю их, чтобы никто не наступил на разложенные грабли.

  2. В табличке нет 1-го этапа 2011 года в Тахтамукае. Сейчас найду результаты и внесу.

А вы, если есть вопросы/замечания/помидоры - выкладывайте или присылайте мне файлики с примерчиками.

wws

Добил данными GO. По факту существенно ничего не поменялось, ибо

  1. мало нас было в Германии
  2. иностранцев надо включать по персональной просьбе 😃
  3. тогда рейтинг у поехавших на GO был ещё не слишком оторвавшийся от базы

Включил и осенний Тахтамукай. Тоже особо не поменялось, только Женька вплотную догнал Андрея

Смотреть здесь: wws.spb.ru

Файл пока не выкладываю, чтоб не путать народ многообразием. Сперва надо критиков послушать и всё выровнять/выправить.

Taboo
wws;bt43138

Зависит не от того сколько там…

Мне не нравится, что отрицательные рейтинги от сотни не отнимаются. Понятно, что в этой системе, если отнять, получится бассмыслица. Значит система плохая. 😒

wws

Я сперва отнимал. И это не было бы проблемой, если бы не одно но. Сергей, даже не применительно к этой системе, а вообще. Вот скажи что делать, если:

  • Появляется новый участник, который еще не участвовал в рейтинге. Какой рейтинг ему надо дать? Как правильно разрулить очки тех, кто давно участвует но не очень хорошо выступает, с теми кто только пришел.

Если есть идеи как это сделать - велкам.

Павел_Филиппов

Виктор,я правильно понимаю-у тебя в табличке город,кол-во туров,рейтинг соревнований? Если да, то объясни рейтинги стартов в Воронеже,Щёлкове и Ульяновске.На мой взгляд соревнования в Щёлкове должны иметь самый высокий рейтинг так как по качественному и количественному составу равных им не было.

Шурик1

Витя, Денис, простите меня, но то что вы называете системой, по сути, является набором цифер и буков, не зависимо от того, в какие формулы вы их одеваете. А все потому, что вы в своих предложениях решаете локальные задачи (хотя надо быть честным и сказать, что Денис пытался решить некий комплекс задач), без привязки к целому, а усугубляется это тем, что каждый из нас, пишет о том, что волнует лично его.
Давайте для начала определимся, хто такая эта «злая тетка»-СИСТЕМА! Предлагаю следующее определение.
Система - это комплекс моделей расчета и/или регламентов для принятия решений, имеющая причино-следственную связь и подчиненная общей цели – определение «лучших из лучших».
Для того, чтобы эта самая «злая тетка», появилась среди нас, необходимо решить комплекс задач/ответить на ряд вопросов.
Из многократно, поднимаемых тем видно, что наша система это взаимосвязь довольно ограниченного круга задач/вопросов, а именно:

  1.   правила жеребьевки  
    
    1.   принципы расчета результатов по ходу соревнований (в каких  показателях собственно считаем, в абсолютных или в относительных)  
      
    2.    определение текущего  рейтинга пилотов  
      
    3.   определение рейтинга проведенных соревнований, его влияние на рейтинг пилотов и наоборот  
      
  2.   где и сколько соревнований нужно проводить за сезон  
    
  3.   принципы проведения финалов (должны ли быть в каждых соревнованиях, как принимается решение об их проведении)  
    
  4.   принципы отбора в сборную
    

Надеюсь, ничего не пропустил, а если пропустил, дополните плз.
За каждым из разделов можно закрепить «добровольца» (не обязательно из рядов комитета, вот Витя и Денис, например, любят переводить на язык мат. формул всякие умные слова и рисовать их в Ёкселе…). Он создает отдельную ветку и морщит лоб на тему, шо делать, как считать и т.д., а публика, тоесть МЫ, активно будет ему туды пихать, умных идей, но строго по теме! А Председатель соТоварищи, выделяют из своих рядов ответственное лицо за данное направление, задачей которого является курирование всех этапов обсуждений и утрамбовка их в ту самую Систему.

Так что, вношу рац. предложение - может все таки, системно подойдем к созданию системы, а?

wws

Отвечаю Павлу.

Рейтинг соревнований более всего зависит от рейтинга участников. Как я понял, мы сравниваем Воронеж, Щёлково и второй Ульяновск.

Для начала надо разобраться с парой Воронеж(3741)-Щёлково(3607). Разница совсем небольшая. В Воронеже рейтинги спортсменов еще не набрали того веса, что в Щелково, но зато было на два зачетных тура больше. Что и дало прибавку, причем существенную. Если бы Щелково проходило в то же время, что и Воронеж (как бы вместо Воронежа), то рейтинг был бы меньше - всего 3435. Т.е. разница в два тура и состав участников дает 3741/3435… На мой взгляд не очень много… Если Щёлково поместить на место Воронежа и смоделировать конечный результат на 10 зачетных туров (первую колонку домножить на 10/8), то рейтинг Щёлково становится 4435, против 3741 у Воронежа. Т.е. да, Щёлково выходило бы представительней Воронежа (по рейтингам участников). Я могу лишь субъективно оценивать влияние длины турнира на его рейтинг. Но даже в наихудшем варианте 3741/3435 это всего 8% разницы, да к тому же распространяющиеся на ВСЕХ участвующих пилотов.

А вот рейтинг Ульяновска(5770), в сравнении с рейтингом Щёлково(3607), имеют огромную разницу. Проще всего поменять их местами и посмотреть что будет Ульяновск (5606), а Щелково(3886)… Т.е. как ни крути, а Ульяновск оказывается весомей. Надо разбираться почему.

Для начала смотрим средний рейтинг участника турнира (ставя и тот и другой турнир на календарное место Щёлкова ):

Щелково = 109.75 при 20 участниках
Ульяновск= 110.10 при 19 участниках

Примерно одинаково (19-20 участников это 5%). Значит вся разница - исключительно от числа туров. Проверим догадку

3886/5707 = 0.6809 должно бы равняться sqrt(8-5) / sqrt( 13-5 ) = 0.6124

выходит 68% (рейтинг Щелкого от Ульяновска) практических против 61% теоретического.

Хорошо это или плохо - я не знаю. Все-таки в Ульяновске было два дня соревнований и почти в два раза больше туров, а это нельзя спускать со счёта.

Паша - тебе самому-то как кажется? Надо учитывать длину соревнований, или нет?

wws

Теперь отвечу Шурику

Ну я не ставил перед собой задач, которые Саша нарисовал

Шурик1;bt43171
  1.   определение рейтинга проведенных соревнований, его влияние на рейтинг пилотов и наоборот  
    
  2.   где и сколько соревнований нужно проводить за сезон  
    
  3.   принципы проведения финалов (должны ли быть в каждых соревнованиях, как принимается решение об их проведении)  
    
  4.   принципы отбора в сборную
    

Вот конкретно эти задачи, я специально проигнорировал. Камнями же закидают! С моей точки зрения нельзя одновременно решать все эти задачи. Они СОВСЕМ разные. Оценки чьих-то соревнований и раздачи чужих слонов - это не ко мне. А рейтинг соревнований мне нужен был исключительно в технических целях. Чтобы высчитать изменения рейтингов пилотов.

Задача 1, имхо, вообще не задача. Я вообще против жеребъевок 😃
Задача 2 - дана была свыше, ибо в этом году комитет решил считать именно так. Но, имхо, проценты от 100% или проценты от максимально достижимого результата, в моем расчете на рейтинги не влияют. легко можно поменять - нифига не изменится.

Потому - можно подходить системно. Но надо знать - что мы решаем. Я/для себя решил всего одну лишь маленькую задачку - пипкомер, который может жить из сезона в сезон, не обнуляясь при различных сменах генеральной линии партии. Именно поэтому он и сделан независимым от того, как мы у себя решили набирать сборную или считать кубковые очки.

С удовольствием сделал бы рейтинг лучше, в чем надеюсь на вашу помощь.

А по сашкиному системному подходу, я бы предложил идти степ-бай-степ. Не надо всё сразу. Сразу можно только наметить вехи, а идти лучше постепенными шажками. Вех (или договоренностей по ним), кстати, пока не видно.

Павел_Филиппов

Паша - тебе самому-то как кажется? Надо учитывать длину соревнований, или нет?

По моему безусловно надо, дело в том,какой вес будет иметь увеличение кол-ва туров, при этом надо учитывать-чем больше туров, тем больше худших результатов отбрасывается,а это тоже немаловажно.Вернёмся к цифрам Воронеж-средний рейтинг меньше,кол-во участников меньше(18и23),но больше на 2 тура, теперь давай абстрагируемся от среднего рейтинга-5чел.<2 туров- вот это меня и настораживает Не может ли получится такое,что при пяти участниках и скажем 24 турах этап по рейтингу будет недосягаем?

Taboo
wws;bt43164

Появляется новый участник, который еще не участвовал в рейтинге. Какой рейтинг ему надо дать?

Ноль.

И рейтинг от количества туров зависеть не должен.

wws

Не может ли получится такое,что при пяти участниках и скажем 24 турах этап по рейтингу будет недосягаем?

Вот я взял Щёлковские результаты, умножил их на 3 и довел кол-во туров с 8 до 24-х, ограничив список участников первыми 6-ю пилотами.

Получается, что все нормально. Не абы какой высокий рейтинг (чисто цифра), но для топ-пилотов цена все-равно высокая. В этом примере Юрка, отстав от группы, расплатился бы жестоко.

Ноль.

Ну тогда, Сергей, могу тебе предложить лишь проделать мысленный эксперимент! Отними, в конечном рейтинге 100 и получишь ровно то, что любо твоему взору. Мне 100, при трехзначных цифрах понравилось тем, что у всех ровно три цифирки, что глазу приятнее.
Могу поточнее - 4-я цифирями измерять (я уже багу поправил). Т.е., по-сути B=100, это не более чем множитель и тот самый уровень нуля.

Ну и чисто психологически 100 приятнее, чем фраза - мой рейтинг равен нулю 😃

И рейтинг от количества туров зависеть не должен.

Сколько людей, столько мнений 😃 Сергей, мы тут недавно обсуждали - двое соревнований проводить, или одни на два дня. Вот за двое - выйдет, что рейтинг зависит, а от двудневных - нет… Как с этим быть?

Есть, конечно, вариант - запретить двое соревнований подряд 😃 Но, что может быть хорошо для кубка РФ, то плохо для “просто местечково полетать” и просто для себя обсчитать. А в рейтинге, как я уже и писал и демонстрировал, все равно что считать. Хоть соревнования типа GO (100+ участников), хоть местечковые полетушки.

Taboo

Мне понравилаль рейтинговая система, разработанная проф. Арпад Эло.
Если будут силы, напишу формУлы. 😃

Taboo

Балуюсь со со своим вариантом…
Ни у кого нет результатов за 2009 и 2008 год в ехселе?
Если начинаю с одинакового рейтинга, очень долго идет расслоение, а если хотя бы один большой, то выравниваются быстро. Получается, надо иметь начальный рейтинг.

wws

Получается, надо иметь начальный рейтинг.

Безусловно надо! Я ровно такие же симптомы имел. А ты со своими пилотами экспериментируешь или со всей Европой? Мне очень помогло примерное знание сил в наших турнирах. Интересно будет потом твой вариант на нашу таблицу наложить.

Taboo

Оказывается:

  1. Рейтинг – термин матстатистики
  2. Все уже давно придумано, надо только взять
  3. основными характеристиками рейтинга являются динамичность, точность и достоверность оценки уровня мастерства участников.
  4. если увеличивать достоверность оценки, то неизбежно будет расширяться доверительный интервал, и наоборот. (рейтинги хорошо работают при 20 и более оценок. У нас это не проходит. При трех зачетных соревнованиях рейтинговая система будет менее точной, чем просто подсчет суммы за несколько соревнований.)
  5. У рейтинга хотелось бы получить единицу измерения, подобную большинству физических единиц – однородную и линейную.
  6. Разница рейтингов показывает вероятность победы одного спротсмена над другим.
Taboo

Играюсь дальше…
Вроде уже ничего, на хочется большего.

Мысль всплыла. Поскольку рейтинги хорошо работают при 20 и более оценок, а не оценивать ли нам каждый тур. И даже не тур, а группу. Тогда уже три соревнования дадут хорошую точность.
Опять же чем больше туров, тем “серьезней” рейтинг. (Специальный коэффициент вводить не хочу, а тут получится все само).

Минус такого подхода - у многих соревнований нет данных по группам.

DorSeV

Наконец увидел здравые рассуждения насчет матстатистики, которая является “абсолютно честным видом жульничества”! Статистика неплохо работает только при очень большом количестве исходных данных, но даже в этом случае результат сильно зависит от методики обработки. А если данных мало, можно чуть-чуть рульнув методикой получить очень разные результаты. Все это очень хорошо видно при официальном определении инфляции, прожиточного минимума и т.п.

wws

Минус такого подхода - у многих соревнований нет данных по группам.

Существенный минус… Жаль, что он не дает посмотреть посмотреть на нашу статистику этой методикой.

Другой фактический минус в том, что нам не надо оценивать силу спортсменов на протяжении длительного периода. Т.е. то о чём говорил Юра (“Юрий 68” в теме про рейтинг) - высокий результат в начале сезона - не может оправдывать низкий результат в конце.

Вот в рейтингах ATP и WTA они ведь как-то обнуляют рейтинг каждый сезон и обходятся без огромного набора данных… Т.е. там похоже тоже “жульничество”, а не чистая математика. Например, те же санкции за пропуск турниров. Вроде, нельзя пропустить более восьми за сезон из 20 всего. Я это к чему - к тому, что идеальный рейтинг все-равно не получить.

А вот насколько хорош рейтинг, можно узнать только примерив его на имеющиеся данные.

Серег! Ты можешь свою методу на нашу российскую табличку наложить?