streda 15. augusta 2012

Bridžové ELO 2

Po roku sa v úvahách znova vraciam k bridžovému Elu.

Aby bola metodika výpočtu jednotná pre individuál, párak aj družstvá, namiesto výpočtu vplyvu partnerov priamo z ich ratingov, som vo vzorci ratingu partnera zamenil za priemerný rating súťažnej jednotky. Takto je výpočet  jednotný pre každý druh súťaže. V individuály je priemer rovný ratingu hráča, v páraku zrazu nevadí, ak súťažná jednotka má troch hráčov (vyskytuje sa v klubových turnajoch a môže sa vyskytnúť v dlhodobých súťažiach typu skupinovka) a netreba komplikovane vyhodnocovať družstvá v závislosti od toho, či je hráčov 4 až 8.

Zmrazovanie ratingu
Moje pôvodné úvahy predpokladali, že sa hráčom vypočíta nový rating po každej súťaži. Pritom som naďabil na problém súbežne prebiehajúcich súťaží a vzhľadom na neplatnosť komutatívneho zákona pre nový rating vyvstala otázka, čo spraví administrátor, ak nevie ktorá súťaž bola dohraná skôr a ktorá neskôr, nehovoriac o tom, že výkonnosť hráča by v paralerne prebiehajúcich súťažiach mala byť rovnaká. Najprv som vymyslel, že pre takéto súťaže sa rating zmrazí a v tejto chvíli sa prikláňam k názoru, že z výnimky pre súbežné súťaže by sme mohli spraviť všeobecné pravidlo. Pre každé ratingové obdobie by sme mohli pokladať rating hráča za konštantný a nový rating by sa vypočítal po uplynutí celého ratingového obdobia. Zostáva iba určiť čo bude ratingovým obdobím. Najdlhšie by to mohol byť celý kalendárny rok, najkratšie kalendárny mesiac a ako kompromis by to mohli byť štvrťroky. Teda 1.1-31.3, 1.4-30.6, 1.7-30.9., 1.10.-31.12.
Vytvoril som nultú verziu ratingového systému, zatiaľ je východzia hodnota ratingu každého hráča 500 a má pridelenú váhu 50, v prvom behu sa spočítajú ratingy hráčov s ich východzímy hodnotami, v druhom behu s novo vypočítaným elom a v treťom znova. Elo systém je na tejto adrese. Keďže je to databázový systém, dá sa s tým hrať a sledovať, aký vplyv má na ratingy hráčov zmena toho či onoho parametra, napríklad zmena koeficientu vplyvu partnera, branie do úvahy váhy turnaja, vplyv koeficientu turnaja, ...

Do databázy som zatiaľ nahodil všetky turnaje KBK, Kapratský pohár páry a družstvá, Novoročný turnaj v Michalovciach a zatiaľ dva turnaje Doprastavu. Chcel som nahodiť aj výsledky z Michalovského klubu, ale namiesto mien používajú pre hráčov iniciály mien, ak som to dobre pochopil, tak prvé písmeno z mena a prvé dve písmena z priezviska, ale veľmi pracne sa to dešifruje a nahadzuje. Načítanie výsledkov KBK som takmer plne zautomatizoval, asi sa mi to podarí aj z Doprastavom, pri tom michalovskom formáte si nie som istý, či sa mi to podarí, tie skratky totiž nie sú jednoznačné a namiesto obvyklého tvaru výsledkovej listiny poradie a mená v riadkoch to je v stĺpcoch.

Výkonnosť hráča sa síce časom mení, ale okrem začiatočníkov u ktorých obvykle spočiatku prudko rastie, sa časom stabilizuje a mení sa mierne. Preto zmrazovanie ratingu na 3 mesiace by nemalo mať zásadný vplyv na jeho výpočet.

Vplyv partnera
Napriek korekčnému koeficientu, ktorý čiastočne eliminuje vplyv slabšieho alebo silnejšieho partnera, tento vplyv hlavne pri výrazne rozdielnych výkonnostných úrovniach partnerov je ešte stále veľmi silný. Možno ho preskúmať kliknutím na Partneri, kde vidno aké priemerné efektívne elo hráč s tým alebo oným partnerom získal. Napríklad hráč Menyhért odohral spolu 60 turnajov, so stálym partnerom Mirkom Horňákom 30 a s ním dosiahol priemernmé ELOe=696.9, na druhej strane pomerne často hral s absolventkami kurzu, najčastejšie so Zuzanou Gažovou 15 krát a s ňou dosiahol priemerné ELOe=345.8. Výsledné ELO mu vyšlo 543.2, ak by hral len turnaje so stálym partnerom, mal by 573.8.

Šlo by to čiastočne ošetriť tak, že by menila váha turnaja pre hráča v závislostii od ratingu partnera, napríklad v1=R1/R2.

Po zavedení tejto individuálnej váhy, narástol rating hráčovi Menyhért na 554.3

Dlhodobé súťaže
Za normálnych okolností sa predpokladá, že počas danej súťaže sa výkonnosť hráčov nemení. V dlhodobej súťaži, ako je liga alebo skupinovka však výkonnosť hráčov na jeseň oproti jaru mohla výrazne stúpnuť a síce menej výrazne, ale predsa mohla aj poklesnúť. V lige by sa preto mohol každý zápas pokladať za samostatnú súťaž, ktorej sa zúčastnili dve súťažné jednotky a umiestnili sa na 1. alebo 2. mieste, poprípade v závislosti od spôsobu hodnotenia by sa mohla brať do úvahy škála VP, pričom 25 VP by predstavovalo 1. miesto a 0. VP posledné miesto. Čiže by sa to vyhodnotilo ako súťaž 26 súťažných jednotiek. Prvá metóda  by spôsobovala, že ak by sa stretli 750 s 250, 750 by aj v prípade výhry nič nezískala a v prípade prehry by veľa stratila, ak by hrala proti 200 tak paradoxne aj výhra by ju stála pokles ratingu. Druhá metóda by v prípade vysokej výhry zaistila takmer vždy nárast ratingu lepšiemu družstvu, ale slabá výhra by mu spôsobila pokles. Keďže však celý čas vychádzame z umiestnení a nie konkrétnych výkonov, asi by sa mala použiť prvá metóda a ak by výhra mala spôsobiť víťaznému družstvu pokles ratingu, tak by sa zápas do ratingu ani jednému družstvu nezarátal, prípadná prehra lepšieho družstva alebo remíza by sa do ratingu rátala.

Podobne by sa postupovalo aj s dlhodobými skupinovkami, vyhodnocovalo by sa každé kolo skupinovky samostatne a hľadelo by sa naň ako na zápasy a celkové konečné poradie by sa buď nebralo do úvahy, alebo ak by sa bralo, tak by malo váhu ako jednotlivé kolá a jednotlivé kolá by mali zníženú váhu tak, aby celková váha všetkých kôl a výsledného poradia bola rovná počtu kôl. Teda ak je počet kôl 8, každé kolo by malo váhu 8/9 a konečné poradie tiež. Ak by sa takto postupovalo v dlhodobých skupinovkách, rovnako by sa postupovalo aj v lige. Ćiže napríklad 1. liga s 8 družstvami prestavuje dokopy 14 zápasov, každý zápas má váhu 14/15 a výsledné poradie tiež.

Rating turnaja
Keď som ligu nahodil ako samostatné zápasy, tak vyskočil problém, že ak vyhralo silnejšie družstvo nad družstvom X a slabšie družstvo nad družstvom X, tak sa do ratingu silnejšiemu družstvu započítalo viac bodov, keďže rating zápasu bol vyšší. Koeficient turnaja som preto upravil tak, že sa rating turnaja počíta osobitne pre každú súťažnú jednotku - nie sú doň započítané ratingy hráčov tejto súťažnej jednotky.

Paralerné súťaže
Napríklad na bridžových týždňoch prebiahajú súťaže popri sebe, poobede sa hrajú družstvá a večer hlavný párový turnaj a tak podobne. Je vecou náhody, ktorá súťaž skončí skôr. Keďže navrhnutý rating nie je komutatívny, záleží na poradí, v akom sa súťaže v ratingovom systéme vyhodnotia.
teda Rij=Ri+Rj <> Rji=Rj+Ri kde Ri je rating po turnaji i a Rj po turnaji j.

 Buď sa zmierime s tým, že to tak je a turnaje sa do systému zadajú v takom poradí, ako boli reálne dohrané, alebo sa stanoví, že všetky súťažné jednotky majú počas celého podujatia zmrazený rating, každá súťaž sa vyhodnotí samostatne so vstupnými ratingami a výsledný rating bude SJ stanovený ako výsledok príspevkov týchto jednotlivých súťaží. Zmrazovanie ratingov by sa mohlo prijať aj ako generálny princíp, pričom by boli zmrazované na mesačnej báze, teda sa stanoví rating na začiatku mesiaca, jednolivé turnaje sa spočítajú voči počiatočnému ratingu a na konci mesiaca sa vypočíta nový rating (podujatia však môžu prebiehať aj na prelome mesiacov).

Z hľadiska implementácie je jednoduchšie sa zmrazovaniu ratingov vyhnúť, klasifikátor však nemusí z výsledkových listín vedieť zistiť, ktorá súťaž sa dohrala skôr, takže rating hráčov by mohol byť mierne skreslený v závislosti od toho, v akom poradí by paralerné súťaže boli do systému vložené. Súbežne hrané súťaže, v ktorých hrajú úplne iné súťažné jednotky nijako rating neovplyvňujú z hľadiska poradia vyhodnotenia. Problém vzniká, iba ak aspoň jeden hráč hrá súbežne dve súťaže.

Popri druhu súťaže I, P, D by v databáze mohol byt aj spôsob skórovania Impy, Topy, VP, Bam, Hybridné. Potom možno stanoviť popri globálnom ratingu, v ktorom sú všetky súťaže hráča aj osobnitné ratingy pre jednotlivé spôsoby skórovania. Napríklad hybridná súťaž sa však na Slovensku hrá len raz až 2x do roka.