otm: Simulácia vplyvu systému organizácie bridžového turnaja na výsledné poradie

Bridž je špecifický tým, že okrem vlastného výkonu má vysoký vplyv na konečné poradie aj hráčske pole (do značnej miery je to eliminované v družstevných turnajoch, ale aj tam môže objektívne horšie družstvo vyhrať). Výnimočne aj veľmi dobrá hra môže páru priniesť celkovo zlé umiestnenie a naopak. Prirodzene na dlhých tratiach dobrá hra prináša úspechy a zlá umiestnenie na chvoste.

Ktorý systém organizácie turnaja je spravodlivejší?

V klube sme začali, okrem turnajov organizovaných klasicky systémom Howell poprípade Mitchell (okrem simultánky ho takmer nehrávame), hrávať aj barometer. Barometer hrávame, ak sa nás v utorok zíde 10 alebo 12 párov. Po jednom z barometrov mi jeden z najlepších hráčov klubu vytkol, že som (vraj) "O výsledku turnaja vopred rozhodol prvotným nasadením". Bol som ochotný pripustiť, že nasadenie v prvom kole môže a musí mať vplyv na nasadenie do druhého kola, ale tvrdil som, že na konečný výsledok, by prvotné nasadenie nemalo mať osudový vplyv. Najprv som to celé hodil za hlavu, ale potom som začal premýšľať nad tým, či by sa nedal nasimulovať vplyv prvotného nasadenia v barometri na konečné výsledky. Keď som rozoberal simuláciu barometra, tak ma napadlo, že by sa to zároveň mohlo porovnať aj so systémom Howell a Mitchell.

Východiská simulácie

Majme 12 párov, ktorých výkonnosť V nech je rovnomerne odstupňovaná po 5.
1. 100 2. 95 3. 90 4. 85 5. 80 6. 75 7. 70 8. 65 9. 60 10. 55 11. 50 12. 45

Táto výkonnosť nech sa v konkrétnom rozdaní prejaví tak, že správne a nesprávne rozhodnutia páru sa prejavia náhodným číslom z rozpätia 0 až V_i. Výsledok rozdania nech je rozdiel výkonov V_i-V_j, kde i je pár na NS a j je pár na EW.

Po úvodných simuláciách som výkonnosť zmenil takto: párom som priradil mieru chybovosti c:
1. 30 2. 35 3. 40 4. 45 5. 50 6. 55 7. 60 8. 65 9. 70 10. 75 11. 80 12. 85
Výkon v rozdaní pre pár je 100-h, kde h je náhodné číslo od 0 do miery chybovosti a možno ho interpretovať, ako hrubosť chyby. Priemerný výkon párov je potom 85, 82.5, 80,..., 57.5

Pôvodný návrh modelu simulácie nepripúšťal 100% výkon v rozdaní (okrem páru 1), pozmenený model umožňuje podať 100% výkon, aj najslabšiemu páru. Teraz zas páry nemôžu podať výkon rovný nule - najhorší možný výsledok, napríklad 7 BT s rekontrou -13 :)

Každé rozdanie vyhodnotíme na MP a po "odohraní" 4 rozdaní vygenerujeme nasadenie do nasledujúceho kola na základe aktuálneho poradia. Pre jednoduchosť pripusťme opakovanie súperov bez obmedzenia (v klube sa súperi môžu opakovať len v posledných dvoch kolách, poprípade troch, ak sa už v 5. kole nedá nasadiť bez opakovania), inak by som musel preskúmať algoritmus, ako náš skórovací program nasadzuje v prípade zákazu opakovania súperov.

Otestujeme nasledujúce prvotné nasadenia:

1-2, 3-4, 5-6, 7-8, 9-10, 11-12 Nasadenie podľa výkonnosti, linka NS je mierne silnejšia
1-2, 4-3, 5-6, 8-7, 9-10, 12-11 Súčet výkonností na linkách je rovnaký
1-7, 2-8, 3-9, 4-10, 5-11, 6-12 Rozdiel vo výkonnosti je rovnaký, NS je oveľa silnejšia
1-7, 8-2, 3-9, 10-4, 5-11, 12-6 To isté, linky sú vyvážené
1-12, 2-11, 3-10, 4-9, 5-8, 6-7 Najväčie možné rozdiely vo výkonnostiach, NS je oveľa silnejšia
1-12, 11-2, 3-10, 9-4, 5-8, 7-6 To isté linky sú vyvážené
Náhodní súperi v prvom kole (od verzie 1.2)

Tie isté rozdania otestujeme na rozpis Howell, každý s každým - použijú sa len rozdania 1 až 22.

Tie isté rozdania otestujeme na Mitchell, použijú sa len rozdania 1 až 24, pričom Mitchell bude testovaný na nasledujúce nasadenia:

1-2, 3-4, 5-6, 7-8, 9-10, 11-12 NS:EW 36:42
1-2, 4-3, 5-6, 8-7, 9-10, 12-11 39:39
1-7, 2-8, 3-9, 4-10, 5-11, 6-12 21:57
1-7, 8-2, 3-9, 10-4, 5-11, 12-6 39:39

Tiež otestujem 3/4 Hovell, keď sa hrá 9 kôl po 3 rozdania.

Nasimulujeme 100 turnajov pre každé prvotné nasadenie a otestujeme, ktoré z nasadení sa bude najviac blížiť k teoreticky "správnemu" poradiu 1. 2. ... 12. Schému turnaja, ktorá sa bude najviac blížiť "správnemu" poradiu označíme za najspravodlivejšiu.

Hypotézy

Hráč, ktorý mi vytkol prvotné nasadenie, má celkovo výhrady proti tomu, aby sme hrávali barometer, pokladá ho za najhorší možný spôsob organizácie turnaja a preferuje systém Howell, pokiaľ ho počet párov v klube umožňuje. V tejto súvislosti možno vysloviť nasledujúce hypotézy:

H1: Najspravodlivejší bude systém Howell, keďže v ňom hrá každý s každým.
H2: Najspravodlivejší bude systém Barometer, s nasadením 4, keďže je postavený na tom, aby sa poradie "utriaslo" podľa reálnej výkonnosti a nasadenie 4 je "spravodlivé".
H3: Najspravodlivejší bude systém Mitchell s nasadenim 2, keďže linky sú ideálne vyvážené po celý čas.

Pre H2 hovorí aj vyšší počet rozdaní 28 namiesto 22.

Pre každú z hypotéz možno naformulovať podhypotézy, že najspravodlivejším bude daný systém, ale s nejakým iným nasadením.

H2_5,6: Najspravodlivejší bude barometer s nasadením 5 alebo 6, hoci je prvotné nasadenie zjavne nespravodlivé, avšak rovno vystrelí najlepšie páry na prvý stôl a najslabšie na posledný (Ak sa táto hypotéza potvrdí, prirodzene, že nebudem v prvom kole takto nasadzovať, keďže toto nasadenie zjavne silných zvýhodňuje a slabých znevýhodňuje). Inak predpokladám, že nasadenia 1 a 2, často povedú k tomu, že v druhom kole vznikne nasadenie 5, či jemu blízke nasadenie.

Okrem globálnej nespravodlivosti, ktorá je súčtom absolútnych hodnôt rozdielov medzi očakávaným a skutočným umiestnením, možno zadefinovať subjektívnu nespravodlivosť pre každý jeden pár, pričom pár pokladá za nespravodlivé len umiestnenia horšie, než je jeho výkonnosť (reálne páry pokladajú za nespravodlivé aj umiestnenie zodpovedajúce ich výkonnosti, hlavne ak sú pred nimi páry, ktoré pokladajú za slabšie, než sú sami).

Možné zdokonalenia simulácie

Simulácia by bola presnejšia, ak by sa pre každé rozdanie a pár vygenerovali dve náhodné čísla, jedno pre linku NS a druhé pre linku EW.
Simulácia má viac stupňov voľnosti, než mávajú reálne rozdania. Pri šiestich stoloch môže byť 1 až 6 rôznych výsledkov. Odhadujem, že najčastejšie sa vyskytujú 3 a 4 rôzne výsledky (urobiť vzorku na základe reálne odohraných turnajov). Simulácia však najčastejšie dá 6 rôznych výsledkov, potom 5 a každý nižší počet bude generovaný menej často. Preto pre každé rozdanie by sa mohol vygenerovať počet stupňov voľnosti z rozpätia 1 až 12 a rozdiel V_i-V_jby sa celočíselne predelil týmto stupňom voľnosti, čo by spôsobilo častejší výskyt zdieľania rovnakého výsledku (1 - najvyššia voľnosť, 12 - najnižšia).
Zahrnúť aj zákaz opakovania súperov okrem posledných dvoch kôl.
Simulovať aj impové turnaje. Rozdiel V_i-V_j by sa podľa nejakej funkcie previedol na totalpoints a z nich by sa vypočítali impy.

Zjemňovanie modelu

Navrhnutý model je hrubý. Výkonnosť páru je charakterizovaná jediným číslom, hrubosťou h chyby páru ako celku, ktorá môže byť eliminovaná hrubosťou chyby súperov (ak páry urobili viacero chýb simuluje sa to ako jediná chyba). Priamo v modely nevystupuje charakteristika rozdania, nepriamo vystupuje, ale aj to ako vlastnosť párov vo vzťahu k rozdaniu. Model možno zjemniť nasledujúcimi spôsobmi:

pár sa skladá z dvoch hráčov, pričom každý má inú výkonnostnú úroveň, táto nehomogenita páru, by sa v modely nejako mala prejaviť
rozdanie sa skladá z dvoch fáz: licitácia a zohrávka a výkonnostná úroveň hráča pozostáva z troch zložiek: l - úroveň licitácie, o - úroveň obrany, z - úroveň zohrávky a navyše vystupuje ešte zložka p - zohratosť páru, ktorá sa prejavuje v licitácii a obrane - nezohratý pár, aj keď partner licituje alebo bráni správne, tak druhý z partnerov jeho akciu nepochopí a môže zvoliť nesprávne pokračovanie.
hoci pár urobil chybu, chyba súperov túto chybu môže nielen eliminovať, ale dokonca zmeniť hodnotu jej znamienka. Napríklad vylicitovanie hry, ktorá v rozdaní objektívne nie je, má v totalpoints hodnotu -50 alebo -100, a viac v závislosti od stavu hier a prípadnej kontry a počtu pádov, ale ak príde zlá obrana, zmení sa na +420 alebo +620. Podobne po vynechaní hry odpasovaním nepasovateľnej hlášky, súper zásahom po dvoch pasoch, chybujúcu stranu dovedie do hry. Dalo by sa to simulovať tak, že ak pár urobil v licitácii alebo zohrávke chybu, ak následne urobí chybu súper, chyba zmení znamienko.
hoci pár z pravdepodobnostného hľadiska urobil chybu, či už licitovaním alebo nelicitovaním celej hry alebo slemu, z charakteristiky daného rozdania vyplýva, že táto chyba vlastne objektívne chybou nie je.
charakreristika rozdania spočíva v jeho náročnosti z hľadiska licitácie, obrany a zohrávky, ako aj miery šťastia/smoly pre linku, ktorá licitovala "nezmyselný" záväzok, ktorý sa uhrať dá, alebo naopak štatisticky správny záväzok, ktorý sa však uhrať nedá. Náročnosť rozdania vplýva na pravdepodobnosť chyby v jednotlivých fázach partie. V jednoduchom rozdaní, ani najslabší pár takmer nemôže spraviť chybu a v zložitom sa aj expertní hráči môžu zamotať a paradoxne slabší s ním nemusia mať žiaden problém, keďže netušia o potenciálnych možnostiach rozdania.

Napriek tomu, že vyššie uvedené zjemnenia modelu, by ho mohli vylepšiť, v prvom priblížení možno zostať pri hrubom modely, keďže niektoré zjemnenia ťažko kvantifikovať a celú simuláciu by zneprehľadňovali. Inak simulácia nevyrovnaných partnerov by mohla viesť k optimalizácii hry so slabším partnerom (podľa môjho názoru by však šlo o jednorázovú a účelovú optimalizáciu, v danom turnaji vedie k lepšiemu výsledku, z dlhodobého hľadiska je lepšie slabšieho partnera poučiť).

Máte nejaké návrhy k zdokonaleniu modelu?

Ako budem postupovať?

Na samotnej realizácii simulácie pracujem. Najprv urobím simuláciu barometrov s rôznymi prvotnými nasadeniami. Mitchell a Howell budem simulovať neskôr.

Miera nespravodlivosti

Za mieru "nespravodlivosti" navrhujem súčet mocnín rozdielov medzi očakávaným a skutočným poradím. Nazvime ju kvadratická nespravodlivosť - KN (pôvodne som ju definoval ako odmocninu z tohoto súčtu). Percentuálne možno mieru nespravodlivosti stanoviť ako podiel maximálne možnej nespravodlivosti a reálnej nespravodlivosti. Absolútne "nespravodlivé" poradie je také, ktoré je opačné, než očakávané, teda 1. je posledný a posledný prvý (Asi je to v rozpore s biblickým pojatím spravodlivosti "Prví budú poslednými a poslední prvými." :)

Ak by sa mali porovnávať z hľadiska spravodlivosti poradia turnaje s rôznym počtom párov, táto výsledná celková miera by sa mohla predeliť počtom párov.

Druhou možnosťou, ako nespravodlivosť definovať je prostý súčet absolútnych hodnôt rozdielov medzi očakávaným a reálnym poradím. Táto miera však vyhodnotí ako rovnako nespravodlivé poradia:

2 1 4 3 6 5 8 7 10 9 12 11 - súčet je 12 aj 7 2 3 4 5 6 1 8 9 10 11 12.
Nazvime ju lineárna nespravodlivosť.

KN by toto poradie pokladala za menej spravodlivé. Prvé poradie 12 a druhé 72. V prvom prípade nik nie je na svojom mieste, ale každé miesto sa líši najviac o 1 od očakávania, v druhom prípade nie sú na svojom mieste iba dva páry. Vzniká filozofická otázka: Ktorá z týchto mier lepšie meria nespravodlivosť výsledného poradia? Viete navrhnúť inú mieru nespravodlivosti?

Navrhnuté miery nespravodlivosti vychádzajú z očakávaného poradia na základe schopností páru. Asi by však mali vychádzať z realizovanej výkonnosti, vyjadrenej priemerom výkonov v jednotlivých rozdaniach.

Nultá verzia simulátora

Generovala iba náhodné čísla pre jednotlivé páry a rozdania. Nijako ich nevyhodnocovala.

Simulátor (v 0.5)

Simuluje jeden turnaj barometer s počiatočným nasadením 1-2, 3-4 ... 11-12, s opakovaním súperov. Vyhodnocuje miery nespravodlivosti podľa definícií uvedených vyššie. Nachádza sa na tejto adrese.

Simulátor (v 1.0)

Vyhodnotí 100 turnajov a na konci zobrazí priemernú kvadratickú a lineárnu nespravodlivosť. Testuje 6x100 turnajov po 28 rozdaní, takže chvíľku trvá, než ich vyhodnotí. Môže sa tiež stať, že vám zahlási timeout error, či ekvivalentnú hlášku.

V nasledujúcej tabuľke sú výsledky piatich behov simulátora:

1	60.28	19.98
2	66.1	20.98
3	61.9	20.34
4	52.46	18.68
5	54.38	18.72
6	52.6	18.6
7	51.3	17.92

1	52.64	19
2	59.72	20.16
3	62.52	20.48
4	50.32	18.68
5	55.9	19.24
6	51	18.28
7	52.24	18.56

1	57.9	19.8
2	54.5	18.78
3	57.4	19.52
4	54.32	18.94
5	57.64	19.58
6	54.3	19.1
7	52.32	18.68

1	63.92	20.6
2	66.72	21.14
3	62.5	20.38
4	51.04	18.68
5	56.18	19.3
6	52.98	18.76
7	55.84	19.38

1	61.64	20.54
2	54.12	18.6
3	63.64	21.14
4	50.54	18.1
5	54.84	18.72
6	50.56	18.46
7	52.84	18.54

Ako najspravodlivejšie z hľadiska výsledného poradia vychádzajú v lineárnej i kvadratickej nespravodlivosti nasadenia 4, 6 a 7 pričom rozdiely medzi nimi sú zanedbateľné, nasleduje nasadenie 5, približne rovnako na konci vychádzajú nasadenia 1 až 3. Ako sa dalo predpokladať, vyváženie liniek zvyšuje spravodlivosť výsledného poradia (nasadenie 4 oproti 3 a 6 oproti 5). V nasadení 2 oproti 1 ju však znižuje alebo je to aspoň neutrálne. Prekvapujúco dobre na tom je náhodné nasadenie párov.

Aj keď v globále je nejaké nasadenie spravodlivejšie, môže zvýhodňovať alebo znevýhodňovať konkrétny pár, takže by som do simulácie mal pridať priemerné umiestnenia jednotlivých párov po jednotlivých nasadeniach.

Verzia 1.1

Pribudlo vyhodnotenie počtu umiestnení jednotlivých párov a priemerné umiestnenie páru. Na prvý pohľad nevidno, že by niektoré prvotné nasadenie zvýhodňovalo alebo znevýhodňovalo nejaký pár.

Verzia 1.2

Pribudlo nasadenie náhodných súperov v prvom kole.

Vplyv kvality poľa

Zaujímavý efekt nastal, keď som výrazne zvýšil kvalitu poľa na 10, 15, 20...65. Všetkých 6 nasadení výrazne znížilo svoju nespravodlivosť. Kým pri pôvodných hodnotách priemerná lineárna neklesla pod 17.64 a kvadratická pod 50, po zvýšení kvality poľa sa LN znížila pod 16 a kvadratická pod 40. Pri opakovaných behoch simulácie vždy aspoň jedno z nasadení bolo pod týmito hodnotami. Potvrdzuje sa, čo intuitívne tušíme, že v nekvalitnom poli je konečné poradie do značnej miery lotériou. Keď som kvalitu poľa zhoršil obe nespravodlivosti sa zvýšili. V niektorej z vyšších verzií preto pridám možnosť zadať miery chybovosti používateľom.

Závery po úvodných simuláciách rôznych nasadení barometrov

takmer nikdy nedostaneme absolútne spravodlivé poradie, ak sa po niektorom kole poradie blíži k ideálnemu poradiu, po ďalšom kole barometra LN a KN väčšinou stúpnu
náhodné nasadenie je spravodlivejšie, než nasadenia 1 až 3 a často je spravodlivejšie než nasadenie 4, takže do barometra možno s kľudným svedomím páry nasadzovať náhodne alebo podľa nasadenia 4 - nie je medzi nimi z pohľadu KN a LN zásadný rozdiel, takže ak výkonnosť párov nevieme určiť, bude asi lepšie páry nasadiť náhodne, než podľa zle odhadnutej výkonnosti. Avšak ani tieto "zlé" prvotné nasadenia, priamo nepredurčujú, ako konkrétny pár v turnaji dopadne, len zvyšujú globálne nespravodlivosti KN a LN.

Verzia 1.3

Pribudol 11 kolový Howell po 2 rozdania a stredná kvadratická odchýlka S_KN a S_LN. Nasadenie do Howellu je generované náhodne, keď bolo nasadenie usporiadané podľa výkonnosti, KN aj LN boli takmer dvojnásobné oproti barometru. Z tohto pohľadu zvyk niektorých párov v klube rezervovať si svoje číslo asi nie je dobrý - výsledné poradie takto môže byť systematicky vychýlené jedným alebo druhým smerom. Výsledok jedného z behov simulácia 1000 turnajov je v nasledujúcej tabuľke:

Nasad.	KN	S_KN	LN	S_LN	Min KN	Max KN	Min LN	Max LN
1	61.588	33.1	20.108	6.1	4	290	4	50
2	59.598	31.44	19.73	5.9	2	188	2	40
3	61.392	31.39	20.194	5.84	4	208	4	44
4	53.028	26.47	18.844	5.3	6	154	6	36
5	55.126	29.16	18.994	5.71	4	180	4	38
6	50.582	25.67	18.238	5.38	4	182	4	36
7	53.912	27.84	18.854	5.45	2	196	2	40
8	59.594	31.71	20.036	5.86	8	232	6	42

Barometer s náhodným nasadením je výrazne spravodlivejší oproti systému Howell pri chybovosti

párov: 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85.

Výsledné poradia pre nasadenie 7 a Howell boli:

Nasadenie 7
U/P	1	2	3	4	5	6	7	8	9	10	11	12
1	538	274	94	61	18	9	4	0	2	0	0	0
2	206	259	250	142	67	44	21	2	5	2	1	1
3	143	199	233	164	106	77	40	17	13	6	2	0
4	64	131	150	197	159	108	87	55	22	13	6	8
5	32	70	117	164	188	149	111	83	31	33	16	6
6	9	36	68	115	148	168	160	115	77	45	38	21
7	7	21	44	70	139	137	158	137	130	76	51	30
8	1	5	17	46	75	127	136	175	152	121	92	53
9	0	4	17	29	45	99	145	126	169	162	115	89
10	0	1	10	10	33	45	77	148	161	186	178	151
11	0	0	0	1	20	31	50	103	137	184	249	225
12	0	0	0	1	2	6	11	39	101	172	252	416
U	1.9	2.7	3.6	4.4	5.5	6.2	7	8	8.7	9.4	10	10.6

Nasadenie 8
U/P	1	2	3	4	5	6	7	8	9	10	11	12
1	461	254	124	78	48	22	8	2	0	3	0	0
2	234	282	196	133	75	46	17	11	4	1	0	1
3	138	184	202	165	140	84	38	24	11	12	2	0
4	90	120	153	186	159	109	77	55	25	12	10	4
5	37	64	134	158	156	143	129	63	48	36	22	10
6	25	50	94	122	130	177	138	110	67	46	25	16
7	9	21	60	63	109	148	148	156	126	72	47	41
8	3	19	20	55	74	112	157	158	144	115	85	58
9	2	3	13	22	58	61	101	164	167	149	143	117
10	1	3	2	15	31	53	91	109	143	192	191	169
11	0	0	2	2	14	37	67	81	152	186	219	240
12	0	0	0	1	6	8	29	67	113	176	256	344
U	2.2	2.8	3.7	4.4	5.2	6.1	7.1	7.9	8.8	9.4	10	10.4

Vplyv počtu rozdaní

Keďže v Howelly sa odohralo iba 22 rozdaní a v barometri 28, otestoval som, ako by sa to chovalo, ak by sa hral rovnaký počet rozdaní. Počet kôl v barometri som zvýšil na 11 po tri rozdania a v Howelly som počet rozdaní v sade tiež zvýšil na 3. V takom prípade Howell vyšiel ako mierne spravodlivejší, ale rozdiely medzi 4, 7 a H sú zanedbateľné. Výsledok jedného behu je v tabuľke:

Nasad.	KN	S_KN	LN	S_LN	Min KN	Max KN	Min LN	Max LN
4	46.764	24.52	17.478	5.22	2	162	2	34
7	48.104	26.41	17.696	5.34	4	226	4	42
8	46.298	25.87	17.412	5.35	2	208	2	42

Hrať však v klube Howell na 33 rozdaní, je najmenej 35 minút navyše, oproti 28 rozdaniam v barometri, riešením je prípadne 3/4 Howell 9 kôl po tri rozdania, ale tam už silne záleží na tom, kto sa s kým stretne alebo nestretne.

Mitchell

Vo verzii 1.4 som implementoval aj systém Mitchell. Oproti štandardnému Mitchellu však sady neputovali, ale v jednotlivých kolách sa súčasne hrali tie isté sady na všetkých stoloch (tak isto sa hráva napríklad na BBO). Keďže výsledky majú podľa mňa neočákavaný priebeh, budem musieť otestovať aj skutočný pohyb kariet. Po jednom z behov simulácie v ktorej bolo simulovaných 500 turnajov vyšli nasledujúce výsledky:

M1: KN=70.192, LN=20.164

M2: KN=77.244, LN=21.88

M3: KN=131.56, LN=30.412

M4: KN=88.476, LN=24.152

M5: KN=93.264, LN=25.024 - náhodné nasadenie

Keďže ide o porovnávanie jabĺčok z hruštičkami, dalo sa očakávať, že spoločné poradie za obe linky bude z hľadiska spravodlivosti výsledného poradia horšie, než v systéme Howell. Horšie však je, že všetky druhy nasadenia okrem náhodného, nie je neutrálne z pohľadu jednotlivých párov. Všetky nasadenia barometra i Howell boli neutrálne z hľadiska usporiadania priemerných umiestnení jednotlivých párov. V systéme Mitchell táto neutrálnosť z hľadiska párov zachovaná nebola. Napríklad M₁ malo takéto priemerné umiestnenia

1- 2.1; 2 - 2.3; 3 - 3.9; 4 - 4.4; 5 - 6.2; 7 - 8.1; 8 - 8.1; 9 - 7.5; 10 - 10.8; 11 - 6.5; 12 - 11.8

Podobne v M₂ boli priemerné umiestnenia usporiadané podľa výkonnosti, okrem párov 9 a 12, ktoré sa posunuli oba na 7. miesto.
Z tohto pohľadu najhoršie vyšiel M₃, kde takých posunov bolo až 5.
Predpokladal som, že toto usporiadanie bude neutrálne aspoň v rámci jednotlivých liniek, ale nie je, napríklad 12 predbehla v M₂ 8 a vyrovnala sa 9.

Náhodné nasadnie z tohto pohľadu síce vyšlo ako neutrálne, ale nie je to dané tým, že v danom turnaji takto nik nebol zvýhodnený, iba že pri dlhodobom náhodnom nasadzovaní sa zvýhodnenia a znevýhodnenia eliminujú.

Verzia 1.5

Vo verzii 1.5 pribudla možnosť zvoliť si parametre simulácie: počet turnajov, počet kôl v barometri, počet rozdaní v sade, počet rozdaní v systéme Howell, chybovosť párov (voľba z vopred definovaných možností, ale ak po odoslaní formulára si zmeníte chybovosť párov priamo v adresnom riadku, môžete simulovať ľubovoľné miery chybovosti, mali by ste však zachovať usporiadanie od najmenšej po najväčšiu).

Pribudla tiež záporná kvadratická nespravodlivosť, keď som ju vymyslel, nepredpokladal som, že by sa mala nejako výrazne odlišovať od doteraz definovaných nespravodlivostí. Očakával som, že KN- a KN+ sú symetrické: V konkrétnom turnaji môže prevážiť jedna alebo druhá, ale priemerne sú rovnaké. Tento môj predpoklad sa nepotvrdil. V niektorých spôsoboch orgnizácie turnaja je KN- významne menšia než KN+ a v iných naopak väčšia. Napríklad všetky turnaje Mitchell v KN a LN vychádzali ako oveľa nespravodlivejšie, než B alebo H, v zápornej nespravodlivosti sú však systémy Mitchell s vyváženými linkami mierne spravodlivejšie než B a H (závisí to aj od rozloženia výkonnosti poľa). Tiež barometer aj Howell sú z hľadiska KN- menej nespravodlivé než z hľadiska KN+. Ako to možno interpretovať? Ak nám v prvom rade záleží, aby najlepšie páry boli približne na svojich miestach a vieme dobre vyvážiť linky, napriek tomu, že celkovo je Mitchell v iných mierach nespravodlivosti na tom zle, systém Mitchell je z hľadiska zápornej nespravodlivosti, ak sú linky vyvážené spravodlivým systémom. Ak sú v M linky nevyvážené, M je nespravodlivým spôsobom organizácie turnaja bez ohľadu na to, akú mieru nespravodlivosti zvolíme (asi prisilné tvrdenie, keďže možno navrhnúť aj takú mieru nespravodlivosti, ktorá je spokojná, ak sa nespravodlivosť činí :)

KN- sa zdá byť zatiaľ najlepšou mierou nespravodlivosti, pokiaľ však neexistuje taký spôsob organizácie turnaja, v ktorom je síce KN- nízka, ale pritom štatisicky zvýhodňuje nejaký nižšie postavený pár. Extrémnym prípadom je poradie: 12 1 2 3 4 5 6 7 8 9 10 11
KN- je 11, ale ak by sa pri danej organizácii turnaja pravidelne vyskytovalo, tak by to určite nebolo v poriadku.

Model pre impové hodnotenie

V topskórovom hodnotení sme mohli (?) abstrahovať od reálnych výsledkov v totalpoints, ak chceme modelovať impové turnaje, tak možno postupovať viacerými spôsobmi. Prvotný návrh modelu vychádza z hodnotenia založeného na minimaxe rozdania (vylicitovanie a uhranie minimaxu nemusí znamenať správnu hru, napr. minimaxových 7H na 6 listom fite a 21 bodoch sú skôr prejavom voluntarizmu, než zodpovednej licitácie :)

Napriek tejto opodstatnejnej výhrade, model vychádzajúci z minimaxu môže byť vcelku objektívny:

Ak výsledok pri stole je rovný minimaxu, tak rozdiel výkonov oboch párov pokladajme za rovný nule. Poradie každého možného výsledku nad minimaxom pokladajme za rozdiel v kladnom smere a pod minimaxom v zápornom smere.
Teoreticky je 74 možných minimaxov, ktoré sa však v danom čísle rozdania redukujú, v závislosti od stavu hier. Možné minimaxy sú z hľadiska absolútnych hodnôt: 0, 70, 80, 90, 100, 110, 120, 130, 140, 200, 300, 400, 420, 430, 450, 460, 500, 600, 620, 630, 650, 660, 800, 920, 980, 990, 1100, 1370, 1400, 1430, 1440, 1510, 1520, 1700, 2000, 2140, 2210, 2220
Možných výsledkov je prirodzene viac, sú to menovite: 0, 50, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 420, 430, 440, 450, 460, 480, 490, 500, 510, 520, 550, 600, 620, 630, 640, 650, 660, 680, 690, 800, 900, 920, 980, 990, 1000, 1010, 1020, 1100, 1200, 1300, 1370, 1400, 1430, 1440, 1510, 1520, 1700, 2000, 2140, 2210, 2220, 2300 a varianty s kontrou a rekontrou. Podľa stavu hier však plusová a mínusová strana nie je symetrická (je symetrická, ak sú obe linky v rovnakej hre, niektoré výsledky nie sú v prvej alebo v druhej hre možné).

Pre obe linky v prvej hre sú možné výsledky: 0, 50, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 420, 430, 440, 450, 460, 480, 490, 500, 510, 520, 550, 600, 650, 800, 920, 640, 980, 990, 1000, 1010, 1020, 1100, 1200, 1300, 1370, 1400, 1430, 1440, 1510, 1520, 1700, 2000, ... s kladným a záporným znamienkom.
Ak je minimax 0 a rozdiel výkonov je +3, v TP je výsledok +80, ak je rozdiel výkonov -3, TP je -80.
Ak je minimax 400, a rozdiel výkonov je +3, v TP je výsledok +440, ak je rozdiel výkonov -3, TP je +250. (Tu je viditeľná slabina modelu, ktorý neberie do úvahy dve fázy rozdania: licitáciu a zohrávku. Ak došlo k chybe počas licitácie, tak, ak bola kontra, výsledok +250 je nemožný, ak nebola, možný je, takže sa mení fázový priestor zohrávky na základe udalostí, ktoré prebehli v prvej fáze rozdania.)

Niektoré z možných výsledkov síce teroreticky možné sú, ale prakticky sa nevyskytujú, napríklad 9 pádov v druhej hre bez kontry sú síce možné, ale vyskytne sa možno v jednom z 10000 prípadov a to ešte možno preháňam (odhliadnuc od gulášových turnajov na BBO). Vo vyše 150 turnajoch zverejnených na stránke www.bridgekosice.sk sa taký výsledok nevyskytol ani raz. Pokiaľ google neklame :)

Problémom simulácie impových turnajov navyše je, že pokročilí hráči väčšinou berú do úvahy, aký druh turnaja sa hrá, kým menej skúsení licitujú a zohrávajú stále rovnako, bez ohľadu na to, aký druh hodnotenia sa v súťaži použije, či dokonca licitujú a zohrávajú presne naopak, než si to druh hodnotenia vyžaduje. Teda pokročilý hráč v impovom turnaji a v družstvách bude hrať s nejakým daným listom 2D+1 a v párovom 1BT+1, kým neskúsený buď v oboch 2D+1 alebo 1BT+1, či dokonca nesprávne presne naopak, než vyplýva z teórie.

Úskalia modelu

Zanedbanie skutočnosti, že pár tvoria dvaja hráči, je asi základným nedostatkom modelu. Ak by sme sa aj zhodli na tom, že c - chybovosť, je základnou charakteristikou hry hráča, s možnosťou zanedbania fázy rozdania, tak ak chybovosť prvého partnera c₁ je 5 a druhého c₂ tiež, distribúcia hrubosti chyby páru nie je rovnomerne rozdelená, ako v predloženom modely, ale má priebeh 0 - 1, 1 - 2, 2 - 3... 10 zas 1 (0 a 10 možno realizovať len jedným spôsobom, 5 možno realizovať 6 spôsobmi). Priemerná hrubosť chyby je naďalej zachovaná, ale extrémne hodnoty chyby sú menej pravdepodobné v kladnom i v zápornom smere, najpravdepodobnejšia je chyba 5.
Ak bude c₁=1 a c₂=9, tak sa distribúcia chybovosti výrazne zmení, 0 a 10 sú znova realizovateľné len jedným spôsobom, kým ostatné možno realizovať dvoma spôsobmi.

Ďalším úskalím je ignorancia dvoch fáz rozdania, licitácia vygeneruje potenciál chyby a obrana a zohrávka tento potenciál premení na zrealizovaný výsledok, model to však nateraz zanedbáva. Potenciálna chyba z licitácie sa môže zmeniť na veľmi dobrý výsledok či naopak. Napr. správna kontra na 2H/Sp, ktorá má priniesť +100 či +200 pre kontrujúcu stranu a je rovná minimaxu, sa v prípade zlej obrany zmení na -470 čí -670.

V prípade zohrávky hlavným hráčom potenciálne zlá zohrávka, ktorá umožňuje súperom sa pomýliť, je z hľadiska teórie hier v skutočnosti správnou stratégiou, zvolený model to však celkom nazachytáva.

Terminológia

Používam termín hrubosť chyby, tento však možno rozmeniť na drobné:

hrubosť chyby - hrubá chyba v závislosti od hodnotenia, nemusí mať vplyv na konečný výsledok rozdania. V topskórovom hodnotení, ak je v rozdaní reálne len 10 zdvihov, ale súperi nelicitovali 4H/Sp, tak veľmi zlá obrana môže mať nulový vplyv na hodnotenie a v impovom hodnotení tento vplyv môže byť zanedbateľný a naopak, zlá obrana, môže priniesť kladný zisk v impoch (dobrá by priniesla rovnaký, či oveĺa lepší)
závažnosť chyby - zmena hodnotenia rozdania v totalpoints. Zadanie nadzdvihu v nekontrovanom rozdaní predstavuje 20 až 30 TP, neporazenie nekontrovaného záväzku predstavuje najmenej 120 TP a celoherného záväzku aspoň 450 TP
účinok chyby - napriek závažnej chybe, v topskórovom hodnotení možno získať top a v impovom kladný výsledok. V topskórovom aj bez chyby sa nič na hodnotení rozdania nemusí zmeniť, v impovom sa +1 až +3 Imp môže zmeniť na +10 až +15 či viac

Tak ako je model navrhutý, tak chybovosť je zároveň pravdepodobnosťou chyby a odvíja sa od nej aj hrubosť chyby, pričom pár s malou chybosvosťou sa nemôže dopúšťať veľmi hrubých chýb. Realita je však taká, že dobrý pár síce chyby robí výnimočne, ale môžu byť aj veľmi hrubé, pričom však pravdepodobnosť hrubšej a ešte hrubšej chyby u neho klesá. V tomto modely sú však v rámci intervalu všetky hrubosti chýb pre daný pár rovnako pravdepodobné.

Implementovať

porovnanie, koľkokrát je pri rovnakých vstupných podmienkach spravodlivejšie jedno nasadenie voči druhému
Mitchell - implementované, ale karty po miestnosti nekolujú, ale v danom kole hrajú všetci rovnakú sadu, pravdepodobne to však výsledky oproti klasicky organizovanému Mitchellu skresľuje.
3/4 Howell
priemerná nespravodlivosť je do značnej miery závislá od rozloženia schopností poľa. Lepšou mierou, ktoré nasadenie je spravodlivejšie než druhé, je porovnanie ako často je jedno nasadenie spravodlivejšie než druhé (оjedinelá extrémna hodnota môže výrazne ovplyvniť priemer). Čiže ak 5x bude nasadenie n lepšie ako nasadenie m o 3 jednotky a raz bude horšie o 20 jednotiek, tak hoci v priemere bolo nespravodlivejšie, tak reálne bolo 5x spravodlivejšie a raz nespravodlivejšie.

otm

sobota 10. marca 2012

Simulácia vplyvu systému organizácie bridžového turnaja na výsledné poradie

Žiadne komentáre:

Zverejnenie komentára