Selbst wenn dem Leser gewisse mathematische Inhalte in diesem Teil nicht vorenthalten werden können, so ist es dennoch aufgrund der eigens getätigten Aussagen a) „Elo ist gut – aber es geht besser“ und b) es ist so einfach, dass es eigentlich jeder rechnen könnte – im Gegensatz zu Elo – eine Art Verpflichtung, das alternative System einmal kurz vorzustellen. Die Absicht besteht nicht nur darin, hier mit „höherer Mathematik“ aufzuwarten und Leser abzuschrecken sondern eher umgekehrt aufzuzeigen: „Wenn man es logisch erklärt und aufbaut, dann ist es nicht nur einfach, sondern auch verständlich und nachvollziehbar“. Zugleich darf es gerne die Mathematik ein klein wenig schmackhaft machen. Wenn man sich heute nämlich umschaut und umhört, dann scheint ein jeder, der was auf sich hält, primär mit der Aussage „Mathe? Kann ich gar nicht. Hatte ich immer eine 5 in der Schule“ besonders viele Empathiepunkte ernten zu wollen, da er anscheinend jedermann aus der Seele spricht – nur als Einziger es sich traut. Jeder Zuhörer flüstert in sich hinein: „Ein Glück ging es den Anderen auch so wie mir.“ Mathe kann man nicht – und das ist auch gut so. Da hat man automatisch „viele, viele Gesinnungsgenossen und Freunde“.

Elo ist gut. Das ist unbestritten. Es stellt andere Wertungssysteme in den Schatten. Beim Tennis werden konfus irgendwelche Punkte bei Turnieren aufaddiert, die nach einem undurchsichtigen Schlüssel vergeben werden. Wer nicht spielt, hat auch keine Punkte. Denn: es zählt immer nur ein Jahr. Hat man im Vorjahr ein Turnier gewonnen und ist so dumm, sich ebendort wieder in die Teilnehmerliste einzutragen, dann hat man folgende Effekte zu erwarten: a) man gewinnt wieder und bleibt auf seinem Weltranglistenplatz oder b) man scheidet vorher aus oder verliert das Finale und rutscht ab. Das soll gerecht sein?

Auch im Bridge werden die Punkte nur aufaddiert. Wer viel spielt ohne zu glänzen steht sehr leicht vor demjenigen, der wenig, aber erfolgreich spielt. Das kann es auch nicht sein. Selbst wenn der Betreiber der Sportart damit zur Ausübung derselben motiviert wird. (Der Autor selbst bekennt sehr gerne, im Grunde viel Ahnung von sehr wenig zu haben und KEINE Abhilfe in Form von Recherche schaffen zu wollen; und dies sogar mit Fleiß: nachschauen kann ja jeder). Auch im Fußball befindet man sich wohl noch auf der Suche nach einem guten Wertungssystem. Es gibt Ranglisten, aber eigentlich weiß jeder, dass sie unsinnig sind oder nur zur groben Orientierung dienen.

Elo klappt also ausgezeichnet. Bis man auf die im Vorgängerbericht genannten Schwächen stößt: die Normalverteilung als Grundlage für das Wertsystem ist nicht ganz die richtige. Einer der Hauptgründe: das Spiel ist diskret. Diskret bedeutet hier – mathematisch gesprochen –, dass es immer nur eine begrenzte Auswahl von Zügen in jeder Stellung gibt. Diese kann auch der schwächere Spieler (zu) oft „treffen“ und dem Favoriten (zu) oft ein Bein stellen. Wirksam und sichtbar wird das Problem bei großen Spielstärkeunterschieden: auf lange Sicht profitiert der laut Elo (und damit Normalverteilung) deutlich unterlegene und somit angeblich chancenlose Spieler. Gewonnen die Erkenntnis auf empirische Art („Bei dem Turnier spiele ich nicht mit. Ich mache mir doch meine Zahl nicht kaputt!“; nicht selten gehört von Elo-Monstern, welche bei kleineren Turnieren geladen sind).

Es kommt ein Problem hinzu, welches den Schachspielern überhaupt nicht auffällt: die Zahlen sind willkürlich. Die Aussage „ich habe 2124“ ist nur dann etwas wert, wenn man weiß, wo andere Spieler stehen. Absolut gesehen ist sie wertlos.

Bei dem alternativ vorgestellten System ist dies ein klein wenig anders. Anfangen könnte man so: der Durchschnitt aller Spieler liegt bei 50%. Nun gibt es bessere Spieler, die mehr als diese 50% erzielen würden, wenn sie gegen alle anderen spielen würden, und es gibt Spieler, die unterhalb des Schnitts liegen. Wenn man die Zahlen also in Prozenten angeben würde, hätte man direkt einen Vergleich. Dieser Spieler erzielt 43.8%, dieser 64.2%. Der eine besser als der Durchschnittsspieler, der andere schlechter. Natürlich würde man nicht gegen alle Spieler antreten, aber dennoch gäbe es einen Richtwert. Durchschnitt sind 50%, damit kann man sich (und jeden anderen) vergleichen. Beim Elo-System müsste man lange forschen, um darauf zu kommen. Der Durchschnitt aller bei der FIDE gemeldeten Spieler? Keine Ahnung. Aber: sollten es zum Beispiel 2083.4 Punkte sein, dann wäre dies temporär und würde auch bald wieder vergessen sein. Die 50% blieben immer bestehen.

Sollte das (neue) System nämlich aufgrund von Updates, neuen Spielern, die hinzukommen, anderen, die ausscheiden aus dem System (zu lange nicht gespielt; Ableben, kommt in den besten Familien vor) die Normierung verlieren, könnte man es einfach ab und an „resetten“. Einmal pro Jahr heißt es dann zum Beispiel: „Wir normieren neu auf 50%. Jeder bekommt eine leicht veränderte Zahl, die aber genau im Verhältnis mit jedem anderen Spieler im System gleich bleibt.“ Nun hat man vorher 46.7% und nachher 46.8%. Das wäre eine Änderung, welche weitaus weniger tut als ein halbwegs ordentliches Turnierergebnis. Denn: am Jahresanfang hatte man noch 47.3% und ist nur abgerutscht, weil man bei der lokalen Kreismeisterschaft mit 5.5 aus 9 die Erwartung um 0.37 Punkte untertroffen hat. Sprich: die Änderung würde jeder locker in Kauf nehmen. Nötig wäre sie aber nicht einmal. Man könnte es auch unnormiert durchlaufen lassen, weil sich nämlich bei dem mathematisch sauberen System nichts ändern würde.

Funktionieren tut es so: man möchte die Erwartung einer Partie berechnen. Der eine Spieler hat die oben angegebenen 43.8%, der andere hat 64.2%. Dies sind ihre Spielstärken (für die Elo-Süchtigen wäre es natürlich kein Problem, zunächst umzurechnen oder eine Weile lang beide Zahlen zu führen; demnach hätte der mit 43.8% beispielsweise eine 1928, der mit 64.2% eine 2073, um nur zwei beliebige Zahlen zu nennen, welche sich jedoch im Anschluss auf kuriose Art als wohlerwogen erweisen werden).

Wenn man nun die Erwartung für die anstehende Partie aufgrund der beiden genannten Prozentzahlen ermitteln möchte, dann ist es, mathematisch gesehen, sehr einfach. Dennoch geht es nicht ganz ohne Formel. Man muss nämlich zunächst die eigene Spielstärke in eine Verhältniszahl bringen: 43.8% erzielt, 56.2% abgegeben (Summe: 100%). 43.8 muss nun dividiert werden durch 56.2. Wie viele macht man, wie viele gibt man ab? Die Maßzahl wäre für Spieler 1 also 0.438 / 0.562 = 0.779.

Genau so geht man für Spieler 2 vor. 0.642 / 0.358 = 1.793.

Nun muss man nur noch diese beiden Zahlen durcheinander dividieren. 1.793 / 0.779 = 2.301.

Diese misst nun ultimativ die Überlegenheit des besseren Spielers. Sollte also jemand sagen: „Ich bin mindestens doppelt so gut wie du“, dann hat er meistens unrecht. Sollte dies hier Spieler 1 sagen, dann hätte er erstaunlicherweise doch recht. Er ist sogar 2.301 Mal so gut.

Um diese Zahl in eine Punkterwartung (in dem Falle wäre es eine Punkterwartung und keine Wahrscheinlichkeit, da man die Punkterwartung erzielt mit einer „gesunden“ , aber noch nicht errechneten, Mischung aus Siegen und Remisen), muss man einen winzigen Kniff anwenden (oder sich im Umstellen von Formeln auskennen und es selbst erledigen).

Der Kniff sieht so aus: man dividiert 100 durch 2.301 plus 1. Also ausgeschrieben: 100 / (2.301 + 1). Warum dies so ist, muss man, wie gesagt, selbst durch Umstellen ermitteln oder auf die Probe warten.

100 / (2.301 + 1) = 100 / 3.301 = 30.29%. Der Fehler in der Formel liegt hier nur darin, dass ich 100 geschrieben habe anstatt 100%. 100% sind aber 100/100 und 100/100 ist gleich 1. Also müsste dort stehen: 1 / (2.301 + 1). Es sollten aber eben Prozente bleiben (und 100 sind eben die gesamt zu vergebenden 100%; eine alberne kleine 1 würde noch eher verwirren).

Wie auch immer : der Außenseiter hätte in der Partie 30.29% der zu vergebenden 100% der Punkte zu erwarten. Wie er sie erzielen würde, wie viele Remis, wie viele Siege, wie viele Niederlagen in 100 Partien? Das wird hier – wie bei Elo – nicht beantwortet.

Der Gegner (Spieler 2) erzielt 69.71%. Das kleine Wunder der Mathematik – insofern die Herleitung der kleinen Formel unterschlagen – zeigt sich in dem Moment, wo man 69.71% durch 30.29% dividiert. Die angekündigte Probe. 69.71 / 30.29 = 2.301. Genau das Verhältnis, welches zuvor errechnet wurde. Spieler 2 ist mehr als doppelt so gut. Er macht nämlich 69.71 von 100 Punkten der Gegner nur 30.29 von 100 Punkten. Das sind 2.301 Mal so viele. Genau wie zuvor ermittelt, wie es sein müsste.

Hier nur noch einmal anschaulich gemacht in einem kleinen Excel-sheet, welches sich jeder problemlos anlegen könnte.

Warum dies nun besser funktionieren würde als Elo? Dazu müsste vielleicht ein dritter Teil zu dem Thema her? Auf jeden Fall ist es so, dass die Annäherung an 100% wesentlich langsamer erfolgt als in der Elo-Erwartung (auf der Normalverteilung basierend). Und diese langsamere Annäherung entspricht wesentlich mehr der Realität im Schach.

Hier nun noch kurz anschaulich gemacht, warum die beiden genannten Elo-Zahlen zu dem Beispiel passen: bei einer Differenz von 148.8 Punkten würde auch bei Elo herauskommen, dass man die Erwartung von 30.29% hat. Die Elo-Formel ist links als Excel-Formel angegeben, darunter als „richtige Elo-Formel“ (wobei diese nicht völlig authentisch ist, aber die verwendete ist; Elo2 – Elo1 könnte man noch als Betrag angeben; es geht nur um die Größe des Unterschiedes; plus oder minus ist natürlich irrelevant; einer ist besser, einer schlechter).

Nun könnte, um zum Abschluss zu kommen, selbst dieses kleine Beispiel schon aufzeigen, dass die im Text vorgestellte Formel besser geeignet ist. Denn: die Elo-Zahlen liegen gefühlsmäßig doch recht nahe beieinander, und dennoch soll man als Favorit bereits fast 70% haben? Hingegen liegen die anderen beiden Werte (43.8% und 64.2%) gefühlsmäßig eher schon recht weit auseinander – und dennoch bleibt die Erwartung (angemessen) moderat.

Print Friendly, PDF & Email
3Shares