Elo Rating und wie man es verbessern könnte.

Wie die meisten sicherlich schon mitgekriegt haben, gibt’s gerade eine heftige Diskussion zum Elo Rating, an der ich auch etwas teilgenommen habe. Ich muss sagen, dass ich zwar mit trischai nicht bei allen Punkten einverstanden war, aber ich fand das ganze dennoch relativ nützlich, weil ich dadurch zu diesem Eintrag motiviert worden bin und weil mir dadurch auch einige Punkte klarer geworden sind.

Erwartungen:

Zuerst einmal die Frage, was erwarten wir von einem Ratingsystem?

Man möchte doch dass es etwas über die Spielstärke von Spielern aussagt. Aber wie genau will man so etwas denn genau formuliert haben?

Am liebsten hätten vielleicht einige, dass man am Rating ablesen kann wer von zwei Spielern, wenn sie gegeneinander spielen, der Favorit ist. Dies wird man jedoch bei Magic nicht direkt können.

Weil wenn in über 50% der Fällen Spieler A gegen B gewinnt und Spieler B gegen C und Spieler C gegen A dann kann man natürlich diese Spieler logischerweise nicht so einordnen, dass dies passt.

Passiert den so etwas in Magic?

Ich würde sagen ja. Nur schon wenn man sich Constructed Turniere ansieht bei denen viele Spieler ein Lieblingsdeck haben und diese Decks haben halt entsprechende Matchups gegen andere Decks. Und bei solchen Dingen hat man häufig ein Schere Stein Papier Matchup und Spieler die dann halt fast immer das selbe oder ähnliche Deck spielen, werden untereinander eine solche Gewinnwkeit haben.

Also was möchten wir denn sonst Aussagen können?

Ich sehe das Rating gerne als eine Art Einschätzung, wie gut jemand auf einem grösseren Turnier abschneiden wird, wenn mehr oder weniger zufällige Spieler antreten. Die Frage hier ist, macht dies unser Elosystem?

Die Antwort ist ja mehr oder weniger schon, abgesehen von ein paar Schwankungen (und andern eventuellen Schwächen zu denen ich nachher noch komme). Tut es dies und zwar auch bei solchen nicht Transitiven Gewinnwkeiten.

Wie man das sehen kann?

Nicht Transitivität

Gut nehmen wir an wir haben 3 Spielertypen A B und C die haben folgende Eigenschaften:
Gegen sich selbst gewinnen sie mit 50% Wahrscheinlichkeit. (logisch)
A gewinnt gegen B mit 70%
B gewinnt gegen C mit 60%
C gewinnt gegen A mit 55%

Wie man hier sieht gibt es hier keine Transitivität und es kann wenn man Turniere anschaut auf diesen solche Spieler spielen grosse Varianzen ergeben. Deswegen betrachte ich hier nicht jeweils einen Spieler sondern gleich mehrere und nehme dann den Schnitt aus deren Rating. Sie stehen für verschiedene Spielertypen.

Wenn man jetzt mal um das Rating zu Initialisieren ein Turnier macht, bei dem je 20 dieser Spieler antreten und bei denen 20 Runden Swiss gespielt werden und die Zulosungen zufällig sind.

Was wird man erkennen? Die Spieler A werden am Ende ein höheres Rating haben als Spieler B, welche ein höheres Rating haben als Spieler C.

Und wenn man ein weiteres Turnier macht mit sagen wir je 8 Teilnehmern somit 5 Runden Swiss und anschliessenden Top 8 wird Würfel A die höchste Chance haben zu gewinnen und Würfel C die kleinste zu gewinnen.

Also gibt uns sogar in diesem krassen Beispiel das Ratingsystem Auskunft darüber, wer wie gute Chancen auf einem Turnier hat.

Besserer Spieler bessere Ergebnisse?

Nun gut aber wie verhält es sich denn mit einem besseren Spieler, der wirklich besser ist? Also wenn es ja bei den Beispielen nur auf die Matchups ankommt dann ist es ja sowieso zufällig wer gewinnt, könnte man ja sagen? Nicht ganz, nehmen wir an der Unterschied zwischen schlechten Spielern und guten Spielern, welche die selben Decks wählen, ist nur sehr klein, aber er ist vorhanden. Auch das kann man ähnlich wie obiges Beispiel betrachten.

Hier hat man halt ausser den obigen Würfeln noch jeweils ähnliche Würfel A‘, B‘, C‘ ,  die (die besseren Spieler) aber jeweils gegen Würfel aus der obigen Kategorie eine um 1% erhöhte Gewinnchance haben. Also A‘ gegen A eine 51% ige Chance gegen B eine 71%ige Chance und gegen C eine 46%ige Chance usw.

Wenn man hier wieder wie oben ein Turnier macht mit je 20 von allen würfeln zum Skalieren und diesmal 40 Runden Swiss wird man auch hier sehen, dass die Würfel aus Kategorie 2 mit den Strichen bessere Ratings bekommen im Schnitt. Und höhere Gewinnwahrscheinlichkeiten haben für ein Turnier.

Also sieht man dass die Intransitivität der Gewinnwahrscheinlichkeiten eigentlich für das Ratingsystem noch kein Problem sind. Und es immer noch eine vernünftige Aussage machen kann.

Wann die Intransitivität zum Problem werden kann:

Geschlossene Systeme

Dies kann dann passieren, wenn man halt sein Rating in einem ganz anderen Umfeld holt, als man nachher spielt, dann ist das Rating natürlich nicht besonders aussagekräftig.
Also analog zum obigen Beispiel hätte man 2 Turnierserien, eine mit A B und C und eine andere nur mit Ds  die Ds behalten dann mehr oder weniger ihr Startrating während A ein höheres holt. Nachher gibt es ein Turnier an dem As und Ds mitmachen hier währe nach Rating A der Favorit, allerdings falls D gegen A eine Gewinnwkeit von über 50% hat wird D mit grösserer Wkeit gewinnen. Dieses Phänomen lässt sich jedoch NICHT vermeiden dies würde man bei solchen geschlossenen Systemen sogar beim Schach haben. Allerdings lösen sich diese Probleme natürlich nach und nach, wenn man die Systeme öffnet bzw. vermischt, weil sich das Rating dann nach und nach anpasst.

Partiell geschlossene Systeme

Gut angenommen es gäbe diese Zwei Turnierserien A ,B und C nehmen an der ersten Teil und an der zweiten nimmt nur B und D teil. B gewinnt gegen D mit  Wkeit > 50%.
Was passiert jetzt? Das Rating von D sinkt während das von B und C und A ansteigt (im Vergleich zum vorherigen Beispiel). Wenn nun wieder ein Turnier stattfindet mit A und Ds haben wir auch wieder das selbe Problem wie wir oben hatten. Auch hier wird sich das Problem beheben sobald es mal offen ist, allerdings denkt man doch, dass so etwas nicht vorkommen dürfte.

Dies kommt auch nicht unbedingt vor, wenn wir bestimmte Bedingungen an diese Wkeiten setzen, z.B. dass sie nicht total Random sind sondern eine bestimmte Logik besitzen. (Also z.B. so etwas sind wie die Würfel hier in APs Blogeintrag: ) Dann wird das ganze selten wirklich komplett falsch ausfallen. Vor allem sobald mehrere Arten von Würfeln an beiden Turnieren teilnehmen wird es immer unwahrscheinlicher, dass so etwas passiert. Natürlich lässt sich so etwas immer noch konstruieren, aber wenn wir bei annehmen:

Wwir haben 30 verschiedene solche Würfel an den Turnierserien A nehmen 20 davon Teil und an den Turnierserien B auch 20 davon (mit Überschneidungen), dann gibt es nur wenige Möglichkeiten die Würfel so zu verteilen, dass immer noch so etwas passiert wie oben, vor allem wenn man dann so etwas hat wie, dass ein 3. Turnier stattfindet, bei dem 5 Würfel von A teilnehmen, 5 Würfel die an beiden Turnieren gespielt haben und 10 Würfel die nur an Turnier B gespielt habe. In so einem Fall werden die Würfel mehr oder weniger so performen wie ihr Rating das voraussagt, klar kann es ein paar Abweichungen geben, aber dies ist kaum zu vermeiden durch irgend ein Ratingsystem weil man halt schwer einschätzen kann, wie die Gewinnwkeiten sind von Spielern ist, die gegeneinander nicht vorher schon gespielt haben.

Über- und Unterschätzungen:

Ein weiteres Problem, das auftreten kann, ( auch im Zusammenhang mit diesen partiell geschlossenen Systemen) ist, dass zwar das Rating in etwa aussagt wer wie stark ist, aber dass halt die Gewinnwkeiten von bestimmten Gruppen von Spielern gegen bestimmte andere Gruppen von Spielern total überschätzt ist. In Magic wäre hier das Beispiel die Gewinnwkeiten wenn 2 Spieler etwa 400 Ratingpunkte auseinander liegen. Vor allem im Limited ist es fast nicht möglich, die Gewinnwkeiten zu holen, welche das Eloratingsystem vorraussagt. Was passiert also, wenn man zu viel gegen solche Spieler spielt? Nun ja das Rating geht runter ganz klar. Hm das müsste doch ein Problem sein! Jein das ist es schon, ABER was hier natürlich auch wieder gegeben ist, dass wenn man ein komplettes Feld also schlechte Spieler mittlere Spieler und gute Spieler untereinander spielen lässt dann wird auch wieder im Schnitt der gute Spieler das höchste Rating erreichen, es wird nur nicht mehr viel höher sein, als dasjenige von den mittleren Spielern (die guten SPieler die gegen die schlechten Rating verlieren, können es sich ja auch bei anderen guten oder mittleren Spielern zurückholen).

Das ist aber in der Realität, vor allem wegen der sehr hohen Varianz, (dazu komme ich später noch dazu) ein Problem. Und es ist deswegen auch ein Problem, weil hier demnach gute Spieler, welche nicht gegen Amateure spielen höhere Rating bekommen können als solche, welche gegen Amateure spielen.(Vorausgesetzt sie spielen nicht sooo oft gegeb diese anderen Pros und verlieren dann an die wieder Punkte.)

„Ratingcampen:“

Das heisst wirklich gute Spieler dürfen wenn sie das hohe Rating behalten wollen, am besten nicht gegen schlechte Spieler spielen. Das heisst in erster Linie mal keine FNMs und am besten auch keine Previews mehr spielen.

Hier sehe ich eigentlich keinerlei Problem. Es ist in allen Sportarten und auch Esportarten eigentlich üblich, dass man hauptsächlich gegen gleich starke Spieler spielt, das macht am meisten Sinn und am meisten Spass. Ausserdem werden die guten Spieler zum üben eh lieber gegeneinander spielen, weil sie so richtig testen können usw. Und es ist auch für die Anfänger besser, wenn sie nicht (fast) immer von Pros niedergestreckt werden an FNMs. Demnach ist es eigentlich gut, dass man mit dem System fördert, dass man nicht gegen viel schwächere Spieler spielen sollte.

Grand Prix

Nun gut aber was ist mit den Grand Prixs, dort sollen ja alle Spieler teilnehmen dürfen?

Ja das dürfen sie auch, das ist auch schön wenn potentiell jeder die Chance hat mal gegen einen Pro zu spielen und eventuell zu gewinnen. Aber hier wird das oben beschriebene FNM System gar nicht so oft auftreten. Denn die wirklich guten Spieler haben 2-3 Byes an GPs und werden dementsprechend nur gegen Leute spielen, welche 3:0 gestartet sind. Das sind normalerweise nicht unbedingt die ganz schlechten Spieler und man hat dadurch ja schon ein bisschen Rating erhalten. Ausserdem können Pros so droppen wenn sie erkennen, dass ihr Sealedpool Mist ist und müssen sich nicht sinnlose Niederlagen einfangen. Und auch nach den 3 Byes geht es halt so weiter, dass die Pros vor allem wenn sie gewinnen (wozu sie ja nicht so kleine Chancen haben) im Schnitt gegen immer bessere Spieler spielen werden. Vor allem am zweiten Tag wird es kaum noch schwache Spieler geben. Wie man sieht ist dieses GP Bye System eigentlich ganz gut dazu geeignet diese Schwäche des Elosystems auszubügeln. Beim neuen System ist es eigentlich gar nicht mehr nötig, dass es Byes gibt nach PW Punkten, wie es hier nötig war.

Gewinnwkeiten anpassen?

Hier kommt die Frage, sollte man nicht die Gewinnwkeiten anpassen, so dass die in der Realität mit der vom Elosystem vorhergesagten übereinstimmen? ZMan kann dies aber  nicht so einfach machen, da es schwer ist die wirklich abzuschätzen und halt nicht bei jedem Spieler unbedingt genau gleich ist der das selbe Rating hat. Deswegen wird immer einer der folgenden Punkte erfüllt sein:

-Mehr oder weniger alle guten Spieler haben kleinere Gewinnwkeiten gegen die schlechten Spieler, als das Elo das vorhersagt.
-Mehr oder weniger alle guten Spieler haben grössere Gewinnwkeiten gegen die schlechten Spieler, als das Elo das vorhersagt
-Einige gute Spieler haben höhere und andere kleinere Gewinnwkeiten gegen die schlechten Spieler als das Elo das vorhersagt.

Nun frag man sich was von diesen 3en wünschenswert ist. Das letzte ist nicht wünschenswert, da sonst nicht alle guten Spieler gleich behandelt werden und einige daraus einen Vorteil ziehen könnten (zu dem Vorteil komme ich gleich). Und wenn die Spieler eine höhere Gewinnwkeit haben, als ihr gutes Rating vorhersagt, dann könnten ja die guten Spieler ihr Rating puschen in dem sie einfach möglichst viel gegen schlechte Spieler spielen. So etwas ist nicht wünschenswert (PWP System ich meine dich!!). Und natürlich wäre das nicht besser auch wenn das nur einige könnten. Also ist es prinzipiell besser, wenn keiner der guten Spieler so sein Rating pushen kann.

Ausserdem ist es halt sehr schwer ein Ratingsystem zu machen, welches für ähnlich gute Spieler und enorm unterschiedlich gute Spieler geeignet ist. Und da ist es natürlich VIEL besser wenn es geeignet ist, für ähnlich starke Spieler. Denn so sollte man ja spielen und nicht gute gegen schlechte, das macht keinen Sinn.

Wie würde so eine Systemanpassung ausschauen?

Es macht zwar nicht unbedingt Sinn, aber wir wollen vielleicht dennoch wissen, wie man denn die vom Elosystem berechneten Gewinnwkeiten anpassen müsste.

Also hier geht es darum wie könnten denn die echten Gewinnwkeiten aussehen, wenn diese vom Elo ja falsch sind (damit man in einem neuen Ratingsystem eventuell diese verwenden könnte). Und wie können diese eben NICHT aussehen.

Gut es ist klar , dass man die für gute Spieler nicht einfach senken darf gegen alle schwächeren Spieler, weil diese Gewinnwkeiten NICHT der Realität entsprechen können. Wenn sie gegen alle schwächeren Spieler (und die meisten sind ja schwächer) eine kleinere Gewinnwkeit hätten als das Elosystem das vorhersagt, dann hätten sie halt nie dieses Rating erreicht. (Das ist btw. der Hauptpunkt den ich bei trischais ersten Eloartikel bemängle).

Man kann nicht (overall) kleinere Gewinnwkeiten haben, als das Rating es aufzeigt, und dies hat Trischai sehr schön demonstriert. Es darf keinen solchen K-Faktor geben ansonsten hätten die guten Spieler eben nicht so ein gutes Rating (das zeigen die Tabellen mit dem C Faktor).

Ausserdem zeigt die (relativ) tiefe Gewinnwkeit der Pros an GPs relativ direkt, dass der Durchschnittsspieler an einem GP (der gegen einen Pro spielt) ein relativ hohes Rating haben muss.

Wie können wir aber die Gewinnwkeiten verändern, so dass die Pros immernoch auf ihre Ratings kommen können? Es gibt da zwei Möglichkeiten.

-Die erste ist, man senkt die erwarteten Gewinnwkeiten nur gegen Spieler, die viel schlechter sind als man selbst. (Also man übernimmt die gegebenen Gewinnwkeiten vom Elosystem für Spieler die nur maximal 200 Punkte auseinander liegen und senkt nur die gegen Spieler die mehr als 200 Punkte tiefer sind als man selbst.) Dies macht man dann unter der Annahme, dass der gute Spieler, gar nie gegen solch schlechte Spieler spielt (wegen der oben erwähnten Dinge spielt), und deswegen ein so gutes Rating geschafft hat. Allerdings gefällt mir auch die Annahme nicht so gut, denn auf GPs wird man doch auch mal einen Gegner mit tiefem Rating erhalten auch wenn dies nicht so oft der Fall sein wird nach 3 Byes.

Die Annahme die mir besser gefällt und bisschen in meinen Augen mehr Sinn ergibt ist die folgende:

Man hat gegen Spieler die nur ein bisschen tiefer sind im Rating als man selbst (im Schnitt) eine etwas höhere Gewinnwkeit als die, welche das Elorating vorhersagt, dafür dann gegen Gegner, welche ein viel schlechteres Rating haben eine höhere Chance als das Rating vorhersagt.

Mit so einer Annahme kann man gut erklären wieso die Pros ihre Rating haben (trotz GP spielens.) Und man beachtet dass es halt (vor allem im Limited) immer wieder Spiele gibt, (auch gegen schlechte Gegner) welche man wegen Pech einfach nicht gewinnen kann, und dass diese Wkeit eben nie ganz so klein wird, wie das Elosystem das vorhersagt.

Wirkliche Schwächen des Systems:

Das Ratingsystem hatte natürlich trotz dessen, dass es ganz gut funktioniert so seine Schwächen, aber für die gäbe es natürlich auch Lösungsansätze.

Grosse Varianz:

Das wohl klarste Problem des alten Systems, nach einem GP oder Pro Tour hat der Gewinner (oder allgemein Leute die gut abgeschnitten haben). Ein viel höheres Rating, als er sonst hätte und deswegen nach Elovorhersagen eine viel zu grosse Gewinnwkeit. Also genauer gesagt hat man kann so teilweise bis zu 200 Ratingpunkte holen, was aussagt, dass man ein doppelt so guter Spieler geworden ist, was einfach nicht möglich ist innerhalb eines Turniers. Genauso konnte man halt schnell sehr viele Ratingpunkte verlieren wenn man mal einen schlechten Tag hatte. Das heisst es passiert oft, dass ein Spieler total unterbewertet oder überbewertet ist. Und zwar nicht nur ein bisschen sogar teilweise sehr stark. Dies könnte man ganz einfach lösen indem man die k-Values runterschraubt, die direkt die Varianz steuern. Es gibt RIEESIGE k-Values an grösseren Turnieren, aber auch an FNMs und an Previews sind die k-Values mit 8 immer noch zu hoch, wenn diese niedriger wären käme es nicht zu so grossen Streuungen, wie dies momentan der Fall ist.

Ratingcampen!

Das war auch ein Punkt, welcher sehr stark kritisiert wurde. Man wird belohnt durch nicht spielen bzw. bestraft wenn man spielt. Was dazu geführt hat, dass bestimmte Personen wenn sie ein hohes Rating hatten nicht gespielt haben bis ein bestimmtes Turnier vor der Türe stand. Dafür gäbe es bestimmte Lösungsansätze:

Planeswalkerpunkte

Nein natürlich nicht so wie der Mist momentan gebraucht wird, sondern dass man eine bestimmte Mindestanzahl von PWPs gesammelt haben muss in den letzten 3 Monaten, damit das Rating aktiv bleibt. Dies hätte den Vorteil, dass niemand mehr einfach so durch nicht spielen qualifiziert wird. Hätte aber den Nachteil, dass man zum spielen gezwungen wird, und je nachdem wie hoch diese Mindestanzahl ist, das auch wieder schwer wird für berufstätige Europäer. Ausserdem kann man dann immer noch Ratingcampen, sobald man genug PWP hat und das Rating hoch genug ist. Und natürlich müssten die PWPs in direktem Verhältnis stehen zum k-Value des Turniers UND man darf keine Antrittspunkte erhalten, ansonsten macht das ganze wieder wenig Sinn. Man kann so aber immerhin auch verhindern, dass inaktive Spieler (mit hohem Rating) den aktiven Spielern die Ratingplätze wegnehmen.

Rating safen

Ein Vorschlag war, dass man wählen könnte, dass für eine Zeit lang auf kleineren Turnieren das eigene Rating nicht verändert würde. Dies hätte den Vorteil dass man dennoch spielen dürfte, aber hier ist die Frage wie lange und wie oft darf man das? Jenachdem muss man dann dazwischen auch wieder auf dem Rating campen.  Und ist es nicht fair gegenüber den andern Spielern, die gewinnen aber kein Rating bekommen können. Ausserdem wäre das ganze sehr kompliziert durchzuführen und würde sicher auch oft Fehler produzieren. Es wäre also nicht gerade sehr praktikabel. Ausserdem gefällt mir der Gedanke halt nicht, dass man einfach so spielen und verlieren kann ohne negative Konsequenzen (PWPs…).

Maximales Rating.

Hierbei ist gedacht, dass man das maximale Rating der Spieler während eines Zeitraums betrachtet. Mir ist klar dass es etwas doof ist nur die Ausschläge zu betrachten, ABER bei guten Spielern sind die im Normalfall höher als bei schlechten und so könnte man während der Zeit spielen (es wäre sogar ein Vorteil wenn auch nicht so ein grosser. Das heisst man könnte als schlechter Spieler dennoch kaum, durch enorm viel spielen, einen Ausschlag erzeugen, welcher hoch genug ist), denn man kann nur einen höheren Ausschlag produzieren und nicht den höchsten den man schon hatte zerstören. Natürlich müsste es dann auch noch eine Seite geben auf der die Ratings nach höchstem Ausschlag sortiert währen. Damit man dies dennoch abschätzen kann und es nicht total Radom sein wird und man überrascht wird usw.

Vielleicht kann man auch eine Mischung machen, dass man irgendwie Mindestens X PWPs erhalten haben muss (in der Vorsaison) (wobei X eine kleine Zahl ist die gut erreichbar ist) und dass das maximale Rating der Saison zählt. Damit man nicht so gut Ratingcampen kann auf eine nächste Season hin oder so etwas. Und dass inaktive Spieler nicht die Byeplätze von aktiven Spielern klauen. Natürlich müsste man dann auch die Seasonanfänge und enden schlau wählen UND vorher bekannt geben.

Äpfel und Birnen

Was meine ich damit? Nun ja momentan ist das total Rating dasjenige welche zählt, dies umfasst aber sowohl Limited als auch sämtliche Constructedvarianten. Mir ist klar, dass man auf einer PT sowohl Limited als auch Constructed spielen muss, ABER dort gibt es ein bestimmtes Constructedformat. Und Constructed und Limited zählen ähnlich viel. Im Total zählt das am meisten, das man am meisten spielt. Was halt auch dazu führen könnte dass ein total schlechter Limitedspieler (oder total schlechter T2 Spieler) durch Rating an eine PT eine Einladung kriegt, was nicht der Sinn sein kann. Ausserdem macht es wohl kaum Sinn, dass jemand der nur Legacy spielt und damit ein hohes Rating geholt hat für ein T2 GP Byes kriegt (das umgekehrte macht natürlich genau so wenig Sinn). Das Totalrating ist momentan einfach so ein Topf bei dem man Birnen mit Äpfeln vergleicht. Mir ist klar, dass verschiedene Blockconstructed usw. auch total anders sind, und man die deswegen nicht vergleichen kann, aber ich denke Blockconstructed und T2 sind nah genug beieinander, damit man diese in einen Topf schmeissen könnte. Modern ist das vielleicht schon nicht mehr. Legacy ist es ganz sicher nicht mehr. Vintage sowieso nicht (falls das noch gespielt wird). Und Limited ist auch schon vom Prinzip her was total anderes. Man müsste für diese Dinge einzelne Ratingsysteme haben, welche auch tatsächlich zählen. Und anhand der RatingS (Mehrzahl) der Formate welche auf dem jeweiligen Turnier gespielt werden Invites und Byes vergeben und die nicht aus einem riesigen Topf ziehen, welchen man durch beliebige Turniere füllen kann. Es mag zwar sein, dass ein Spieler der gut ist, das in allen Formaten mehr oder weniger sein könnte. Aber nicht alle Spieler beschäftigen sich mit allen Formaten gleich stark. Und es gibt schon auch deutliche Unterschiede bei den Formaten so dass man diese schon üben sollte, damit man darin gut ist.

Fazit:

-Das Eloratingsystem funktioniert auch bei Magic eigentlich ganz gut. Es soll die erwartete Turnierstärke von Spielern zeigen und das tut es mehr oder weniger.

-Man darf wenn man annimmt, dass die Pros andere Gewinnwkeiten haben, als die welche das Elorating voraussagt, nicht solche Annehmen, welche das Rating nicht erklären können dass sie jetzt haben, bzw. mit denen man diese Ratings gar nicht holen und halten könnte.

-Ein Ratingsystem sollte gut funktionieren, wenn ähnlich starke Spieler gegeneinander spielen, das andere ist unnatürlich.

-Man sollte kein Rating farmen können dadurch, dass man schwache Spieler abfarmt.

-Die k-Values sollten kleiner sein, damit diese nicht so eine hohe Varianz verursachen.

-Man sollte einen kleinen Mechanismus einbauen, dass das Rating der besten nicht inaktiven Spieler zählt.

-Man sollte weiter vielleicht nicht das Endrating einer Season zählen sondern das maximale Rating.

-Man sollte für verschiedene Formate verschiedene RELEVANTE Ratings haben und nicht ein total Rating bei welchem man Äpfel und Birnen vergleicht.

Über Tigris

Schweizer Magicspieler.
Dieser Beitrag wurde unter Allgemeines veröffentlicht. Setze ein Lesezeichen auf den Permalink.

2 Responses to Elo Rating und wie man es verbessern könnte.

  1. original_pete sagt:

    Scheint ein vieldiskutiertes Thema zu sein, das Rating. Schön, auch mal aus deiner Perspektive was zum Thema zu lesen.
    Schon weil ich mich in der kuriosen Situation befinde, dass quasi gleichzeitig bei einem meiner Hobbys das ELO-Rating abgeschafft, bei einem anderen ein ELO-ähnliches Rating eingeführt wurde.
    Vielleicht melde ich mich später mit einer genaueren Analyse – von Schnellschüssen halte ich bei so einem komplizierten Thema nichts.

  2. BigBOne sagt:

    -Einige gute Spieler haben höhere und andere kleinere Gewinnwkeiten gegen die schlechten Spieler als das Elo das vorhersagt.

    Wie kann das denn zustande kommen? Spieler mit hohem Rating sollten sich schon ans Meta anpassen.

    -Man sollte kein Rating farmen können dadurch, dass man schwache Spieler abfarmt.

    Das ist nie möglich solange man nur die Gwk ändert. Nur bei neuen „overrated“ Spielern geht das. Aber selbst dies sollte bei einem Absenken der K-Value(1/4?) kaum ein Problem darstellen. Man bräuchte dann auch noch eine Nachkomastelle fürs Rating.

    Gegen Camping könnte man einführen dass man in einem bestimmten Zeitraum genügend Rating „riskiert“ hat(K-Value * Matches)

    Für die Berechnung der Gwk hatte ich bei trischai ja schon geschrieben wie man sie anpassen könnte. Wer sich dafür interresiert, folgendes bei wolframalpha einfügen:
    Plot[( &#; in[])/ + /( + in[]) , /(+^(/)), , -,]
    (links sind hier ja anscheinend nicht erlaubt)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.