Schachburg-Archiv: Benutzerthema „Kritik am DWZ-Algorithmus“

schachburg.de

Beitrag von Pantau

Hallo zusammen,ich beschäftige mich im Moment mit der Frage nach der Qualität des DWZ-Algorithmus für Jugendliche bzw. schwache Spieler.Dabei steht im Fokus meiner Kritik sowie meiner Überprüfungen die Frage nach der Sinnhaftigkeit des sog. "Bremsfaktors" und des "Beschleunigungsfaktors". Die Formel ist leider insgesamt etwas länglich und verschachtelt, man kann aber sagen, dass der Bremsfaktor faktisch dafür sorgt, dass man die DWZ kaum unter die 700er-Marke bekommt, egal wie schlecht man spielt. Ich bin von Haus aus Ingenieur für Regelungstechnik und daher ist das, was dieser Algorithmus tut bzw. tun sollte nichts Neues: Es ist ein sog. "Beobachter" oder auch "Zustandsschätzer". Ein solcher "Beobachter" wird immer dann eingesetzt, wenn es nicht beobachtbare innere Zustände (hier: Die Spielstärke) eines Systems (den Spieler) gibt, auf welche man nur aufgrund von Messungen des Outputs (die Spielergebnisse) schließen kann. Ein qualitativ hochwertiger "Beobachter" muss nun möglichst schnell möglichst genau die reale Spielstärke anzeigen und muss diese auch gut nachführen, wenn sie sich ändert. Er muss also dafür sorgen, dass die DWZ mit der realen Spielstärke übereinstimmt. Das tut sie bei Spielern mit REAL unter 700DWZ aber gerade nicht, obwohl es im Grundschulalter normal ist, real zwischen 300 und 500 DWZ an tatsächlicher Spielstärke zu haben. Wenn also nun so ein Kind recht früh sich eine DWZ erkämpft, dann fängt es mit über 700 an, und diese Zahl bleibt dann zunächst mal stehen, fällt sogar ganz leicht immer weiter. Wenn die echte Spielstärke hingegen angezeigt würde, dann könnte das Kind sehen, wie es langsam sich von der 400 bis zur 700 steigert, was dieser Algorithmus jedoch verhindert.Bei den starken Kindern hingegen schlägt der Beschleunigungsfaktor zu: Die Kinder bekommen bei gleicher Spielleistung mehr DWZ-Punkte, als dies bei Erwachsenen der Fall wäre, und vor allem verhindert der Bremsfaktor, dass miese Ergebnisse richtig berücksichtigt werden können. Ergebnis: Z.B. spielte in der letzten Saison meine große Tochter zweimal bei uns als Ersatz in der Bezirksoberliga und zweimal wurde sie von jeweils einem anderen viel stärkeren Gegner völlig unterschätzt, beide liefen jeweils in eine Gabel o.Ä. rein und wegen dieser beiden Siege schoss ihre DWZ allen Ernstes um über 200 Punkte hoch (ein Erwachsener hätte nicht mal 80 Punkte dazubekommen)! Dies wurde ihr dann natürlich in den folgenden Turnieren schmerzhaft wieder abgenommen, natürlich schön laaaangsam, des Bremsfaktors wegen. Es kommt also offenbar zu einer Art "DWZ-Blasenbildung" und ich habe das bei anderen Kindern auch schon gesehen, was ich für sehr motivationsschädigend halte. Ich bin gerade dabei, diese Effekte mit einem Computerprogramm mal zu simulieren, würde aber gerne auch mal wissen, ob andere ähnliche Erfahrungen gemacht haben?

Beitrag von ToBeFree

Bremsfaktor und Beschleunigungsfaktor wirken auf mich so, als hätte jemand einen schlechten Algorithmus entworfen und diesen nachträglich mit einem Vorschlaghammer angepasst.

Beitrag von Pantau

@ToBeFreeBingo! Wie gesagt, ich komme von der Regelungstheorie her und sehe das ganz genauso. Es gibt übrigens z.B. im US-amerikanischen Ratingsystem eine viel elegantere Verfahrensweise: Dort wird die "Empfindlichkeit" vergrößert, wenn es sich um einen Spieler handelt, dessen Ratingzahl sich in der Vergangenheit stärker änderte. Spielt er hingegen konstanter, nimmt auch die Empfindlichkeit wieder ab. Die Begründungen für Brems- oder Beschleunigungsfaktor lesen sich übrigens so, als wolle man den Jugendlichen "etwas Gutes tun" - aber wie ich schon beschrieb, erreicht man damit genau das Gegenteil! Meine Kleine ist seit mehreren Jahren im 700er Bereich, hat aber schon mit vier Jahren angefangen und damals sicherlich zwischen 200 und 300 DWZ realer Spielleistung gehabt, mittlerweile stimmen die 700 in etwa. Aber eine Steigerung ihrer DWZ hat sie noch nie gesehen. Was ich nicht verstehe: Die entsprechenden Algorithmen sind seit Jahrzehnten bekannt und werden in der Technik auch angewendet. Jeder Student der Prozessinformatik kann einen solchen im Schlaf runterprogrammieren. Mir ist nicht klar, weshalb man hier versucht hat, das Rad neu zu erfinden. Meine Vermutung ist die, dass es Mathematiker waren, denen nicht klar war, mit was sie es hier eigentlich genau zu tun haben und wo man einfach nur 1:1 abschreiben hätte müssen.

Beitrag von Babylonia

Hi Pantau,hier geht es wahrscheinlich darum, eine "rating deviation" einzuführen, wenn ich das mathematisch richtig einordne. Der Fall deiner Tochter soll hier als Präzendenzfall dienen.Mir sind von den Listen des Deutschen Schachbundes erwachsene Frauen bekannt, die eine DWZ - Ratingzahl im 700-er Bereich haben. Soll deren Ratingzahl dann auch bis auf 100 oder 200 DWZ absinken dürfen? Ich stelle mir vor, wie die sich damit blamieren würden! :rolleyes:Babylonia

Beitrag von Pantau

Hallo Babylonia,das wäre dann aber ein Missbrauch eines Werkzeugs. Bei IQ-Tests oder einer Personenwaage wird ja auch nicht so verfahren. :DIm Übrigen beißt sich da natürlich auch die Katze in den Schwanz, denn es ist ja vor allem deshalb sehr peinlich, weil aktuell keiner derartig niedrige Ratings bekommen kann. Zudem haben diese Frauen ja auch das gleiche Problem, dass sie nicht sehen können, dass sie besser werden, solange sie nicht den 800er-Bereich erreichen. Da ich sehr viel mit Grundschülern/Anfängern arbeite weiß ich, dass 800 DWZ eine ganze Menge "Holz" ist.

Beitrag von Pantau

OK, Simulation ist fertig. Hier zwei "Durchläufe". Einmal für Jugendliche und einmal für Erwachsene. Jeweils mit 20 Szenarien. Die dicke rote Kurve ist die tatsächliche, nicht messbare Spielstärke, bei jedem Turnier werden 7 Runden gespielt, sowohl gegen schwächere als auch gegen stärkere und gleich starke Gegner, die Ergebnisse sind zufällig, mit gewichteten Wahrscheinlichkeiten gemäß DWZ-Differenzen. Die Spielstärke hat einen unrealistisch dynamischen Verlauf, aber nur so kann man den Algorithmus wirklich in seiner ganzen "Pracht" verfolgen.Erwachsene:[ATTACH=CONFIG]1682[/ATTACH]Jugendliche:[ATTACH=CONFIG]1683[/ATTACH]

Beitrag von ToBeFree

Wow! Kannst du das, zusammen mit einer kurzen Erklärung, wie die Simulation erstellt wurde, auf [Hier befand sich ein Link auf die Seite "https://commons.wikimedia.org/wiki/Special:UploadWizard". Der Link wurde vom Benutzer mit dem Titel "Wikimedia Commons" versehen. Aus urheberrechtlichen Gründen ist es möglicherweise erforderlich, diesen Hinweis beizubehalten, da manche Benutzer die Quelle ihrer Zitate von anderen Internetseiten so gekennzeichnet haben. Dieser Hinweis wurde automatisch an Stelle des früheren Links platziert. Falls der Link unangemessen oder ohnehin unerreichbar geworden ist, kann die im Impressum genannte Adresse mit einer Bitte um Entfernung kontaktiert werden.] hochladen? Das könnte man in mehrere Wikipedia-Artikel einbauen. Falls du MATLAB o.ä. verwendet hast, könntest du den Programmcode in der Beschreibung mitliefern. Um Formatierung und Details kümmere ich mich.Was passiert, wenn die dicke rote Kurve in Bereichen unter 700 DWZ verläuft? Das Phänomen, dass die DWZ praktisch nicht unter 700 DWZ sinkt, ist mit dieser Simulation wahrscheinlich noch nicht nachbildbar, wenn ich das richtig verstehe.Besonders schön wäre natürlich, wenn man es irgendwie hinbekommt, die rote Kurve bei 200 DWZ beginnen zu lassen, während die simulierte Ergebnis-DWZ aufgrund korrekt nachgebildeter Umstände bei 700 startet und unabhängig vom Anstieg der roten Kurve für lange Zeit unverändert dort bleibt. Dann könnte man im Diagramm genau den von dir kritisierten Effekt beobachten.Die DWZ-Tabellen gibt es anscheinend hier im CSV- und SQL-Format: [Hier befand sich ein Link auf die Seite "https://www.schachbund.de/download.html". Der Link wurde vom Benutzer mit dem Titel "https://www.schachbund.de/download.html" versehen. Aus urheberrechtlichen Gründen ist es möglicherweise erforderlich, diesen Hinweis beizubehalten, da manche Benutzer die Quelle ihrer Zitate von anderen Internetseiten so gekennzeichnet haben. Dieser Hinweis wurde automatisch an Stelle des früheren Links platziert. Falls der Link unangemessen oder ohnehin unerreichbar geworden ist, kann die im Impressum genannte Adresse mit einer Bitte um Entfernung kontaktiert werden.]

Beitrag von Pantau

@ToBeFreeDoch, das von mir beschriebene Phänomen im "Mikrospielstärkebereich", wie ich ihn nenne, lässt sich auch simulieren (ich glaube für die ersten 5 Wertungen gibt es noch eine Besonderheit, die ich noch nicht drin habe...):Erwachsene schwache Spieler:[ATTACH=CONFIG]1684[/ATTACH]Jugendliche schwache Spieler:[ATTACH=CONFIG]1685[/ATTACH]Und auch interessant, was eigentlich los ist, wenn die Spielstärke konstant bleibt:Konstante Spielstärke Erwachsene:[ATTACH=CONFIG]1686[/ATTACH]Konstante Spielstärke Jugendliche:[ATTACH=CONFIG]1687[/ATTACH]Geschrieben habe ich das in LabView. Nach meinem Diplom als E-Ingenieur habe ich 2,5 Jahre damit Software für automatische Prüfstände entwickelt. Ich mache zwar schon seit über 10 Jahren beruflich etwas ganz anderes, aber das ist die einzige Programmiersprache, die ich noch recht gut kann.

Beitrag von ToBeFree

[QUOTE=Pantau;28647]Erwachsene schwache Spieler:[ATTACH=CONFIG]1684[/ATTACH]Jugendliche schwache Spieler:[ATTACH=CONFIG]1685[/ATTACH][/QUOTE]Diese beiden sind wirklich beeindruckend! Da kann man die Frustration eines eigentlich langsam immer besser werdenden jugendlichen Spielers geradezu am Diagramm ablesen. Lustigerweise wäre ausgerechnet die "normale" Erwachsenenwertung hier deutlich besser geeignet – der Jugend-Bremsfaktor versagt genau dort, wo er helfen sollte.

Beitrag von Babylonia

Die Entwicklungen verhalten sich ja bei erwachsenen und jugendlichen schwachen Spielern völlig anders, oder interpretiere ich diese bunten Graphen falsch?Babylonia

Beitrag von Pantau

@BabyloniaNein, danke für den Hinweis: Ich habe es nochmal überprüft. Der Bremsfaktor (ofiziell heißt er "Bremszuschlag") wird, anders als der Beschleunigungsfaktor, unabhängig vom Alter für alle Spieler unter 1300 DWZ vergeben. Mit anderen Worten, Deine Beobachtungen sind richtig, bei schwächeren erwachsenen Spielern trifft in etwa auch die Grafik für die Jugendlichen zu.

Beitrag von ToBeFree

Ah! Das erklärt, warum auch erwachsene Spieler nicht unter die 700 fallen. Wäre sonst tatsächlich merkwürdig gewesen, jetzt wo Babylonia es erwähnt hat.Dann zeigt das obere Bild nicht die Erwachsenen-Situation, sondern das schöne Ergebnis, das es gäbe, wenn man den Bremsfaktor abschaffen würde.

Beitrag von Pantau

@ ToBeFreeGenau!