Rollenspieltheorie Varianz und Statistik von Würfelsystemen

Abaton23

Halbgott
Registriert
5. Dezember 2011
Beiträge
252
In einem anderen RPG-Forum bin ich auf die folgende Vortragsreihe gestoßen.
Das fand ich hochinteressant, da ich schon viel über Schwächen der Systeme nachgedacht habe, welche in unserer Runde so gespielt werden.

Hier die Links zu den Vortragsvideos: Tom Vogt über Varianz und Statistik von Würfelsystemen

Vorstellung
Teil 1
Teil 2
Teil 3
Teil 4

Hier noch die wesentliche Grafik, welche Ergebnisverteilung ein realistisches System angeblich zeigen sollte:
Ideal.png


Dabei stellt sich zwangsläufig die Frage: Wie sähe ein solches Würfelsystem in der Praxis aus?
 
Die Grafik zeigt eine breite, flache Ergebnisverteilung bei niedrigem Skillwert. Bei einem hohen Skillwert zeigt sich eine sehr hohe Kurve in der Ergebnismitte. Der Kurvenrand zeigt viel weniger Ergebnisse. Hohe Kurven mit wenig Breite weisen meines Wissens auf das Gesetz der hohen Zahlen hin.

WIKIPEDIA: Die Wahrscheinlichkeit, dass eine Münze beim Werfen Kopf zeigt, betrage ½. Je häufiger die Münze geworfen wird, desto unwahrscheinlicher wird es, dass der Anteil der Würfe, bei denen Kopf erscheint, um mehr als einen beliebigen vorgegebenen Wert von der theoretischen Wahrscheinlichkeit ½ abweicht. Dagegen ist es durchaus wahrscheinlich, dass die absolute Differenz zwischen der Anzahl der Kopf-Würfe und der halben Gesamtzahl der Würfe anwächst.

Ich versteh das so: Die Kurve erklärt uns, dass Würfelsysteme um so realistischer sind, wenn die Anzahl der Würfel mit dem Skillwert wächst. Doch wie müsste ein Würfelsystem in der Praxis aussehen, um solche Ergebnisse zu bringen?
 
Du nimmst xW und addierst daraus immer die höchsten 3 Würfel. Für negative Skillwerte addierst du entsprechend die niedrigsten Würfel.
 
Ich versteh das so: Die Kurve erklärt uns, dass Würfelsysteme um so realistischer sind, wenn die Anzahl der Würfel mit dem Skillwert wächst. Doch wie müsste ein Würfelsystem in der Praxis aussehen, um solche Ergebnisse zu bringen?
Das Storyteller-System der WoD arbeitet ja auch genauso.
Die zusätzlichen Würfel erhöhen da nicht nur das maximal Mögliche, sondern eben auch die Wahrscheinlichkeit, dass man eine Durchschnittsleistung verlässlich vollbringen kann.

Aber mit "realistischer" wäre ich vorsichtig. Systeme sind nicht realistisch - die Umsetzung und Interpretation der Würfelergebnisse am Spieltisch kann realistisch sein. Aber ob ich 10.000 Würfel nehme um ne perfekte Glockenkurve zu erwürfeln und dann alles überdurchschnittliche als Instant-Kill auslege oder ne Münze werfe und "Kopf" als Instant-Kill auslege, macht letztendlich keinen Unterschied.

Die interessante Frage ist "Wo und wie braucht man welchen Detailgrad?".
Will man in einer spannend-gamistischen Runde viele knappe Herausforderungen mit Wahrschinlichkeiten um die 50% dann würde ich die Glockenkurve empfehlen. Will man ein Setting das stark Erfolgsgrade unterscheidet, sollte die Kurve anders aussehen.

DAS realistische Wahrscheinlichkeitsmodell gibt es nicht. Und Normalverteilungen verwendet man in der Praxis meist nur, weil sie einfach zu berechnen sind, aber immer mehr wissenschaftliche Modelle weichen auf andere (aber ähnliche) Verteilungsfunktionen aus.
 
Hab mal kurz reingesehen:
Nicht blöd, was der da erzählt, aber natürlich ein wenig vereinfacht und ein wenig populärwissenschaftlich verwurstet - was aber ja durchaus positiv ist.
 
Also mit meinen persönlichen "magischen" Würfeln hätte ich Probleme ne Glockenkurve zu Würfeln ;) Weiß noch mein dunkelblauer Lieblings-W20, als ich ihn aus der Box zu und 5x probegewürfelt habe, mit dem Ergebnis : 19 -20 - 17 - 20 - 20 :cool: Bisher hat der mich nicht im Stich gelassen. ;)

Modelle können die Wirklichkeit auch nur bis zu einem bestimmten Punkt abbilden. Wirklich realistisch ist und bleibt nunmal die Realität. ;)
 
Oh... der hat auch die oWoD geplottet.
Da ist tatsächlich das aufgetreten, was ich mit "Realismus kommt am Spieltisch" meinte:
Auf seiner Wandgrafik sehen die starken Charakter am unverlässlichsten aus. Nach reiner Erfolgsanzahl stimmt das so auch.

Gerade bei mir ist es aber bei der oWoD nicht so, dass der Fokus auf der Anzahl der Würfelerfolge liegt, sondern auf der variierenden Schwierigkeit und der Frage ob konstant wenigstens ein Erfolg erzielt wird. Und diese Konstanz erhöht sich in hohen Werteregionen massiv. Hätte er statt die Wahrscheinlichkeit der Erfolgszahlen zu plotten (Junge, das ist die oWoD, nicht die nWoD... in der oWoD variiert man die Schwierigkeit!!!1!!1elf!!), eine Grafik der Wahrscheinlichkeiten bei verschiedenen Schwierigkeiten angegeben, würde das sogar noch ne hübschere Kurve geben als seine abgeschnitten geschummelten Normalverteilungsplots.
 
...wollte euch dirket noch nen Plot hinterherschicken, aber kriege auf die Schnelle keinen hin, der das ausdrückt, was ich eigentlich sagen will:

In der Praxis messen die wenigsten Systeme einfach nur ein "result", wie auf der obigen X-Achse.
In der Praxis am Spieltisch gehts meist darum "bestehe ich die Probe oder bestehe ich sie nicht".
Die oWoD hat zwar insofern einen "result"-Wert als dass sie eine Anzahl von Erfolgen ausspuckt - aber das gefühlte "result" hängt damit nicht linear zusammen. Der Sprung von keinem Erfolg zu einem Erfolg ist wesentlich wichtiger und bedeutender als der Sprung von 7 auf 8 Erfolge.
Wer im Kampf einem Menschen mit einem Erfolg in den Kopf schießt, hat den Kampf damit beendet - da von einer größeren Unsicherheit des Profis zu sprechen, nur weil man nicht sicher weiß ob man 5 oder 8 Erfolge würfelt, ist völlig absurd.

Mein mathematischer (und zZ zu umfangreicher) Ansatz wäre es eine Nutzungfunktion auf die Ergebnisse anzuwenden und dann eine entsprechend gestauchte Nutzen-Verteilungsfunktion zu basteln... und diese würde dann eben nicht nur zufällig ähnlich aussehen wie die obige Verteilungsfunktionenschar, sondern ganz bewusst, weil ich eben weiß, wie das System funktioniert, mir mathematische Gedanken dazu gemacht habe und am Spieltisch die Ergebnisse so interpretiere, dass am Ende was realisitisches rauskommt.

Ein anderer Ansatz wäre es auch einfach mal alles was über 5 Erfolge geht zusammen zu stauchen und (wie by-the-book vorgesehen) unter Perfektion zusammenzufassen.

hmmm... werde wohl noch länger wach bleiben (weil ich lernen muss). Falls Interesse besteht, kann ich das später noch posten.
 
Fühl mich gerade wie ein anderer Jack ... kein Captain, dafür ein bekannter Colonel namens O'Neill ... "Könnte mir mal jemand erklären, was das bringen soll?" ;) Ist nicht böse oder abwertend gemeint, aber was heißt das alles auf Deutsch?!? :confused:
 
Ich kann dir natürlich nur sagen, was es mir bringt bzw. meinen Spielern:

Ein realistisches Spielgefühl. Wenn ein Spieler feststellt, dass sein "Casanova" sich bei jedem zweiten Verführungsversuch eine Ohrfeige einfängt, dann kann das Absicht sein - weil sich die Gruppe einig ist, dass auch ein Profi-Verführer mit häufigen Niederlagen rechnen muss und nur durch die hohe Versuchsanzahl so erfolgreich ist - oder aber man stellt gemeinsam fest, dass dieser Versager nicht der Vorstellung entspricht, die man von einem solchen Profi hat.

Solche Probleme können dann einfach an einer schlechten Werte-Verteilung liegen oder aber auch direkt am System:
Ein klassisches W20-System, in dem man immer nur genau einen W20 rollt liefert meist bei ner 1 (oder 20) einen automatischen Patzer. Das bedeutet 5% Patzer-Wahrscheinlichkeit egal wie gut der SC auch ist. Knallharte beinahe unfehlbare Profis kann man damit UNMÖGLICH abbilden.

Mit den meisten Systemen lassen sich keine Profisportveranstaltungen nachspielen, da man auf derart hohem Leistungsniveau garnicht mehr differenzieren kann und meist die Varianz des Systems so hoch ist, dass Vettel spätestens bei der 25. Kurve nen Patzer würfelt und gegen die Wand kracht. (über die WoD sagt man ja gerne, dass sie so viele Patzer liefert, dass ein normaler Mensch einen normalen Tag nie überleben könnte)
Andere Systeme haben zu wenig Streuung und erklären einen Schusswaffentreffer zu einem Phänomen, dass sich nicht einmal zufällig erleben lässt, solang man keine Waffenausbildung hinter sich hat.
Andere Systeme fokussieren sich so sehr auf das Fähigkeitsniveau durchschnittlicher SCs, dass sich große und kleine Tiere in der Skala kaum unterbringen lassen und deswegen eine Fliege so stark wie eine Maus und eine Katze ist, während der Elefant seinen Stärkewurf nicht mit nem Würfelbecher, sondern mit ner Würfeltonne machen muss...

und und und...

Wenn man die Eigenheiten des bespielten System kennt, kann man den größten Teil dieser Eigenheiten aber durch angepasste Interpretation der Würfelergebnisse ausgleichen.
Manche Systeme erleichtern das - manche machen es einem richtig schwer.

Wer sich damit nicht beschäftigt, muss den Angaben der Autoren vertrauen (wie: "4 Erfolge sind unglaublich selten und extrem cool!!!"), was in negativen Extremfällen dazu führt, dass das System einfach fühlbar unrealistisch simuliert (wenn selbst ein NSC-Bauer ständig 4 Erfolge erzielt).
 
Ich fand an dem Vortrag vor allem auch die Erläuterung spannend, welche Würfelsysteme gerne von Spielern akzeptiert werden. Vergleichen ist einfacher wie addieren, addieren ist einfacher wie multiplizieren, multiplizieren ist einfacher wie dividieren... Wahrscheinlichkeiten eines Erfolgswurfes sollten schnell erkannt werden....

Daran gemessen wären einige marktführenden Systeme gradezu Themaverfehlungen. Dreimal getrennt würfeln, dabei jedesmal subtrahieren, die Subtraktionsergebnisse addieren, den Endwert in einer Liste vergleichen, HALT-hab die Modifikatoren noch vergessen. Wie hoch eine Wahrscheinlichkeit ist, kann eh kein Mensch mehr schätzen.

Meine derzeitigen Favoriten sind WoD-Erfolge zählen und Fate-Differenzen messen. Beide zeigen jedoch auch Schwächen.
  • Bei WoD muss ich jeden einzelnen Würfel mit dem Modifikator vergleichen und es können enorm viele Würfel werden.
  • Bei Fate zeigen gute Skillwerte eine gleichhohe Verteilungsanhäufung wie schlechte. Dort muss ich +werte und -werte einzeln zählen und subtrahieren. Der Endwert wird dann mit einer Tabelle verglichen.
Bekäme man das noch einfacher hin?
 
Bei der WoD gibt es daher bei der neuen Fassung Würfel welche ab einem bestimmten Schwellenwert anders eingefärbt sind.
Wohingegen die cWoD die Herausforderung bietet das einerseits mitunter mehr als ein Erfolg gefragt wird, gerade in erweiterten Proben, sowie das über die Regel der 1 ein Erfolg negiert werden kann.
 
Meine derzeitigen Favoriten sind WoD-Erfolge zählen und Fate-Differenzen messen. Beide zeigen jedoch auch Schwächen.
  • Bei WoD muss ich jeden einzelnen Würfel mit dem Modifikator vergleichen und es können enorm viele Würfel werden.
  • Bei Fate zeigen gute Skillwerte eine gleichhohe Verteilungsanhäufung wie schlechte. Dort muss ich +werte und -werte einzeln zählen und subtrahieren. Der Endwert wird dann mit einer Tabelle verglichen.
Meiner Meinung ist gerade bei den beiden Spielen diese Betrachtung zu stark eingeschränkt, da Spieler die Würfe aktiv massiv beeinflussen können: bei der oWoD mittels Willenskraft und bei FATE mittels FATE-Punkten.
Willenskraft kann bei jedem Wurf angewendet werden, da es immer einen 1W dazu gibt wirkt sich die Änderung bei schlechten Werten stärker aus als bei guten - was man im Bezug auf den Begriff "Willenskraft" sicher weit diskutieren kann ob das sinnvoll ist oder nicht.
Bei FATE hängt die Effizienz der FATE-Punkte dagegen wesentlich von Aspekten ab. Natürlich können die für jeden Wurf genutzt werden, aber wenn ein Aspekt da ist, sind sie effizienter und so ist die Motivation des Spielers, einen zu nutzen auch größer. Da im allgemeinen Aspekte und Skills um das gleiche Charakterkonzept entwickelt werden decken sich gute Werte und Aspekte relativ häufig und so hängt die Verteilung der Probenresultate im Profi-Bereich des Charakters eben nicht nur von der Höhe der Skills ab, da mit Aspekten nicht nur ein Bonus auf den Wurf gegeben werden kann (was das Maximum und den Durchschnittswert erhöht) sondern der Wurf auch wiederholt werden kann (was die Varianz drastisch senkt).

Zum Thema ob Tests durch Würfelproben realistisch sind, realistisch sein sollen oder was wurde in andren Threads ja schon viel geschrieben ...
 
Willenskraft gibt in der cWoD weniger 1W(ürfel) als 1E(rfolg) dazu.
oWoD und nWoD kenne ich, was ist denn nun die cWoD? ^^
Falls das die oWoD sein soll - bei uns gabs immer 1W drauf ... kann sein, dass das am SL lag, kann sein, dass das in verschiedenen Grundregelbüchern verschieden steht ... an meinem Punkt, wie die Probe beeinflusst wird ändert es nicht signifikant was.
 
cWoD ist classic WoD, oder auch klassiche WoD.
Gefällt mir besser als old oder alte. ^^

Hinsichtlich der Regeln, soweit mir bekannt bei Vampire durch alle Editionen, gibt ein Willenskraftpunkt ein automatischer Erfolg. Der je nach Interpretation der Regeln auch nicht durch 1er gekillt werden kann. Also hauptsächlich zur Erklärung.
Relevant wird es, glaube ich, wenn man eine Situation mit Schwierigkeit 10 und Spezialisierung (explodierende Würfel wie z.B. bei VtM 3rd) hat. Wo es passieren kann das größere Würfelpools nicht zwingend besser sind.
 
Die Eingangsgrafik deutet darauf hin, dass schlechte Skillwerte über wenige Würfel geworfen werden, die willkürliche Verteilung erstreckt sich gleichmäßiger über einen breiten Bereich. Gute Skillwerte sollten über viele Würfel verfügen. Deshalb zeigen sie eine Anhäufung über einen relativ kleinen Bereich, das Gesetz der hohen Zahl drängt die Ergebnisse in der wahrscheinlichen Durchschnittsmitte zusammen.


Ich nehm als Ansatz mal den reinen Mechanismus von FATE, da es in der Basis schon ein super System ist und ignoriere den Einsatz von Fate-punkten:

Bei FATE muss ich sowohl die positiven und negativen Würfelergebnisse zusammen zählen, um die Summen voneinander zu subtrahieren. Das Ergebnis wird mit einer Modifikatortabelle verglichen. Da wir nicht zählen UND subtrahieren wollen, folgender Lösungsvorschlag:
  • Würde man aus Plus=2 machen, aus 0=1 und aus Minus=0, würde das Zählen und die Subtraktion durch Additionen entfallen. Die Modifikation der Zieltabelle müsste dementsprechend erhöht werden.
  • Streiche man die 0 komplett und mache aus Plus=1, würde selbst die Addition durch reines Abzählen ersezt werden. Die Modifikation der Zieltabelle müsste entsprechend kleiner skaliert werden.
Bei FATE verändert sich die Höhe und Breite der Ergebniskurve nie, da auch gute Skillwerte über die gleiche Anzahl von Würfel geworfen werden.
  • Würde man den Skillwert nicht über eine Ergebnistabelle anbieten, sondern über die verfügbare Anzahl der Würfel, so zeigte die Ergebniskurve von guten Skillwerten die obige Grafik.
  • Die Modifikatortabelle müsste enstprechend der Schwierigkeit nur noch definieren, wieviele Würfelerfolge zum lösen der Aufgabe erforderlich wären.
 
Zurück
Oben Unten