Das empirische »Gesetz« der großen Zahlen

Im letzten Beitrag haben wir gesehen, wie in einem längeren Münzwurfexperiment die relative Häufigkeit für Kopf immer näher an 1/2 herangekommen ist. Obwohl es keine Garantie dafür gibt, dass es so sein muss, ist so eine Stabilisierung von relativen Häufigkeiten und anderen Messgrößen oft zu beobachten. Diese Erfahrungstatsache nennt man das empirische »Gesetz« der großen Zahlen.

Wie kann man sich das erklären?

Betrachten wir dazu das sog. Ensemble aller möglichen Serien aus 5 Münzwürfen. Davon gibt es in Summe 2^5=32 verschiedene, die in der folgenden Tabelle aufgelistet sind (0 steht für eine geworfene Zahl und 1 für einen Kopf).

Serie h(1) Serie h(1) Serie h(1) Serie h(1)
00000 0.0 01001 0.4 00111 0.6 11010 0.6
00001 0.2 10001 0.4 01011 0.6 11100 0.6
00010 0.2 00110 0.4 10011 0.6 01111 0.8
00100 0.2 01010 0.4 01101 0.6 10111 0.8
01000 0.2 10010 0.4 10101 0.6 11011 0.8
10000 0.2 01100 0.4 11001 0.6 11101 0.8
00011 0.4 10100 0.4 01110 0.6 11110 0.8
00101 0.4 11000 0.4 10110 0.6 11111 1.0

Wenn wir eine »faire« Münze verwenden und ordentlich werfen, ist keine dieser Serien vor den anderen bevorzugt.

In der Tabelle ist neben jeder Serie auch die relative Häufigkeit h(1) von Kopf in dieser Serie angegeben. Während es 32 verschiedene Serien gibt, gibt es aber nur 5+1=6 verschiedene relative Kopfhäufigkeiten. Und einige davon kommen offensichtlich öfter vor als andere. Die entsprechenden Anteile der verschiedenen Kopfhäufigkeiten zeigt die Abbildung unten links.

Ensemble
Die Anteile an allen Münzwurfserien der Länge n mit den entsprechenden relativen Kopfhäufigkeiten für n=5 (links) und n=1000 (rechts). Die blauen Balken sind die exakten Werte, die roten Kurven sind Gaußsche Glockenkurven. Rechts liegen die blauen Balken so dicht, dass sie zu einer Fläche verschmelzen.

Zunächst fällt auf, dass h(1)=0.5 nicht vorkommt. Bei einer ungeraden Anzahl an Münzwürfen ist das generell unmöglich. Trotzdem ist bei 20 von 32 Serien h(1) in der Nähe von 1/2 (0.4 oder 0.6).

Noch viel stärker sieht man das bei einer Wurfserie mit 1000 Würfen (Bild oben rechts). Hier gibt es in Summe 2^{1000}\approx10^{301} mögliche Serien, das ist eine 1 gefolgt von 301 Nullen. Keine davon ist vor den anderen bevorzugt; außerdem wird die überwiegende Mehrheit davon in diesem Universum niemals realisiert werden. Trotz dieser riesigen Zahl an möglichen Wurfserien ist die Anzahl 1000+1=1001 der verschiedenen möglichen Kopfhäufigkeiten überschaubar.

Wie das Bild oben rechts zeigt, haben fast alle Serien eine relative Häufigkeit für Kopf in der »Nähe« von 1/2. Konkret: für 99.8% aller möglichen Wurfserien gilt 0.45 \leq h(1) \leq 0.55. Nur jeweils etwa 0.1% haben Werte unter- bzw. oberhalb dieses Intervalls.

0.1% von 10^{301} sind 10^{298}. Das ist immer noch eine riesengroße Zahl; die Anzahl der Atome im beobachtbaren Universum wird auf vergleichsweise lächerliche 10^{80} geschätzt. Trotzdem würde wohl jeder erwarten, dass seine Wurfserie eher nicht dazu gehört, obwohl das natürlich möglich wäre.

Wenn man die Anzahl der Würfe weiter erhöht, wird die rote Kurve immer schmäler. Entsprechend wird die Erwartung, dass h(1) weit von 1/2 abweicht immer kleiner. Garantie gibt es dafür aber keine.

Abschließend muss bemerkt werden, dass das Ensemble-Bild keinerlei Dynamik beinhaltet. Alle überhaupt möglichen Wurfserien der Länge n sind bereits berücksichtigt.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s