Drei-Sigma-Regel

  • Satz: Die Wahrscheinlichkeit, dass eine endliche Zufallsgröße X mit dem Erwartungswert E X = μ und der Streuung D 2 X = σ 2
    – Werte im 2 σ - I n t e r v a l l ] μ 2 σ ; μ + 2 σ [ annimmt, beträgt mindestens 0,75;
    – Werte im 3 σ - I n t e r v a l l ] μ 3 σ ; μ + 3 σ [ annimmt, mindestens 0, 8 ¯ .

Wir betrachten ein Beispiel.

  • Beispiel: Mit welcher Wahrscheinlichkeit weicht die Zufallsgröße X um mehr als 2DX von EX ab?

In einer ersten Stufe der Bearbeitung des Beispiels setzen wir nur die Kenntnis von EX und D 2 X voraus. Der Vorteil der σ - Re g e l besteht darin, dass sie auch dann angewendet werden kann, wenn man die Wahrscheinlichkeitsverteilung der Zufallsgröße X nicht kennt, sondern nur ihren Erwartungswert EX und ihre Streuung D 2 X .

Es sei E X = 0,125 und D 2 X = 1,609375 . Nach der 3 σ - Re g e l erhält man:
P ( | X E X | 2 D X ) 0,25

Das heißt: Mit einer Wahrscheinlichkeit von höchstens 0,25 weicht die Zufallsgröße X um mehr als 2DX von EX ab.

In einer zweiten Stufe setzen wir zusätzlich die Kenntnis der Wahrscheinlichkeitsverteilung der Zufallsgröße X voraus. Es sei X ( 2 0 3 0,125 0,750 0,125 ) .

Wie man sich überzeugen kann, hat X die oben angegebenen Werte für den Erwartungswert und die Streuung. Jetzt ist es möglich, die gesuchte Wahrscheinlichkeit direkt zu berechnen:
P ( | X E X | 2 D X ) = P ( | X 0,125 | 2 1,609375 ) = 1 P ( | X 0,125 | < 2 1,609375 ) = 1 P ( 2 1,609375 + 0,125 < X < 2 1,609375 + 0,125 ) = 1 P ( X = 2 ) P ( X = 0 ) = 1 0,125 0,750 = 0,125

Die Zufallsgröße X weicht also mit einer Wahrscheinlichkeit von 0,125 um mehr als 2DX von EX ab.

Das Beispiel zeigt, dass die auf der 3 σ - Re g e l beruhenden Abschätzungen relativ grob sind. Dies schränkt die Möglichkeiten einer praktischen Nutzung der Regel ein. Trotzdem ist sie nicht ohne praktische Relevanz.

Wir betrachten im Folgenden ein Anwendungsbeispiel.

  • Beispiel: Lars Spielmann besitzt noch einen alten, abgenutzten und lädierten Würfel, dessen Beschriftung mit den Zahlen 1 bis 6 teilweise nur noch schwer zu erkennen ist. Trotzdem hängt er an diesem Würfel. Er möchte deshalb gern wissen, ob er ihn noch benutzen kann, wenn das betreffende Würfeln fair ablaufen soll.

Dazu würfelt er 1000-mal mit diesem Würfel und registriert die absoluten Häufigkeiten für die einzelnen Zahlen. Als relative Häufigkeiten erhält er dann die in der folgenden Tabelle enthaltenen Werte

k123456
h 1000 ( { k } ) 0,1530,2710,1740,1630,0800,159

Da Lars Spielmann fair würfeln möchte, muss er von der Annahme ausgehen, dass alle Zahlen gleichwahrscheinlich auftreten, und zwar mit dem Erwartungswert
μ = E ( h 1000 ( { 2 } ) ) = P ( { 2 } ) = 0,1 6 ¯

und der Standardabweichung
σ = D 2 ( h 1000 ( { 2 } ) ) = 1 1000 ( 1 6 1 36 ) 0,0118.

Das zugehörige 3 σ - I n t e r v a l l ist ] μ 3 σ ; μ + 3 σ [ = ] 0,131... ; 0,202... [ .

Da die relativen Häufigkeiten für die Würfelzahlen 2 und 5 außerhalb des 3 σ - I n t e r v a l l s liegen, wird sich Lars Spielmann wohl von diesem Würfel trennen müssen, denn die angenommene Gleichwahrscheinlichkeit der Augenzahlen kann mit einer Fehlerwahrscheinlichkeit von höchstens 0, 1 ¯ verworfen werden.

Eigene Würfelergebnisse kann man mit dem „gezinkten Taschenrechnerwürfel interaktiv gewinnen.

Programm zur Simulation des Werfens eines gezinkten Würfels mit der Verteilungsmatris mat

Programm zur Simulation des Werfens eines gezinkten Würfels mit der Verteilungsmatris mat

So ist es z.B. möglich, zu untersuchen,

  1. wie stark man den Würfel „zinken“ muss, um bei festen n relative Häufigkeiten zu bekommen, die außerhalb des 3 σ - I n t e r v a l l liegen, oder
  2. wie oft man einen speziell „gezinkten“ Würfel werfen muss, um relative Häufigkeiten zu erhalten, die außerhalb des 3 σ - I n t e r v a l l liegen.

Zur Demonstration wird die „Zinkung“
( 1 2 3 4 5 6 0,15 0,31 0,17 0,16 0,07 0,14 )
gewählt.

Mithilfe des Programms simgezw(mat,n,x) erhält man z.B. die folgenden Simulationsergebnisse:

n 3 σ - I n t e r v a l l

Bild

1 ] 0,951... ; 1,28... [
5 ] 0, 3 ¯ ; 0, 6 ¯ [
10 ] 0,186... ; 0,520... [
100 ] 0,0548... ; 0,278... [
200 ] 0,0876... ; 0,245... [

Vergleicht man die relativen Häufigkeiten mit dem jeweiligen 3 σ - I n t e r v a l l , so sieht man, dass bei dieser Simulation die relativen Häufigkeiten erstmals für n = 100 außerhalb des 3 σ - I n t e r v a l l s liegen.

Bei einer N ( 0 ; 1 ) -verteilten Zufallsgröße X mit μ = 0 und σ = 1 verschärft sich die Aussage der 3 σ - Re g e l zu
P ( X [ 3 ; 3 ] ) = 3 3 ϕ ( x ) d x > 0,99
(wobei ϕ die Dichtefunktion von X ist).

Unter Beachtung der Symmetrie der Glockenkurve gilt:
3 ϕ ( x ) d x < 1 2 ( 1 0,99 ) = 0,005.

Bild

Somit begeht man beim Berechnen von
Φ ( a ) = a ϕ ( x ) d x
auf zwei Dezimalen gerundet keinen Fehler, wenn dabei die untere Integrationsgrenze durch 3 ersetzt wird, was einen beträchtlichen Zeitgewinn bei der Nutzung des TI-92 bedeutet.

Stand: 2010
Dieser Text befindet sich in redaktioneller Bearbeitung.

Lexikon Share
Lernprobleme in Mathe?
 

Mit deinem persönlichen Nachhilfe-Tutor Kim & Duden Learnattack checkst du alles. Jetzt 30 Tage risikofrei testen.

  • KI-Tutor Kim hilft bei allen schulischen Problemen
  • Individuelle, kindgerechte Förderung in Dialogform
  • Lernplattform für 9 Fächer ab der 4. Klasse
  • Über 40.000 Erklärvideos, Übungen & Klassenarbeiten
  • Rund um die Uhr für dich da

Einloggen