- Lexikon
- Mathematik Abitur
- 14 Beschreibende und beurteilende Statistik
- 14.2 Beurteilende Statistik
- 14.2.2 Grundprobleme des Testens von Hypothesen
- Hypothesen und Entscheidungsfehler
Beispiel: Ein Elektronikunternehmen stellt multifunktionale Fahrradcomputer her. Aus langjährigen Erfahrungen ist bekannt, dass aufgrund des komplizierten Fertigungsprozesses 30 % der Fahrradcomputer nicht zuverlässig arbeiten. Durch eine verbesserte Fertigungstechnologie will man die Zuverlässigkeit der Fahrradcomputer erhöhen.
Um den Effekt der neuen Technologie zu überprüfen, werden der Produktion über einen längeren Zeitraum Stichproben von jeweils 20 nach verbesserter Technologie gefertigten Fahrradcomputern entnommen. In sämtlichen Stichproben stellt man jeweils höchstens zwei nicht zuverlässig arbeitende Fahrradcomputer fest. Man vermutet deshalb, dass jetzt nur noch 10 % der Fahrradcomputer nicht zuverlässig arbeiten.
Es interessiert, mit welcher Sicherheit aus dem Prüfergebnis (Stichprobenuntersuchungen) tatsächlich auf eine Erhöhung der Zuverlässigkeit der Fahrradcomputer geschlossen werden darf.
Zur mathematischen Veranschaulichung und Untersuchung des Problems soll ein Urnenmodell dienen. Das Erzeugen einer (Zufalls-)Stichprobe ist durch die Urnenmodelle Ziehen mit Zurücklegen bzw. Ziehen ohne Zurücklegen mathematisch beschreibbar.
In einer Urne mögen sich sehr viele, ausschließlich weiße und schwarze Kugeln befinden. Bezogen auf obiges Beispiel sollen die weißen Kugeln die zuverlässig arbeitenden Fahrradcomputer, die schwarzen Kugeln die nicht zuverlässig arbeitenden Fahrradcomputer symbolisieren.
Vom Anteil p der schwarzen Kugeln ist bekannt, dass er entweder 30 % oder 10 % beträgt. Es werden 20 Kugeln als Stichprobe gezogen. Die Anzahl der schwarzen Kugeln unter den gezogenen Kugeln interessiert.
Im vorliegenden Beispiel ist es praktisch unbedeutend, ob die Stichprobe durch Ziehen mit Zurücklegen oder ohne Zurücklegen erzeugt wird: Durch das Ziehen einer (sehr) kleinen Stichprobe aus einer (sehr) großen Grundgesamtheit bleiben die Einzelziehungen im Zufallsexperiment (praktisch) unabhängig voneinander.
Das Zufallsexperiment ist ein BERNOULLI-Experiment; die Zufallsgröße X beschreibe die Anzahl der schwarzen Kugeln unter allen Kugeln in der Urne.
Die Zufallsgröße X kann dann folgendermaßen definiert werden:
Das entsprechende BERNOULLI-Experiment werde n-mal (im Beispiel n = 20) durchgeführt. Weil die einzelnen Ziehungen unabhängig voneinander sind, weisen die zugehörigen Zufallsgrößen dieselbe Wahrscheinlichkeitsverteilung wie die Zufallsgröße X auf.
Jede Stichprobe vom Umfang n (BERNOULLI-Kette der Länge n) kann somit als ein n-Tupel mit für i = 1; 2; …; n aufgefasst werden.
Die obige Stichprobe (Umfang n = 20) ließe sich also beispielsweise durch nachstehende 20-Tupel beschreiben:
(0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0),
(1; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0)
usw.
Entscheidend ist: Unter den 20 gezogenen Kugeln sind in beiden Fällen genau 18 weiße („0“) und zwei schwarze („1“). Da nicht interessiert, an welcher Stelle die schwarzen Kugeln gezogen worden sind, ist die Untersuchung als 20-elementige Menge (mit 18-mal „0“ und zweimal „1“)
{0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0}
für die weitere Analysetätigkeit ausreichend.
Die praktische Fragestellung lässt sich folgendermaßen „übersetzen“:
Aus der Anzahl der schwarzen Kugeln in der Stichprobe soll auf den unbekannten Anteil der schwarzen Kugeln in der Urne geschlossen werden. Dieser Anteil wird durch die (unbekannte) Wahrscheinlichkeit p beschrieben. Ob es möglich ist, eine Qualitätsverbesserung zu schlussfolgern, hängt davon ab, mit welcher Sicherheit (Signifikanz) dieser Anteil unter oder ggf. über dem bisherigen (Ausschuss bzw. ) liegt. Das Signifikanzniveau kann entweder vorgegeben werden oder es ist zu ermitteln.
Unter den gegebenen Voraussetzungen ist die Anzahl der schwarzen Kugeln in der Stichprobe binomialverteilt. Für die unbekannte Wahrscheinlichkeit p, dass bei einmaligem Ziehen aus der Urne eine schwarze Kugel gezogen wird, lassen sich – unter Beachtung der Stichprobe – begründete Vermutungen oder Hypothesen ableiten.
Wegen der Werte der Stichprobe (2 von 20, also ), wäre im vorliegenden Fall eine solche Hypothese. (Übrigens nennt man Hypothesen, die durch genau einen Wert festgelegt sind, einfache Hypothesen – im Unterschied zu Hypothesen der Form , die als zusammengesetzte Hypothesen bezeichnet werden.)
Mit Blick auf den früheren Anteil schwarzer Kugeln () könnte ebenso die Hypothese „“ formuliert werden. Für den vorliegenden konkreten Fall wäre eine Vermutung im Allgemeinen nicht begründet (Widerspruch zu verbesserter Fertigungstechnologie) und würde daher als „normale“ Hypothese ausscheiden.
Nullhypothese und Alternativ- bzw. Gegenhypothese sind einander ausschließende Hypothesen.
(Die üblich gewordene Begriffsbildung „Nullhypothese“ soll verdeutlichen: Die Nullhypothese geht im Allgemeinen davon aus, dass die unbekannte Wahrscheinlichkeitsverteilung [in der Grundgesamtheit] mit der auf der Grundlage der Stichprobe vermuteten Verteilung tatsächlich übereinstimmt; zwischen Vermutung und Tatsache besteht dann „die Differenz null“.)
Auf der Grundlage statistischer Tests wird entschieden, ob die Nullhypothese abzulehnen (zu verwerfen) ist oder nicht. Im Allgemeinen versucht man (aus historisch gewachsenem „Sicherheitsdenken“ heraus), die Nullhypothese abzulehnen. Die Entscheidung, ob eine Hypothese abzulehnen ist, bleibt stets kompliziert, weil auf der Basis einer Stichprobenuntersuchung entschieden wird, während die Hypothese die Verhältnisse in der Grundgesamtheit beschreibt.
Offenbaren die Untersuchungsergebnisse der Stichprobe extreme Abweichungen von der Nullhypothese, so spricht man von einem signifikanten Unterschied zwischen der Nullhypothese und (den Untersuchungsergebnissen) der Stichprobe. Die Nullhypothese ist abzulehnen (zu verwerfen).
Lassen sich hingegen aus der Stichprobe keine signifikanten Abweichungen nachweisen, darf nicht geschlussfolgert werden, dass die Nullhypothese richtig sei. Sie steht lediglich nicht im (offensichtlichen) Widerspruch zu den Untersuchungsergebnissen und kann daher nicht abgelehnt werden.
Die Entscheidung bleibt also stets mit einem gewissen Risiko behaftet. Deshalb ist es wichtig, die Wahrscheinlichkeiten für Fehlentscheidungen zu kennen, sie sinnvoll festzulegen, zu berechnen oder sie abschätzen zu können.
Statistische Tests gestatten das Berechnen der Werte der Zufallsgröße X, für die die Nullhypothese abgelehnt wird. Die Menge dieser Werte aus dem Wertebereich der Zufallsgröße X heißt Ablehnungsbereich (Verwerfungsbereich oder kritischer Bereich). Die Menge der verbliebenen X-Werte bildet den Annahmebereich A.
Zusammenfasssung:
ist in Wirklichkeit | ||
wahr | falsch | |
wird abgelehnt | Entscheidung falsch Fehler 1. Art | Entscheidung richtig |
wird nicht abgelehnt | Entscheidung richtig | Entscheidung falsch |
Stand: 2010
Dieser Text befindet sich in redaktioneller Bearbeitung.
Ein Angebot von