Grundfrage und Grundbegriffe statistischer Erhebungen

  • Definition: Die Menge aller Objekte und Individuen, die zu einem klar gekennzeichneten gemeinsamen Merkmal (oder einer Merkmalsgruppe) gebildet werden können, bzw. die Menge aller Versuche oder Beobachtungen, die unter gleichen Bedingungen ablaufen, bezeichnet man als Grundgesamtheit (bei Individuen auch als Population) der betreffenden statistischen Erhebung.

Beispiele für solche Grundgesamtheiten wären etwa folgende:

  1. die Menge G 1 aller Schüler der Klasse 8 einer bestimmten Schule;
  2. die Menge G 2 G 1 aller Mädchen der betreffenden Klasse;
  3. die Menge G 3 aller Körpergrößen der Mädchen aus G 1 ;
  4. die Menge G 4 der Noten, die von den einzelnen Schülern aus G 1 bei der letzten Mathearbeit erzielt wurden

Die bei der Untersuchung der Grundgesamtheit gewonnenen Ergebnisse werden Merkmalsausprägungen (Merkmalswerte, Daten) genannt.

Erhält man die Ergebnisse durch Auszählen oder Messen, so handelt es sich um ein quantitatives Merkmal; lassen sich die Ergebnisse lediglich bezüglich ihrer Art erfassen und beschreiben, so liegt ein qualitatives Merkmal vor.

Die Menge G 3 wurde so auf der Grundlage des quantitativen Merkmals „Körpergröße“ gebildet, das in diesem Falle speziell ein stetiges quantitatives Merkmal ist, da das Merkmal innerhalb eines bestimmten Intervalls jeden beliebigen Wert (natürlich unter Berücksichtigung der Messgenauigkeit) annahmen kann. Die Ausprägung eines diskreten quantitativen Merkmals wäre demgegenüber z. B. durch Zählen festzustellen (Einschätzung des Beliebtheitsgrades von Fernsehsendungen anhand der Einschaltzahlen, Einwohnerzahlen von Städten).

Bestimmend für die Bildung von G 2 war das qualitative Merkmal „Geschlecht“. Speziell handelt es sich hier um ein qualitativ-nominales (nominalskaliertes) Merkmal, das sich lediglich auf Gleichheit oder Verschiedenheit von Ausprägungen gründet.

Qualitativ-ordinale (ordinalskalierte) Merkmale lassen sich auf der Basis einer Höher-Tiefer-Relation (z.B. militärische Dienstgrade) oder einer Größer-Kleiner-Relation (z.B. Windstärken von „still“ und „leichte Brise“ bis „Orkan“, Konfektionsgrößen S, M, L, XL) beschreiben.

Schreibt man die Untersuchungsergebnisse in der Reihenfolge ihrer Ermittlung (ansonsten aber ungeordnet) auf, so erhält man eine Urliste. Diese Urliste kann nun für die spätere Verwendung weiter aufbereitet werden, indem man die Daten durch einen Strichliste sortiert und daran tabellarisch oder grafische Darstellungen anschließt.

Die Strichliste gibt die Anzahl der Mess- oder Beobachtungswerte an, mit der jede Merkmalsausprägung in der Grundgesamtheit oder einer Stichprobe hieraus auftritt.

  • Definition: Eine aus einer Grundgesamtheit (im Allgemeinen zufällig – auf „gut Glück“) ausgewählte endliche Teilmenge heißt Stichprobe.
    Eine Stichprobe gilt als repräsentativ, wenn sie annähernd so wie die Grundgesamtheit zusammengesetzt ist (also die für die Untersuchung wesentlichen Merkmale der Grundgesamtheit möglichst genau widerspiegelt) und wenn der Stichprobenumfang n hinreichend groß ist.

Um verschiedene Messreihen zum gleichen Merkmal auch bei unterschiedlicher Anzahl von Messwerten gut miteinander vergleichen zu können, wird die sich auf der absoluten Häufigkeit des Auftretens einer Merkmalsausprägung gründende relative Häufigkeit verwendet.

  • Definition: Als absolute Häufigkeit H n ( { a k } ) einer Merkmalsausprägung a k bezeichnet man die Anzahl der Mess- oder Beobachtungswerte, in der diese Merkmalsausprägung innerhalb der Grundgesamtheit bzw. der jeweiligen Stichprobe vom Umfang n auftritt.
     
  • Definition: Als relative Häufigkeit h n ( { a k } ) einer Merkmalsausprägung a k bezeichnet man den Quotienten H n ( { a k } ) n aus der absoluten Häufigkeit H n ( { a k } ) und dem Umfang n der Grundgesamtheit bzw. der jeweiligen Stichprobe:
    h n ( { a k } ) = H n ( { a k } ) n

Beispiel: In einem Betrieb wird die Maßhaltigkeit der an einer bestimmten Maschine von ein und derselben Person hergestellten Bauteile anhand von n = 50 zufällig ausgewählten Exemplaren untersucht und dabei die Abweichungen b k (in μ m ) von einem bestimmten Nennwert ermittelt.

Man erhält folgende Urliste:

k1234567891011121314151617
b k 2440894781183592210
k1819202122232425262728
b k 3247641871111
k2930313233343536373839
b k 836241156791
k4041424344454647484950
b k 0311052115246

Aus dieser Urliste ist ersichtlich, dass die Abweichungswerte im Bereich von 0 bis 11 lagen. Es ergibt sich folgende Liste der absoluten Häufigkeiten H 50 ( { b k } ) :

b k 01234567891011
H 50 ( { b k } ) 327474535316

Daraus ergeben sich als relative Häufigkeiten (die Summe der relativen Häufigkeiten in der zweiten Zeile ist gleich 1):

b k 012345
h 50 { b k } 0,060,040,140,080,140,08
b k 67891011
h 50 { b k } 0,100,060,100,060,020,12

Die absolute Häufigkeit der einzelnen Merkmalsausprägungen ist sehr gering. Günstig ist es daher, durch Klassenbildung eine Verdichtung vorzunehmen. Wenn möglich, werden dabei meist Klassen gleicher Breite genutzt.

Für jede Klasseneinteilung muss außerdem gelten:

  1. Die Vereinigungsmenge K 1 K 2 K 3 ... K m a l l e r K l a s s e n K i ( i = 1, 2, ..., m ) enthält alle Elemente der Urliste.
  2. Je zwei beliebiger Klassen sind elementfremd ( K i K j = , i j ) , d. h., jede Merkmalsausprägung gehört in genau eine Klasse.

Wir wählen die Klassenbreite 2. Dann ergibt sich (die relativen Häufigkeiten sind in Klammern angegeben):

K i 0 b k 2 3 b k 5 6 b k 8 9 b k 11
H n ( { K i } ) 12 (0,24)15 (0,30)13 (0,26)10 (0,10)

Bei Verwendung einer solchen Klasseneinteilung gehen gegenüber der detaillierten Auflistung zwar Informationen verloren, aber das Wesentliche der Verteilung der Beobachtungswerte wird oft besser sichtbar. Man muss von Fall zu Fall entscheiden, welchem der Aspekte im jeweiligen Zusammenhang der Vorrang gebührt.

Stand: 2010
Dieser Text befindet sich in redaktioneller Bearbeitung.

Lexikon Share
Lernprobleme in Mathe?
 

Mit deinem persönlichen Nachhilfe-Tutor Kim & Duden Learnattack checkst du alles. Jetzt 30 Tage risikofrei testen.

  • KI-Tutor Kim hilft bei allen schulischen Problemen
  • Individuelle, kindgerechte Förderung in Dialogform
  • Lernplattform für 9 Fächer ab der 4. Klasse
  • Über 40.000 Erklärvideos, Übungen & Klassenarbeiten
  • Rund um die Uhr für dich da

Einloggen