Varianz und Standardabweichung


my image

Inhaltsverzeichnis





Durchschnitt

In folgender Urliste habe wir die Ergebnisse einer Klausur:

Urliste = \(\{4, 3, 5, 3, 2, 4, 3, 4, 4, 6, 4, 5, 3, 3, 3, 2, 5, 4, 4, 4\}\)

Die Verteilung ist hier in einem Diagramm dargestellt:

my image

 
Als geordnete Tabelle sieht es also wie folgt aus:

lfd Nr. [ i ] Note [ xi ] Häufigkeit [ h(xi) ]
1 1 0
2 2 2
3 3 6
4 4 8
5 5 3
6 6 1



Wie kann diese Verteilung nun beurteilt werden?

Ein erstes Kriterium ist die Durchschnittsnote, also das arithmetische Mittel \(\overline{x}\). Üblich ist auch die Bezeichnung Erwartungswert E(x) oder auch \(\mu\). Im Folgenden verwenden wir \(\mu\).




Auf einfache Weise können wir das über die Tabelle berechnen.

i xi h(xi) xi · h(xi)
1 1 0 0
2 2 2 4
3 3 6 18
4 4 8 32
5 5 3 15
6 6 1 6
Summe 20 75



Nun brauchen wir nur noch Folgendes rechnen:



Das arithmetische Mittel hat diese Lage.

my image


Die erzielten Noten verteilen sich gleichmäßig um diese Linie, so dass sie als das repräsentative Ergebnis der Klausur gewertet werden kann.

Nun stellt sich die Frage, ob die Durchschnittsnote den Ausgang der Klausur hinreichend beschreibt.




Streuung

Es ist vorstellbar, dass es Verteilungen gibt, die genau die gleiche Durchschnittsnote aufweisen, jedoch von der Verteilung ganz anders geartet sind, also dichter am Mittelwert liegen oder weiter weg davon. Deshalb wird als weiteres Charakteristikum die Streuung betrachtet.

my image


Die Streuung berechnen wir mit der Differenz der jeweils erzielter Note und der Durchschnittsnote.



Dabei müssen wir aber auch die Häufigkeiten berücksichtigen mit



Es folgt

i xi h(xi) xi · h(xi) xi - \(\mu\) (xi - \(\mu\)) · h(xi)
1 1 0 0 -2,75 0
2 2 2 4 -1,75 -3,5
3 3 6 18 -0,75 -4,5
4 4 8 32 0,25 2
5 5 3 15 1,25 3,75
6 6 1 6 2,25 2,25
Summe 20 75 0



Wenn wir alle Abstände addieren bekommen wir Null heraus. Dann wäre auch der Mittelwert der Abweichungen von der Durchschnittsnote Null.

Um nun einen realistischen Wert für die durchschnittliche Abweichung zu bekommen, müssten die Abweichungen alle positiv sein. Das können wir erreichen, indem wir die Abweichungen alle quadrieren.

my image


Beachte:
Durch das Quadrieren werden kleine Abweichungen noch kleiner und große Abweichungen größer.


Varianz

Wir bekommen

i xi h(xi) xi · h(xi) xi - \(\mu\) (xi - \(\mu\)) · h(xi) (xi - \(\mu\))2 · h(xi)
1 1 0 0 -2,75 0 0
2 2 2 4 -1,75 -3,5 6,125
3 3 6 18 -0,75 -4,5 3,375
4 4 8 32 0,25 2 0,5
5 5 3 15 1,25 3,75 4,6875
6 6 1 6 2,25 2,25 5,0625
Summe 20 75 0 19,75



als Summe der quadrierten Abweichungen \(19{,}75\). Den Mittelwert der quadrierten Abweichungen nennt man die Varianz. Diese wird nun berechnet mit



Für die Varianz gilt also



Ersetzen wir nun die relative Häufigkeit \(\frac{h(x_i)}{n}\) durch die Wahrscheinlichkeit \(P(x_i)\), so erhalten wir die allgemeine Formel:



Standardabweichung

Nehmen wir nun die Quadrierung wieder heraus, so erhalten wir die Standardabweichung.



Das durchschnittliche Klausurnote lautet also \(3{,}75 \pm 0{,}99\) .


Hier gilt allgemein:



Hinweis: Diese Art von Tabellenauswertungen mit der Varianz und Standardabweichung können wir mit der Statistikfunktion des Taschenrechners auf einfache Weise anzeigen lassen.



Varianz und Standardabweichung in der Binomialverteilung

In der Binomialverteilung gilt stets, dass die Wahrscheinlichkeiten einzelner Ereignisse jeweils gleich sind. Beispielsweise ist bei einem Münzwurf das Ereignis Zahl immer 50%, sofern die Münze nicht verbeult ist oder sonst wie verändert wurde. Das vereinfacht die Berechnung der Streuungsmaße erheblich.