Lineare Regression


my image

Für die lineare Regression mit dem CASIO fx-991DE X nehmen wir das Beispiel aus der linearen Regression, die per Hand gerechnet wurde:

Von \(12\) Personen sei die Körpergröße in Zentimeter als unabhängige Variable \(x\) und das Körpergewicht in Kilogramm als abhängige Variable \(y\) gegeben. \(i\) sei die Zählvariable.

i xi yi
1 187 83
2 172 70
3 205 95
4 188 78
5 182 72
6 169 59
7 189 85
8 193 104
9 184 74
10 163 64
11 178 68
12 174 66



Als Diagramm:

my image

Wir verwenden die Statistikfunktion. Zuvor vergewissern wir uns jedoch, dass die Tabellenanzeige richtig eingestellt ist.

Wir gehen dazu in das SETUP-Menu mit \(\color{#C19A6B}{SHIFT}\) \(MENU\)

my image

Mit

my image

bekommen wir

my image


\(3\) auswählen

my image


und \(2\) auswählen. Nun ist die Tabellenanzeige richtig eingestellt.

Anschließend gehen wir in den Statistikbereich unter dem \(MENU\). Wir gehen nach rechts mit den Pfeiltasten

my image

bis

my image

erscheint und bestätigen mit \(=\).

my image


Wir wählen zum Berechnen einer Regressionsgeraden \(2\)

my image

Wir befüllen die Tabelle mit den obigen Tabellenwerten und haben dann folgende Anzeige:

my image

Eine Regressionsgerade ist von der Form

\( y=a + bx \)


Um die Werte \(a\) und \(b\) zu erhalten wählen wir \(OPTN\) \(4\) . Wir erhalten die Anzeige

my image

Gezeichnet erhalten wir nun folgende Regressionsgerade:

my image

Der Korrelationskoeffizient mit \(r = 0{,}87295720629\) spricht dafür, dass sich diese Meßwerte gut als Gerade repräsentieren lassen.


Aber nun das Ganze noch einmal im Detail:

Wie die Werte \(a\), \(b\) und \(r\) per Hand berechnet werden, habe ich im Unterpunkt der Regressionsgeraden ausgeführt. Im Gegensatz dazu verwendet der CASIO fx-991DE X die Bezeichnungen

\( \begin{array}{ r c l } \overline{x^2} - \overline{x}^2 & = & \sigma_x^2\\[6pt] \sqrt{\overline{x^2} - \overline{x}^2} & = & \sigma_x \\[6pt] \overline{y^2} - \overline{y}^2 & = & \sigma_y^2\\[6pt] \sqrt{\overline{y^2} - \overline{y}^2} & = & \sigma_y \\ \end{array} \)


Wir berechnen also \(a\), \(b\) und \(r\) wie folgt:

\( \begin{array}{ r c l } b & = & \dfrac{\overline{xy} - \overline{x} \cdot \overline{y}}{\sigma_x^2} \\[14pt] a & = & \overline{y} - b \cdot \overline{x} \\[10pt] r_{xy} & = & \dfrac{ \overline{xy} - \overline{x} \cdot \overline{y} } { \sigma_x \cdot \sigma_y } \\ \end{array} \)


Um \(a\), \(b\) und \(r_{xy}\) zu ermitteln brauchen wir also die genannten Mittelwerte sowie \(\sigma_x\), \(\sigma_x\), \(\sigma_x^2\) und \(\sigma_y^2\). Diese können wir uns auch anzeigen lassen. Dazu gehen wir erneut auf \(OPTN\) . Wir gelangen wieder zur Tabelle.

my image

Weiter geben wir \(OPTN\) \(3\) ein. Wir erhalten diese Werte:

my image

Weitere Werte sehen wir mit Pfeil unten

my image

my image

und noch einmal Pfeil unten

my image

und noch einmal

my image

Uns interessieren nur folgende Daten:

\( \begin{array}{ r c l } n & = & 12 \\[6pt] \overline{x} & = & 182 \\[6pt] \overline{y} & = & 76{,}5 \\[6pt] \sigma^2 x & = & 122{,}8333333 \\[6pt] \sigma x & = & 11{,}08302005 \\[6pt] \sigma^2 y & = & 160{,}75 \\[6pt] \sigma y & = & 12{,}67872233 \\[6pt] \sum{xy} & = & 168548 \\[6pt] \end{array} \)


Vom letzten Wert ist nur die Summe angegeben. Wir berechnen noch den dazu gehörigen Mittelwert:

\( \begin{array}{ r c c c c c l } \overline{xy} & = & \dfrac{\sum xy}{n } & = & \dfrac{168548}{12} & = & 14045{,}667 \\ \end{array} \)


Damit ergeben sich \(a\), \(b\) und \(r_{xy}\) :

\( \begin{array}{ r c c c c c l } b & = & \dfrac{\overline{xy} - \overline{x} \cdot \overline{y}}{\sigma_x^2} & = & \dfrac{14045{,}67 - 182 \cdot 76{,}5}{122{,}8333333} & = & 0{,}9987 \\[16pt] a & = & \overline{y} - b \cdot \overline{x} & = & 76{,}5 - 0{,}9987 \cdot 182 & = & - 105{,}2634\\ \end{array} \)


\( \begin{array}{ r c l } r_{xy} & = & \dfrac{\overline{xy} - \overline{x} \cdot \overline{y}}{\sigma_x \cdot \sigma_y} & = & \dfrac{14045{,}67 - 182 \cdot 76{,}5}{11{,}08302005 \cdot 12{,}67872233} & = & 0{,}873 \\ \end{array} \)