Stochastik

my image

Inhaltsverzeichnis




Aufgaben


Alle in Ihren Lösungen verwendeten Zufallsgrößen müssen explizit eingeführt werden. Machen Sie auch Angaben über die Verteilung der jeweiligen Zufallsgrößen.

Eine Firma stellt Flachbildschirme her. Im Mittel ist einer von fünf hergestellten Bildschirmen fehlerhaft.



Binomialverteilung

Es soll angenommen werden, dass die Anzahl fehlerhafter Geräte unter zufällig ausgewählten Bildschirmen durch eine binomialverteilte Zufallsgröße beschrieben werden kann. Berechnen Sie die Wahrscheinlichkeit der folgenden Ereignisse:

A : Von 50 zufällig ausgewählten Bildschirmen sind höchstens 8 fehlerhaft.

B : Von 200 zufällig ausgewählten Bildschirmen sind mehr als 15% und weniger als 25% fehlerhaft.

C : Von 10 zufällig ausgewählten Bildschirmen sind genauso viele fehlerhaft, wie zu erwarten ist.

(8 P)





Fragen zur Vierfeldertafel

Fehler der Bildschirme treten am häufigsten in Form eines defekten Displays sowie in Form eines defekten Netzteils auf. Für einen zufällig ausgewählten Bildschirm beträgt die Wahrscheinlichkeit dafür, dass

  • das Display defekt ist 10,7%
  • das Display und das Netzteil defekt sind 1%
  • weder das Display noch das Netzteil defekt ist 87,3%


  1. Stellen Sie den Sachverhalt in einer vollständig ausgefüllten Vierfeldertafel dar.

    (4 P)


  1. Berechnen Sie die Wahrscheinlichkeit dafür, das entweder das Display oder das Netzteil defekt ist.

    (2 P)


  1. Berechnen Sie die Wahrscheinlichkeit dafür, das ein Bildschirm mit einem defekten Netzteil ein nicht-defektes Display hat.

    (2 P)


  1. Untersuchen Sie, ob die beiden betrachteten Defekte unabhängig voneinander auftreten.

    (3 P)






Hypothesentest und Konfidenzintervall

Ein Mitarbeiter der Firma bezweifelt, dass im Mittel einer von fünf Bildschirmen fehlerhaft ist. Um einen Schätzwert für den Anteil fehlerhafter Geräte zu ermitteln, zieht er eine Stichprobe vom Umfang 180 zu Hilfe. in der Stichprobe sind 27 Bildschirme fehlerhaft.

  1. Zeigen Sie, dass der Mitarbeiter bei diesem Testergebnis die Hypothese Im Mittel ist einer von fünf Bildschirmen fehlerhaft auf einem Signifikanzniveau von 5% nicht verwerfen kann. Entscheiden Sie, ob die Zweifel des Mitarbeiters damit ausgeräumt sind.


Bei hinreichend großem Stichprobenumfang n kann aus der relativen Häufigkeit h, die sich bei der Durchführung des Tests ergibt, die Obergrenze \(p_{max}\) bzw. Untergrenze \(p_{min}\) des 95%-Konfidenzintervalls folgendermaßen näherungsweise berechnet werden:

\( p_{max} \approx h + 1.96 \cdot \sqrt{\frac{h \cdot (1 - h)}{n}} \qquad ; \qquad p_{min} \approx h - 1.96 \cdot \sqrt{\frac{h \cdot (1 - h)}{n}} \)


  1. bestimmen Sie damit das zu dem Testergebnis 27 gehörende 95%-Konfidenzintervall.

    (3 P)


  1. Zeigen Sie mit Hilfe der oben genannten Näherungsformeln allgemein, dass sich die Länge eines 95%-Konfidenzintervalls bei Verdopplung des Stichprobenumfangs \(n\) und gleicher relativer Häufigkeit \(h\) verkleinert, aber nicht halbiert.

    (4 P)





fehlerhafte Einstufung

Tatsächlich sind 20% aller Bildschirme fehlerhaft.

Bei einer abschließenden Prüfung werden alle fehlerfreien Bildschirme auch als fehlerfrei eingestuft. Die Wahrscheinlichkeit dafür, dass ein Bildschirm als fehlerfrei eingestuft wird, wird mit \(x\) bezeichnet. Ein im Rahmen der Prüfung als fehlerfrei eingestufter Bildschirm wird zufällig ausgewählt.

Bestimmen Sie den kleinstmöglichen Wert von \(x\), für den die Wahrscheinlichkeit dafür, dass dieser Bildschirm fehlerhaft ist, höchstens 5% beträgt.

(5 P)




Aufgaben zum Ausdrucken





Lösungen

Lösung : Binomialverteilung

Wir berechnen die Binomialverteilung mit

\( P(x=k) = \begin{smallmatrix} \left( \begin{array}{c} n \\ k \end{array} \right) \end{smallmatrix} p^k \cdot (1-p)^{n-k} \)

my image



und berechnen die kumulierte (aufsummierte) Binomialverteilung mit

\( P(x\leq k) = \displaystyle{\sum_{i=1}^k} \begin{smallmatrix} \left( \begin{array}{c} n \\ i \end{array} \right) \end{smallmatrix} p^i \cdot (1-p)^{n-i}. \)

my image



Wir benötigen also \(n\), \(p\) und \(k\), wobei \(p=0{,}2\) ist.

Bei "A" haben wir \(n=50\) und \(k=8\). Der Taschenrechner bietet für die Binomialverteilung die ''Binomial-Dichte'' oder auch ''Binom PD bzw. Binomial PDF'' je nach Ausführung des Taschenrechner an. Wir erhalten (in der alten Notation)

\( P_{50 ; 0{,}2}(x=8) = 0{,}1169 = 11{,}69 \% \)

Bei "B" haben wir \(n=200\). 15\% davon sind

\( 200 \cdot 0{,}15 = 30 \)

und 25% davon sind

\( 200 \cdot 0{,}25 = 50 \)

Mit \(30<k<50\) also den Werte von 31 bis 49, ziehen wir von den Werten bis 49 alle die Werte ab, die zu viel sind, also alle Werte bis 30. Dazu benutzen wir im Taschenrechner die ''kumulierte Binomialverteilung'' oder ''Binom CD bzw. Binomial CDF''.

\( \begin{align} P_{50 ; 0{,}2}(30<x<50) & = P_{50 ; 0{,}2} (x\leq 49) - P_{50 ; 0{,}2} (x\leq 30) \\[8pt] P_{50 ; 0{,}2}(30<x<50) & = 0{,}9506 - 0{,}043 \\[8pt] P_{50 ; 0{,}2}(30<x<50) & = 0{,}9076 \\[8pt] P_{50 ; 0{,}2}(30<x<50) & = 90{,}76 \% \end{align} \)

Bei "C" brauchen wir den Erwartungswert mit \(n=10\).

\( \mu = n \cdot p = 10 \cdot 0{,}2 = 2 \)

my image

und berechnen

\( P_{10;0.2}(x=2) = 0{,}302 = 30{,}2 \% \)








Lösung : Fragen zur Vierfeldertafel

Aufgabe 1 - Vierfeldertafel

Wir definieren folgende Ereignisse:

\(D\) : Bildschirme mit defektem Display

\(\overline{D}\) : Bildschirme ohne defektem Display

\(N\) : Bildschirme mit defektem Netzteil

\(\overline{N}\) : Bildschirme ohne defektem Netzteil

my image




Aufgabe 2 - Display oder Netzteil

Hier wird ausgeschlossen, dass beide Teile gleichzeitig defekt sind und wir rechnen

\( P(D) \cap P(\overline{N}) + P(\overline{D}) \cap P(N)= 0{,}097 + 0{,}02 = 0{,}117 = 11{,}7 \% \)








Aufgabe 3 - bedingte Wahrscheinlichkeit


\( \begin{align} P_N(\overline{D}) & = \tfrac{ P(N) \cap P(\overline{D})}{P(N)} \\[7pt] P_N(\overline{D}) & = \tfrac{0{,}02}{0{,}03} \\[7pt] P_N(\overline{D}) & = \tfrac{2}{3} \\[7pt] P_N(\overline{D}) & = 0{,}6667 \\[7pt] P_N(\overline{D}) & = 66{,}67 \% \end{align} \)







Aufgabe 4 - stochastische Unabhängigkeit

Sind zwei Ereignisse \(A\) und \(B\) stochastisch unabhängig voneinander, so muss gelten

\( P( A \cap B) = P(A) \cdot P(B) \)

Wir prüfen dies für alle Schnittmengen.

\( \begin{align} P(D) \cdot P(N) & = 0{,}107 \cdot 0{,}03 = 0{,}0032 \not= 0{,}01 = P(D \cap N) \\[8pt] P(D) \cdot P(\overline{N}) & = 0{,}107 \cdot 0{,}97 = 0{,}1038 \not= 0{,}097 = P(D \cap \overline{N}) \\[8pt] P(\overline{D}) \cdot P(N) & = 0{,}893 \cdot 0{,}03 = 0{,}0268 \not= 0{,}02 = P(\overline{D} \cap N) \\[8pt] P(\overline{D}) \cdot P(\overline{N}) & = 0{,}893 \cdot 0{,}97 = 0{,}8662 \not= 0{,}873 = P(\overline{D} \cap \overline{N}) \end{align} \)

Teilweise liegen die Ergebnisse nahe bei den Wahrscheinlichkeiten der Schnittmengen. Insgesamt lässt sich aber keine Abhängigkeit der beiden Defekte voneinander feststellen.







 



Lösung : Hypothesentest und Konfidenzintervall

Aufgabe 1 - zweiseitiger Hypothesentest

\(x\) beschreibt die Anzahl der defekten Bildschirme und ist binomialverteilt mit \(n=180\)

Wir wollen die Behauptung des Mitarbeiters \(p\not=0{,}2\) widerlegen und formulieren

\(h_1\): \(p\not=0{,}2\) als zu beweisende Hypothese
\(h_0\): \(p=0{,}2\) als Nullhypothese, mit der wir arbeiten

Für den Annahmebereich gilt

\( k<a \quad und \quad k>b \)

my image

Um zu zeigen, dass die Behauptung des Mitarbeiters mit der Hypothese \(h_1\) falsch ist, müssen wir sicher sein, dass die Nullhypothese in den angegebenen Bereichen nicht gilt und berechnen \(a\) und \(b\) mit

\( \begin{align} a & = \mu-1{,}96 \cdot \sigma \\[6pt] b & = \mu+1{,}96 \cdot \sigma \end{align} \)

Wir erhalten mit

\( \mu = n \cdot p = 180 \cdot 0{,}2 = 36 \)

und

\( \sigma = \sqrt{n \cdot p \cdot (1-p)} = \sqrt{180 \cdot 0{,}2 \cdot 0{,}8} = \sqrt{28{,}8} \approx 5{,}3666 \)

sowie die Werte

\( a = 36-1{,}96 \cdot \sqrt{28{,}8} = 25{,}4815 \)

und

\( b = 36 +1{,}96 \cdot \sqrt{28{,}8} = 46{,}5185 \)

Die Nullhypothese gilt also nicht für \(k<26\) und \(k>46\). Damit kommen wir zu der

Entscheidungsregel:
Haben wir in einer Stichprobe weniger als 26 oder mehr als 46 defekte Bildschirme, so kann die Annahme, dass \(p\not=0{,}2\) gestützt werden.

Bei unserer Stichprobe mit \(k=27\) liegt die Anzahl der defekten Bildschirme aber nicht in den beiden Bereichen. Also muss \(p\not=0{,}2\) verworfen werden. Es sind also tatsächlich 20% der Bildschirme defekt.








Aufgabe 2 - Konfidenzintervall

Wie hier zu sehen ist, liegt 27 gerade noch in der 95%-igen \(\sigma\)-Umgebung sowohl für \(p_{min}\) als auch für \(p_{max}\). Diesen Bereich der Wahrscheinlichkeiten nennt man Konfidenzintervall.

my image

Je größer \(p\) ist, desto weiter rechts verläuft die Kurve. Wir berechnen \(p_{min}\) und \(p_{max}\) mit den angegebenen Formeln. Dabei ist \(n=180\) und \(h\) die relative Häufigkeit mit

\( h = \frac{k}{n} = \frac{27}{180} = 0{,}15 \)

Die Wahrscheinlichkeiten ergeben

\( \begin{align} p_{min} & = 0{,}15 - 1{,}96 \cdot \sqrt{\tfrac{0{,}15 \cdot (1 - 0{,}15)}{180}} \\[6pt] p_{min} & = 0{,}0978 = 9{,}78 \% \end{align} \)

und

\( \begin{align} p_{max} & = 0{,}15 + 1{,}96 \cdot \sqrt{\tfrac{0{,}15 \cdot (1 - 0{,}15)}{180}} \\[6pt] p_{max} & = 0{,}2022 = 20{,}22 \% \end{align} \)

Das 95%-ige Konfidenzintervall lautet [0,0978 ; 0,2022].







Aufgabe 3 - Länge des Konfidenzintervalls

Die Länge des Konfidenzintervalls lässt sich berechnen mit

\( \begin{align} p_{max} - p_{min} & = h + 1{,}96 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} - \left(h - 1{,}96 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} \right) \\[8pt] p_{max} - p_{min} & = h + 1{,}96 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} - h + 1{,}96 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} \\[8pt] p_{max} - p_{min} & = 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} \end{align} \)


Ersetzen wir nun \(n\) durch \(2n\), so erhalten wir

\( \begin{align} 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{2n}} &= 3{,}92 \cdot \tfrac{ \sqrt{h \cdot (1 - h)}}{\sqrt{2n}} \\[10pt] 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{2n}} &= 3{,}92 \cdot \tfrac{\sqrt{h \cdot (1 - h)}}{\sqrt{2} \cdot \sqrt{n}} \\[10pt] 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{2n}} &= \tfrac{3{,}92}{\sqrt{2}} \cdot \tfrac{\sqrt{h \cdot (1 - h)}}{\sqrt{n}} \\[10pt] 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{2n}} &= 2{,}772 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} \\[10pt] 3{,}92 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{2n}} &< p_{max} - p_{min} \end{align} \)


Ferner ist

\( 2{,}772 \cdot \sqrt{\tfrac{h \cdot (1 - h)}{n}} \not= \frac{3{,}92 }{2} \cdot \sqrt{\frac{h \cdot (1 - h)}{n}} = \frac{p_{max} - p_{min} }{2} \)







 



Lösung : Fehlerhafte Einstufung

\(F\) : fehlerfreier Bildschirm

\(\overline{F}\) : fehlerhafter Bildschirm

\(E\) : als fehlerfrei eingestufter Bildschirm

\(\overline{E}\) : als fehlerhaft eingestufter Bildschirm


Um sich den Sachverhalt erst einmal klar zu machen, zeichnen wir das Ganze in einem Baumdiagramm auf. Alle fehlerfreien Bildschirme werden auch als fehlerfrei eingestuft. Also ist \(P_F(E)=1\). Daraus ergeben sich die restlichen Werte des oberen Teils des Baumes.

my image

Nun wird aus den als fehlerfrei eingestuften Bildschirmen einer ausgewählt. Wir fahren also fort mit einem Baum, der mit den Einstufungen beginnt.

Die Wahrscheinlichkeiten für die Schnittmengen am Ende der Pfade sind in beiden Baumdiagrammen jeweils gleich.

\( \begin{align} P(F) \cap P(E) & = 0{,}8 = P(E) \cap P(F) \\[6pt] P(F) \cap P(\overline{E}) & = 0 = P(\overline{E}) \cap P(F) \end{align} \)

my image

Weiter gilt, dass ein Bildschirm von den als fehlerfrei eingestuften Bildschirm zu maximal 5% fehlerhaft ist. Damit wir einen geringstmöglichen Wert für \(x\) erhalten, müssen wir auch mit den vollen 5% arbeiten. Es ist also

\( P_E(\overline{F}) =0{,}05\\ \)

Daraus folgt

\( P_E(F) = 1-0.05 = 0{,}95\\ \)

Weiter ergibt sich

\( \begin{align} P(E) \cdot 0{,}95 & = 0{,}8 \bigl| \; : 0{,}95 \\[6pt] P(E) & = 0{,}8421 \\[6pt] x & = 0{,}8421 \\[6pt] x & = 84{,}21 \% \end{align} \)