Grundidee der Schätzung
In der Praxis kennt man den wahren Anteilswert \(p\) einer Grundgesamtheit oft nicht. Man entnimmt eine Stichprobe vom Umfang \(n\) und berechnet die relative Häufigkeit \(\hat{p} = \frac{k}{n}\) als Schätzwert für \(p\).
Problem: Der Schätzwert \(\hat{p}\) aus einer Stichprobe wird fast nie genau den wahren Wert \(p\) treffen. Ein Konfidenzintervall gibt an, wie genau die Schätzung ist.
Bei einer Umfrage werden 400 Personen befragt. 152 stimmen zu.
\(\hat{p} = \frac{152}{400} = 0{,}38\)
Aber wie nahe liegt \(\hat{p} = 0{,}38\) am wahren Anteil \(p\)?
Konfidenzintervall für den Anteilswert
Für großes \(n\) ist die Zufallsvariable \(\hat{p}\) annähernd normalverteilt. Das Konfidenzintervall zum Konfidenzniveau \(1 - \alpha\) lautet:
\(z_{1-\frac{\alpha}{2}}\) ist das Quantil der Standardnormalverteilung.
Die wichtigsten z-Werte sind:
| Konfidenzniveau | \(\alpha\) | \(z_{1-\frac{\alpha}{2}}\) |
|---|---|---|
| 90 % | 0,10 | 1,645 |
| 95 % | 0,05 | 1,960 |
| 99 % | 0,01 | 2,576 |
Umfrage mit \(n = 400\), \(\hat{p} = 0{,}38\), Konfidenzniveau 95 %:
\(\text{Fehlerspanne} = 1{,}96 \cdot \sqrt{\frac{0{,}38 \cdot 0{,}62}{400}} = 1{,}96 \cdot 0{,}0243 \approx 0{,}048\)
Konfidenzintervall: \([0{,}38 - 0{,}048;\; 0{,}38 + 0{,}048] = [0{,}332;\; 0{,}428]\)
Interpretation: Mit 95 % Sicherheit liegt der wahre Anteil zwischen 33,2 % und 42,8 %.
Konfidenzniveau und Fehlerspanne
Das Konfidenzniveau \(1 - \alpha\) gibt an, mit welcher Wahrscheinlichkeit das Intervall den wahren Wert \(p\) überdeckt.
Wichtig:
- Höheres Konfidenzniveau \(\Rightarrow\) breiteres Intervall (weniger präzise)
- Größerer Stichprobenumfang \(n\) \(\Rightarrow\) schmaleres Intervall (präzisere Schätzung)
- Die Fehlerspanne halbiert sich, wenn man den Stichprobenumfang vervierfacht.
Mindest-Stichprobenumfang
Möchte man eine bestimmte Fehlerspanne \(e\) nicht überschreiten, muss der Stichprobenumfang mindestens betragen:
Diese konservative Formel verwendet \(\hat{p}(1-\hat{p}) \leq \frac{1}{4}\).
Wie groß muss \(n\) sein, damit die Fehlerspanne bei 95 % Konfidenzniveau höchstens 3 % beträgt?
\(n \geq \left(\frac{1{,}96}{2 \cdot 0{,}03}\right)^2 = \left(\frac{1{,}96}{0{,}06}\right)^2 = 32{,}67^2 \approx 1068\)
Man benötigt mindestens 1068 Befragte.
Übungen
Bei einer Stichprobe mit \(n = 200\) und \(\hat{p} = 0{,}45\) soll ein 95 %-Konfidenzintervall berechnet werden. Wie groß ist die Fehlerspanne (gerundet)?
Was passiert mit der Breite des Konfidenzintervalls, wenn man den Stichprobenumfang von 100 auf 400 erhöht (bei gleichem \(\hat{p}\) und gleichem Konfidenzniveau)?
Welcher z-Wert wird für ein 99 %-Konfidenzintervall verwendet?
In einer Stichprobe mit \(n = 500\) geben 210 Befragte an, ein Produkt zu kaufen. Berechne das 95 %-Konfidenzintervall für \(p\).
Man möchte bei einem 95 %-Konfidenzniveau eine Fehlerspanne von höchstens 2 % erreichen. Wie groß muss die Stichprobe mindestens sein?