Die Fünf-Punkte-Zusammenfassung
Ein Boxplot basiert auf fünf Kennwerten (Five-Number Summary):
| Kennwert | Symbol | Bedeutung |
|---|---|---|
| Minimum | \(x_{\min}\) | Kleinster Wert (ohne Ausreißer) |
| Unteres Quartil | \(Q_1\) | 25 % der Daten liegen darunter |
| Median | \(\tilde{x}\) | 50 % der Daten liegen darunter |
| Oberes Quartil | \(Q_3\) | 75 % der Daten liegen darunter |
| Maximum | \(x_{\max}\) | Größter Wert (ohne Ausreißer) |
Schritt-für-Schritt-Anleitung
Rohdaten: 45, 52, 38, 61, 55, 48, 42, 58, 50, 44, 63, 47
Zusammenfassung: Min = 38, \(Q_1 = 44{,}5\), Median = 49, \(Q_3 = 56{,}5\), Max = 63
Ausreißer erkennen
Ein Wert gilt als Ausreißer, wenn er mehr als das 1,5-Fache des Interquartilsabstands vom Rand der Box entfernt liegt.
\(\text{Obere Grenze} = Q_3 + 1{,}5 \cdot IQR\)
Werte außerhalb dieser Grenzen sind Ausreißer und werden als einzelne Punkte dargestellt.
Gegeben: \(Q_1 = 44{,}5\), \(Q_3 = 56{,}5\), also \(IQR = 56{,}5 - 44{,}5 = 12\)
Boxplot zeichnen
So zeichnest du den Boxplot:
- Zeichne eine Zahlengerade mit passender Skalierung.
- Zeichne die Box von \(Q_1\) bis \(Q_3\).
- Markiere den Median als senkrechten Strich in der Box.
- Zeichne die Whisker (Antennen) vom Rand der Box bis zum Minimum bzw. Maximum.
- Bei Ausreißern: Whisker nur bis zum letzten „normalen" Wert, Ausreißer als einzelne Punkte.
Boxplot interpretieren
- Breite der Box (IQR): Zeigt die Streuung der mittleren 50 % der Daten.
- Position des Medians in der Box: Liegt er mittig → symmetrische Verteilung. Liegt er links → rechtsschiefe Verteilung. Liegt er rechts → linksschiefe Verteilung.
- Länge der Whisker: Zeigt, wie weit die Randwerte vom Zentrum entfernt sind.
- Ausreißer: Einzelne Punkte außerhalb der Whisker deuten auf ungewöhnliche Werte hin.
Vergleich: Boxplots eignen sich hervorragend, um mehrere Datensätze nebeneinander zu vergleichen – z. B. Testergebnisse verschiedener Klassen.
Übungen
Ein Boxplot hat: Min = 10, \(Q_1 = 15\), Median = 20, \(Q_3 = 28\), Max = 35. Wie groß ist der IQR?
Gegeben: \(Q_1 = 20\), \(Q_3 = 40\). Ab welchem Wert gilt ein Datenpunkt als Ausreißer nach oben?
Der Median liegt in einem Boxplot deutlich links in der Box. Was bedeutet das?
Sortierte Daten: 5, 8, 10, 12, 14, 18, 20, 25. Welcher Wert ist \(Q_1\)?