Satz von der totalen Wahrscheinlichkeit

Bevor wir den Satz von Bayes anwenden, brauchen wir oft den Satz von der totalen Wahrscheinlichkeit. Er zerlegt die Wahrscheinlichkeit eines Ereignisses \(B\) in Anteile, die von verschiedenen Ursachen stammen.

Totale Wahrscheinlichkeit
\(P(B) = P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})\)

Allgemein für \(n\) sich ausschließende Ursachen \(A_1, \ldots, A_n\): \(P(B) = \sum_{i=1}^{n} P(B|A_i) \cdot P(A_i)\)

Beispiel: Produktion in zwei Werken

Werk 1 produziert 60 % der Stückzahl mit 2 % Ausschussrate. Werk 2 produziert 40 % mit 5 % Ausschussrate.

\(P(\text{defekt}) = P(\text{defekt}|W_1) \cdot P(W_1) + P(\text{defekt}|W_2) \cdot P(W_2)\)

\(= 0{,}02 \cdot 0{,}6 + 0{,}05 \cdot 0{,}4 = 0{,}012 + 0{,}020 = 0{,}032\)

3,2 % aller Produkte sind defekt.

Der Satz von Bayes

Der Satz von Bayes kehrt bedingte Wahrscheinlichkeiten um: Aus \(P(B|A)\) wird \(P(A|B)\).

Satz von Bayes
\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\)

Oft wird \(P(B)\) über die totale Wahrscheinlichkeit berechnet.

Ausführliche Form
\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})}\)

Begriffe: \(P(A)\) heißt Prior (Vorwissen), \(P(A|B)\) heißt Posterior (aktualisierte Wahrscheinlichkeit nach Beobachtung von B), \(P(B|A)\) heißt Likelihood.

Anwendung: Medizinischer Test

Die klassische Anwendung des Satzes von Bayes ist die Interpretation von Testergebnissen.

Beispiel: COVID-Schnelltest

Gegeben:

  • Prävalenz (Durchseuchung): \(P(K) = 0{,}01\) (1 % sind krank)
  • Sensitivität: \(P(+|K) = 0{,}95\) (95 % der Kranken werden erkannt)
  • Spezifität: \(P(-|\bar{K}) = 0{,}97\) (97 % der Gesunden testen negativ)

Frage: Wie wahrscheinlich ist man krank, wenn der Test positiv ist?

1
\(P(+|\bar{K}) = 1 - 0{,}97 = 0{,}03\) (falsch-positiv-Rate)
2
\(P(+) = P(+|K) \cdot P(K) + P(+|\bar{K}) \cdot P(\bar{K})\)
\(= 0{,}95 \cdot 0{,}01 + 0{,}03 \cdot 0{,}99 = 0{,}0095 + 0{,}0297 = 0{,}0392\)
3
\(P(K|+) = \frac{P(+|K) \cdot P(K)}{P(+)} = \frac{0{,}0095}{0{,}0392} \approx 0{,}242\)

Ergebnis: Nur ca. 24 % der positiv Getesteten sind tatsächlich krank! Das liegt an der niedrigen Prävalenz.

Tipp: Bei seltenen Krankheiten und hoher falsch-positiv-Rate ist die Wahrscheinlichkeit, bei positivem Test wirklich krank zu sein, oft überraschend niedrig. Das ist das „Bayes-Paradoxon".

Bayes mit Baumdiagramm

Man kann den Satz von Bayes auch mithilfe eines Baumdiagramms lösen:

Beispiel: Fortsetzung – Produktion

Von welchem Werk stammt ein defektes Produkt wahrscheinlicher?

1
\(P(W_1|\text{defekt}) = \frac{P(\text{defekt}|W_1) \cdot P(W_1)}{P(\text{defekt})} = \frac{0{,}02 \cdot 0{,}6}{0{,}032} = \frac{0{,}012}{0{,}032} = 0{,}375\)
2
\(P(W_2|\text{defekt}) = \frac{0{,}05 \cdot 0{,}4}{0{,}032} = \frac{0{,}020}{0{,}032} = 0{,}625\)

Obwohl Werk 2 weniger produziert, stammen 62,5 % der defekten Teile von dort (wegen der höheren Fehlerrate).

Übungen

Aufgabe 1Leicht

\(P(A) = 0{,}3\), \(P(B|A) = 0{,}8\), \(P(B) = 0{,}5\). Berechne \(P(A|B)\).

Aufgabe 2Mittel

Ein Test hat Sensitivität 90 % und Spezifität 95 %. Die Prävalenz beträgt 5 %. Wie groß ist \(P(+)\) (totale Wahrscheinlichkeit eines positiven Tests)?

Aufgabe 3Mittel

Mit den Werten aus Aufgabe 2: Wie groß ist \(P(\text{krank}|+)\)?

Aufgabe 4Schwer

Fabrik A liefert 70 % und Fabrik B 30 % der Teile. Fehlerrate: A: 3 %, B: 7 %. Ein Teil ist defekt. Wie wahrscheinlich stammt es aus Fabrik B?

Aufgabe 5Schwer

Welcher Faktor hat den größten Einfluss darauf, wie hoch \(P(\text{krank}|+)\) bei einem Medizintest ist?

🎯 Dein Ergebnis
0 / 5 richtig