Satz von Bayes – Formel & Anwendung

Satz von der totalen Wahrscheinlichkeit

Bevor wir den Satz von Bayes anwenden, brauchen wir oft den Satz von der totalen Wahrscheinlichkeit. Er zerlegt die Wahrscheinlichkeit eines Ereignisses \(B\) in Anteile, die von verschiedenen Ursachen stammen.

Totale Wahrscheinlichkeit

\(P(B) = P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})\)

Allgemein für \(n\) sich ausschließende Ursachen \(A_1, \ldots, A_n\): \(P(B) = \sum_{i=1}^{n} P(B|A_i) \cdot P(A_i)\)

Beispiel: Produktion in zwei Werken

Werk 1 produziert 60 % der Stückzahl mit 2 % Ausschussrate. Werk 2 produziert 40 % mit 5 % Ausschussrate.

\(P(\text{defekt}) = P(\text{defekt}|W_1) \cdot P(W_1) + P(\text{defekt}|W_2) \cdot P(W_2)\)

\(= 0{,}02 \cdot 0{,}6 + 0{,}05 \cdot 0{,}4 = 0{,}012 + 0{,}020 = 0{,}032\)

3,2 % aller Produkte sind defekt.

Der Satz von Bayes

Der Satz von Bayes kehrt bedingte Wahrscheinlichkeiten um: Aus \(P(B|A)\) wird \(P(A|B)\).

Satz von Bayes

\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\)

Oft wird \(P(B)\) über die totale Wahrscheinlichkeit berechnet.

Ausführliche Form

\(P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B|A) \cdot P(A) + P(B|\bar{A}) \cdot P(\bar{A})}\)

Begriffe: \(P(A)\) heißt Prior (Vorwissen), \(P(A|B)\) heißt Posterior (aktualisierte Wahrscheinlichkeit nach Beobachtung von B), \(P(B|A)\) heißt Likelihood.

Anwendung: Medizinischer Test

Die klassische Anwendung des Satzes von Bayes ist die Interpretation von Testergebnissen.

Beispiel: COVID-Schnelltest

Gegeben:

Prävalenz (Durchseuchung): \(P(K) = 0{,}01\) (1 % sind krank)
Sensitivität: \(P(+|K) = 0{,}95\) (95 % der Kranken werden erkannt)
Spezifität: \(P(-|\bar{K}) = 0{,}97\) (97 % der Gesunden testen negativ)

Frage: Wie wahrscheinlich ist man krank, wenn der Test positiv ist?

\(P(+|\bar{K}) = 1 - 0{,}97 = 0{,}03\) (falsch-positiv-Rate)

\(P(+) = P(+|K) \cdot P(K) + P(+|\bar{K}) \cdot P(\bar{K})\)
\(= 0{,}95 \cdot 0{,}01 + 0{,}03 \cdot 0{,}99 = 0{,}0095 + 0{,}0297 = 0{,}0392\)

\(P(K|+) = \frac{P(+|K) \cdot P(K)}{P(+)} = \frac{0{,}0095}{0{,}0392} \approx 0{,}242\)

Ergebnis: Nur ca. 24 % der positiv Getesteten sind tatsächlich krank! Das liegt an der niedrigen Prävalenz.

Tipp: Bei seltenen Krankheiten und hoher falsch-positiv-Rate ist die Wahrscheinlichkeit, bei positivem Test wirklich krank zu sein, oft überraschend niedrig. Das ist das „Bayes-Paradoxon".

Bayes mit Baumdiagramm

Man kann den Satz von Bayes auch mithilfe eines Baumdiagramms lösen:

Beispiel: Fortsetzung – Produktion

Von welchem Werk stammt ein defektes Produkt wahrscheinlicher?

\(P(W_1|\text{defekt}) = \frac{P(\text{defekt}|W_1) \cdot P(W_1)}{P(\text{defekt})} = \frac{0{,}02 \cdot 0{,}6}{0{,}032} = \frac{0{,}012}{0{,}032} = 0{,}375\)

\(P(W_2|\text{defekt}) = \frac{0{,}05 \cdot 0{,}4}{0{,}032} = \frac{0{,}020}{0{,}032} = 0{,}625\)

Obwohl Werk 2 weniger produziert, stammen 62,5 % der defekten Teile von dort (wegen der höheren Fehlerrate).

Satz von der totalen Wahrscheinlichkeit

Der Satz von Bayes

Anwendung: Medizinischer Test

Bayes mit Baumdiagramm

Übungen