Satz von der totalen Wahrscheinlichkeit
Bevor wir den Satz von Bayes anwenden, brauchen wir oft den Satz von der totalen Wahrscheinlichkeit. Er zerlegt die Wahrscheinlichkeit eines Ereignisses \(B\) in Anteile, die von verschiedenen Ursachen stammen.
Allgemein für \(n\) sich ausschließende Ursachen \(A_1, \ldots, A_n\): \(P(B) = \sum_{i=1}^{n} P(B|A_i) \cdot P(A_i)\)
Werk 1 produziert 60 % der Stückzahl mit 2 % Ausschussrate. Werk 2 produziert 40 % mit 5 % Ausschussrate.
\(P(\text{defekt}) = P(\text{defekt}|W_1) \cdot P(W_1) + P(\text{defekt}|W_2) \cdot P(W_2)\)
\(= 0{,}02 \cdot 0{,}6 + 0{,}05 \cdot 0{,}4 = 0{,}012 + 0{,}020 = 0{,}032\)
3,2 % aller Produkte sind defekt.
Der Satz von Bayes
Der Satz von Bayes kehrt bedingte Wahrscheinlichkeiten um: Aus \(P(B|A)\) wird \(P(A|B)\).
Oft wird \(P(B)\) über die totale Wahrscheinlichkeit berechnet.
Begriffe: \(P(A)\) heißt Prior (Vorwissen), \(P(A|B)\) heißt Posterior (aktualisierte Wahrscheinlichkeit nach Beobachtung von B), \(P(B|A)\) heißt Likelihood.
Anwendung: Medizinischer Test
Die klassische Anwendung des Satzes von Bayes ist die Interpretation von Testergebnissen.
Gegeben:
- Prävalenz (Durchseuchung): \(P(K) = 0{,}01\) (1 % sind krank)
- Sensitivität: \(P(+|K) = 0{,}95\) (95 % der Kranken werden erkannt)
- Spezifität: \(P(-|\bar{K}) = 0{,}97\) (97 % der Gesunden testen negativ)
Frage: Wie wahrscheinlich ist man krank, wenn der Test positiv ist?
\(= 0{,}95 \cdot 0{,}01 + 0{,}03 \cdot 0{,}99 = 0{,}0095 + 0{,}0297 = 0{,}0392\)
Ergebnis: Nur ca. 24 % der positiv Getesteten sind tatsächlich krank! Das liegt an der niedrigen Prävalenz.
Tipp: Bei seltenen Krankheiten und hoher falsch-positiv-Rate ist die Wahrscheinlichkeit, bei positivem Test wirklich krank zu sein, oft überraschend niedrig. Das ist das „Bayes-Paradoxon".
Bayes mit Baumdiagramm
Man kann den Satz von Bayes auch mithilfe eines Baumdiagramms lösen:
Von welchem Werk stammt ein defektes Produkt wahrscheinlicher?
Obwohl Werk 2 weniger produziert, stammen 62,5 % der defekten Teile von dort (wegen der höheren Fehlerrate).
Übungen
\(P(A) = 0{,}3\), \(P(B|A) = 0{,}8\), \(P(B) = 0{,}5\). Berechne \(P(A|B)\).
Ein Test hat Sensitivität 90 % und Spezifität 95 %. Die Prävalenz beträgt 5 %. Wie groß ist \(P(+)\) (totale Wahrscheinlichkeit eines positiven Tests)?
Mit den Werten aus Aufgabe 2: Wie groß ist \(P(\text{krank}|+)\)?
Fabrik A liefert 70 % und Fabrik B 30 % der Teile. Fehlerrate: A: 3 %, B: 7 %. Ein Teil ist defekt. Wie wahrscheinlich stammt es aus Fabrik B?
Welcher Faktor hat den größten Einfluss darauf, wie hoch \(P(\text{krank}|+)\) bei einem Medizintest ist?