Zum Hauptinhalt springen

Statistik & Datenauswertung

Bedingte Wahrscheinlichkeit und der Satz von Bayes

Teaser – volle Lektion nach Anmeldung

Lernziele dieser Lektion

  • Sie verstehen den Begriff bedingte Wahrscheinlichkeit P(A|B) und berechnen sie aus einer Vierfeldertafel
  • Sie kennen den Multiplikationssatz P(A ∩ B) = P(B) · P(A|B) und nutzen ihn bei Baumdiagrammen
  • Sie wenden den Satz von Bayes auf medizinische und technische Fragen an
  • Sie erkennen, warum ein positiver Test bei seltener Krankheit nicht zwangsläufig krank bedeutet

Warum bedingte Wahrscheinlichkeit?

In der Praxis wollen wir oft wissen: Wie wahrscheinlich ist etwas, wenn ich schon eine Teil-Information habe? Zum Beispiel: Wie hoch ist die Wahrscheinlichkeit, dass eine Maschine defekt ist, wenn sie älter als 5 Jahre ist? Oder: Wie wahrscheinlich ist eine Krankheit, wenn der Test positiv ist? Solche "Wenn-dann-Fragen" beantwortet die bedingte Wahrscheinlichkeit.

Bedingte Wahrscheinlichkeit - Definition

Die Wahrscheinlichkeit für Ereignis AA, unter der Bedingung dass BB bereits eingetreten ist, schreibt man:

P(AB)gelesen: "P von A gegeben B"P(A \mid B) \quad \text{gelesen: "P von A gegeben B"}

Berechnungsformel:

P(AB)=P(AB)P(B)(mit P(B)0)P(A \mid B) = \frac{P(A \cap B)}{P(B)} \quad (\text{mit } P(B) \neq 0)

P(AB)P(A \cap B) ist die Wahrscheinlichkeit, dass beide Ereignisse gleichzeitig eintreten.

Abkürzungs-Einführung: Schreibweisen

  • P(A): Wahrscheinlichkeit für Ereignis A (ohne Zusatzinformation)
  • P(A|B): Wahrscheinlichkeit für A, unter der Bedingung dass B eingetreten ist
  • P(A ∩ B): Wahrscheinlichkeit, dass A und B gleichzeitig eintreten
  • Ā (A quer) oder nicht A: das Gegenereignis zu A

Vierfeldertafel - das handliche Werkzeug

Durchdachtes Beispiel A - Raucher und Lungenerkrankung

Situation: In einer Studie mit 1000 Erwachsenen finden sich folgende Zahlen:

Vierfeldertafel:
Raucher (R)Nichtraucher (R̄)Summe
krank (K)8020100
gesund (K̄)220680900
Summe3007001000
P(K|R) - Wahrscheinlichkeit, krank zu sein, unter den Rauchern: P(KR)=803000,267=26,7%P(K \mid R) = \frac{80}{300} \approx 0{,}267 = 26{,}7\,\%
P(K|R̄) - Wahrscheinlichkeit, krank zu sein, unter den Nichtrauchern: P(KRˉ)=207000,0286=2,86%P(K \mid \bar R) = \frac{20}{700} \approx 0{,}0286 = 2{,}86\,\%

Unter den Rauchern sind 26,7 % krank, unter den Nichtrauchern nur 2,86 %. Der Unterschied zeigt einen deutlichen Zusammenhang zwischen Rauchen und Krankheit.

Dies ist nur ein kurzer Auszug. Die vollständige Lektion mit interaktiven Übungen und Lernfortschritts-Tracking gibt es nach Einlösung eines Einschreibeschlüssels.