Zum Hauptinhalt springen

Maschinelles Lernen

Unsupervised Learning und Reinforcement Learning

Teaser – volle Lektion nach Anmeldung

Lernziele dieser Lektion

  • Unsupervised Learning (unüberwachtes Lernen) erklären können
  • Verstehen, was Clustering ist und wie es funktioniert
  • Reinforcement Learning (bestärkendes Lernen) erklären können
  • Anwendungsbeispiele für alle drei ML-Paradigmen benennen können

Unüberwachtes Lernen (Unsupervised Learning)

Im Gegensatz zum überwachten Lernen arbeitet unüberwachtes Lernen mit Daten, die keine Labels (Beschriftungen) haben. Das System versucht eigenständig, interessante Strukturen, Muster oder Gruppen in den Daten zu finden.

Ablauf von Unsupervised Learning: Finden von Mustern in ungelabelten Daten

Clustering: Daten gruppieren

Clustering ist die häufigste Anwendung von Unsupervised Learning. Dabei werden Datenpunkte aufgrund ihrer Ähnlichkeit in Gruppen (Cluster) eingeteilt – ohne dass vorher definiert wird, welche Gruppen es gibt.

Beispiel: Obst-Clustering

Stellen wir uns vor, wir haben verschiedene Obstsorten und messen zwei Eigenschaften: Grösse und Farbe. Wenn wir diese Datenpunkte in ein Diagramm einzeichnen, bilden sich automatisch Gruppen (Cluster):

  • Cluster 1: Kleine, dunkle Früchte → wahrscheinlich Trauben
  • Cluster 2: Kleine, rote Früchte → wahrscheinlich Erdbeeren
  • Cluster 3: Große, grün-gelbe Früchte → wahrscheinlich Bananen
  • Cluster 4: Unklare Zuordnung → könnte ein Ausreisser sein

Wichtig: Der Algorithmus kennt the Namen der Obstsorten nicht – er erkennt nur, dass bestimmte Datenpunkte ähnliche Eigenschaften haben und gruppiert sie zusammen.

Anwendungsbeispiele für Unsupervised Learning

  • Kundensegmentierung: Kunden eines Online-Shops werden anhand von Alter, Einkommen und Kaufverhalten in Gruppen eingeteilt (z.B. «sportlich», «technikinteressiert») – für personalisierte Werbung
  • Clusteranalyse von Dokumenten: Textdokumente nach ähnlichen Themen gruppieren
  • Anomalie-Erkennung: Ungewöhnliche Datenpunkte (Ausreisser) identifizieren, z.B. betrügerische Transaktionen

Bestärkendes Lernen (Reinforcement Learning)

Bestärkendes Lernen (Reinforcement Learning) folgt einem völlig anderen Prinzip: Ein Agent lernt durch Interaktion mit einer Umgebung. Er führt Aktionen aus und erhält daraufhin eine Belohnung (positiv) oder Bestrafung (negativ).

Dies ist nur ein kurzer Auszug. Die vollständige Lektion mit interaktiven Übungen und Lernfortschritts-Tracking gibt es nach Einlösung eines Einschreibeschlüssels.