Unsupervised Learning und Reinforcement Learning – KI – Themenpool

Lernziele dieser Lektion

Unsupervised Learning (unüberwachtes Lernen) erklären können
Verstehen, was Clustering ist und wie es funktioniert
Reinforcement Learning (bestärkendes Lernen) erklären können
Anwendungsbeispiele für alle drei ML-Paradigmen benennen können

Unüberwachtes Lernen (Unsupervised Learning)

Im Gegensatz zum überwachten Lernen arbeitet unüberwachtes Lernen mit Daten, die keine Labels (Beschriftungen) haben. Das System versucht eigenständig, interessante Strukturen, Muster oder Gruppen in den Daten zu finden.

Ablauf von Unsupervised Learning: Finden von Mustern in ungelabelten Daten

Clustering: Daten gruppieren

Clustering ist die häufigste Anwendung von Unsupervised Learning. Dabei werden Datenpunkte aufgrund ihrer Ähnlichkeit in Gruppen (Cluster) eingeteilt – ohne dass vorher definiert wird, welche Gruppen es gibt.

Beispiel: Obst-Clustering

Stellen wir uns vor, wir haben verschiedene Obstsorten und messen zwei Eigenschaften: Grösse und Farbe. Wenn wir diese Datenpunkte in ein Diagramm einzeichnen, bilden sich automatisch Gruppen (Cluster):

Cluster 1: Kleine, dunkle Früchte → wahrscheinlich Trauben
Cluster 2: Kleine, rote Früchte → wahrscheinlich Erdbeeren
Cluster 3: Große, grün-gelbe Früchte → wahrscheinlich Bananen
Cluster 4: Unklare Zuordnung → könnte ein Ausreisser sein

Wichtig: Der Algorithmus kennt the Namen der Obstsorten nicht – er erkennt nur, dass bestimmte Datenpunkte ähnliche Eigenschaften haben und gruppiert sie zusammen.

Anwendungsbeispiele für Unsupervised Learning

Kundensegmentierung: Kunden eines Online-Shops werden anhand von Alter, Einkommen und Kaufverhalten in Gruppen eingeteilt (z.B. «sportlich», «technikinteressiert») – für personalisierte Werbung
Clusteranalyse von Dokumenten: Textdokumente nach ähnlichen Themen gruppieren
Anomalie-Erkennung: Ungewöhnliche Datenpunkte (Ausreisser) identifizieren, z.B. betrügerische Transaktionen

Bestärkendes Lernen (Reinforcement Learning)

Bestärkendes Lernen (Reinforcement Learning) folgt einem völlig anderen Prinzip: Ein Agent lernt durch Interaktion mit einer Umgebung. Er führt Aktionen aus und erhält daraufhin eine Belohnung (positiv) oder Bestrafung (negativ).

Dies ist nur ein kurzer Auszug. Die vollständige Lektion mit interaktiven Übungen und Lernfortschritts-Tracking gibt es nach Einlösung eines Einschreibeschlüssels.