Einführung in Unsupervised Learning
Dem Überwachten Lernen wird viel Aufmerksamkeit geschenkt. Es gibt jedoch Situationen, in denen es nicht praktikabel oder gar unmöglich ist, an die entsprechenden Zielwerte für die Eingaben zu kommen, um das Modell mit ihnen zu „füttern“. In genau solchen Fällen zeigt Unüberwachtes Lernen sein Potenzial, denn damit werden versteckte Strukturen in den Daten sichtbar.
In diesem Vortrag werden wir uns ansehen, welche Vorteile und Nachteile verschiedene Clusteringverfahren haben. Dabei wird zwischen zentroid-basierten, dichtebasierten, verteilungsbasierten und hierarchischen Verfahren unterschieden.
Als Inspiration für eigene Anwendungen werden Szenarien beschrieben, wo Unüberwachtes Lernen zur Geltung kommt, zum Beispiel Anomalieerkennung, Datenkompression und Anonymisierung der Daten.
Vorkenntnisse
Grundidee von Machine Learning
Lernziele
- Was ist Unsupervised Learning und was gehört dazu?
- Wie sieht die Pipeline aus?
- Wie funktioniert Clustering eigentlich?
- Wie beeinflussen Ähnlichkeitsmetriken das Ergebnis?
- Use-Cases von Unsupervised Learning