Einblick in ML-Verfahren mit Decision Boundaries
Data Science wird heute immer mehr als Decision Science verstanden, als die Wissenschaft guter und vor allem datenbasierter Entscheidungen. Moderne Machine-Learning-Verfahren sind aber längst so komplex, dass selbst Experten nicht immer gut erklären können, wie genau die eingesetzten Verfahren eigentlich lernen und entscheiden – man verlässt sich letztlich oft auf abstrakte Kennzahlen. Es ergibt sich eine paradoxe Situation: Wir können immer bessere Entscheidungen treffen, verstehen aber gleichzeitig immer weniger, wie sie zustande kommen.
Die Visualisierung von Decisions Boundaries – das sind die Entscheidungsgrenzen, an denen mehrere Möglichkeiten gleichwahrscheinlich sind – ermöglicht, einen Blick ins Innere der maschinellen Lernverfahren zu werfen. Damit lässt sich besser verstehen, wie diese Algorithmen "die Welt sehen", welche Probleme sie gut oder auch weniger gut lösen können und sogar wie sicher eine getroffene Entscheidung aus Sicht des Algorithmus eigentlich ist. Und man kann ihnen quasi beim Lernen zuschauen.
In diesem Vortrag werden wir einige Algorithmen auf einfache Testprobleme anwenden und mit verschiedenen Methoden und insbesondere interaktiven Visualisierungen die dabei von den Algorithmen gelernten Decision Boundaries untersuchen und vergleichen. Darüber hinaus betrachten wir ähnliche Konzepte aus dem Bereich des Unsupervised Learning wie etwa Voronoi-Zellen, die sogar im Profisport – Fußball, Basketball (NBA) – Verwendung finden.
Vorkenntnisse
Grundlegende Kenntnisse im Bereich Machine Learning, wie sie im Vortrag "Überblick über Machine Learning" vermittelt werden.
Lernziele
* Besseres Verständnis der Eigenschaften verschiedener Klassifikations-Verfahren anhand der von diesen Verfahren generierten Decision Boundaries oder Entscheidungsgrenzen
* Beurteilung des Lernfortschritts eines Algorithmus' durch interaktive Visualisierung der Decision Boundaries während des Lernens
* Vergleich mit verwandten Konzepten aus dem Bereich Unsupervised Learning / Clustering