Einführung in Active Learning
Labeling von Daten ist oft das größte Hindernis bei der Umsetzung von ML-Projekten. Es ist zeitaufwändig, teuer sowie langweilig und dadurch fehleranfällig. Gleichzeitig können fehlerhafte Labels die Vorhersagequalität eines Modells nachhaltig schädigen. Umso ärgerlicher ist es, wenn der Lerner viele Labels gar nicht benötigt, etwa weil bereits ähnliche Daten gelabelt sind.
Active Learning verspricht Abhilfe. Hier fragt der Lerner aktiv nach Labels für interessante Daten, um gleichzeitig den Labeling-Aufwand zu minimieren und die Modellqualität zu steigern.
Dieser Vortrag gibt eine Einführung in die Grundlagen von Active Learning und zeigt die Umsetzung anhand eines Praxisbeispiels aus der Textklassifikation.
Vorkenntnisse
Es werden Basiskenntnisse im Machine Learning vorausgesetzt. Für die praktische Implementierung werden Python-Kenntnisse benötigt, insbesondere auch zu den Bibliotheken numpy und scikit-learn.
Lernziele
* Verständnis der Grundlagen des Active Learning: Voraussetzungen, Szenarios, Einschränkungen
* Kenntnis der Basistechniken
* Fähigkeit, diese Techniken zu implementieren und anzuwenden.