Möchten Sie mit Ihrem Team teilnehmen? Profitieren Sie von unseren Gruppenrabatten! Schreiben Sie an events@dpunkt.de

Einführung in Active Learning

Labeling von Daten ist oft das größte Hindernis bei der Umsetzung von ML-Projekten. Es ist zeitaufwändig, teuer sowie langweilig und dadurch fehleranfällig. Gleichzeitig können fehlerhafte Labels die Vorhersagequalität eines Modells nachhaltig schädigen. Umso ärgerlicher ist es, wenn der Lerner viele Labels gar nicht benötigt, etwa weil bereits ähnliche Daten gelabelt sind.

Active Learning verspricht Abhilfe. Hier fragt der Lerner aktiv nach Labels für interessante Daten, um gleichzeitig den Labeling-Aufwand zu minimieren und die Modellqualität zu steigern.

Dieser Vortrag gibt eine Einführung in die Grundlagen von Active Learning und zeigt die Umsetzung anhand eines Praxisbeispiels aus der Textklassifikation.

Vorkenntnisse

Es werden Basiskenntnisse im Machine Learning vorausgesetzt. Für die praktische Implementierung werden Python-Kenntnisse benötigt, insbesondere auch zu den Bibliotheken numpy und scikit-learn.

Lernziele

* Verständnis der Grundlagen des Active Learning: Voraussetzungen, Szenarios, Einschränkungen
* Kenntnis der Basistechniken
* Fähigkeit, diese Techniken zu implementieren und anzuwenden.

Speaker

 

Matthias Richter
Matthias Richter ist Machine Learning Engineer bei inovex. Hier beschäftigt er sich mit der vollen Bandbreite von Machine Learning Projekten: von Datenerfassung und Bereinigung über Modelltraining und Evaluation bis hin zum Deployment und Skalierung. Darüber hinaus interessiert er sich für die theoretischen Grundlagen, insbesondere statistische Lerntheorie und Vorhersagen in der offenen Welt.

Maximilian Blanck
Maximilian Blanck arbeitet als Data Scientist für inovex. Er befasst sich hier, neben dem Explorieren von Daten und Entwickeln von Machine Learning Modellen in Produktion, vor allem mit Natural Language Processing, Deep Learning und Statistik.

Ihr möchtet über die
auf dem Laufenden gehalten werden?

 

Anmelden