Resilientes Machine Learning
Resilienz ist die Fähigkeit der Anpassung an schwierige oder unerwartete Situationen. Im Bereich des Machine Learning müssen wir uns dabei mit Phänomenen wie Adversarial Attacks, Out-of-Distribution Robustness und Drift auseinandersetzen. Die Stabilität des Modells muss hier bei Neutraining und Nachtraining gewährleistet werden.
Maßnahmen umfassen das Monitoring von Machine-Learning-Modellen, die Erkennung von Ausreißern und den Betrieb mit Fallbacks und/oder mehreren Modellen als Ensemble. Auch eine geschickte Auswahl des Modells für die Produktion kann schon viel bewirken.
In diesem Talk erläutere ich die genannten Phänomene und gehe auf die jeweils passenden Maßnahmen ein.
Vorkenntnisse
Grundverständnis vom Training von ML-Modellen
Lernziele
Ein Einblick in die Welt des Machine Learning in Produktion und was man beachten muss, um nachts gut schlafen zu können.