ML für die Industrie: Rule Generation auf ungelabelten Maschinenzeitreihen
In diesem Vortrag wird eine Pipeline vorgestellt, mit der aus ungelabelten Maschinenzeitreihen eine regelbasierte Zustandserkennung abgeleitet werden kann. Außerdem können Anomalien oder neue Zustände als solche detektiert werden. Die Pipeline besteht aus drei Komponenten:
(1) Feature Engineering auf den Zeitreihen
(2) Label Generation mittels Clustering
(3) Rule Generation durch Training von Decision Trees mit den Labels aus (2)
Das Modell aus (3) wird zur Zustandsklassifikation ausgeliefert, und das Modell aus (2) kann zur Anomaly-/Noveltydetection herangezogen werden.
Der vorgestellte Ansatz funktioniert über mehrere Sensoren hinweg und ist anwendungsagnostisch. Er wird beispielhaft auf Windturbinendaten demonstriert. Die Pipeline wurde mit den Standardpaketen des Python-Data- und ML-Ökosystems realisiert.
Vorkenntnisse
Teilnehmer sollte grundlegende Kenntnisse in Statistik mitbringen (Normalverteilung, Mittelwert, Varianz, Korrelation), ebenso Überblickswissen zu Machine-Learning-Modellen.
Lernziele
Ich möchte zeigen, dass man mit einem Self-supervised-Ansatz zu interpretierbaren Ergebnissen kommen kann. Außerdem möchte ich das Auditorium davon überzeugen, dass dieser Ansatz auf verschiedenste Use Cases übertragbar ist.