Richtung Produktion und noch viel weiter: Data-Science-Teams mit Kubeflow skalieren

Das international tätige Logisktikunternehmen Kühne+Nagel hat in den vergangenen Jahren die zentrale Data Science Abteilung umfangreich ausgebaut. Um der stark steigenden Zahl an Proof of Concepts und produktiven Services gerecht zu werden, wurde Kubeflow eingeführt, um das bereits vorhandene AWS EKS Cluster (Kubernetes) optimal nutzen zu können und als integrierte Umgebung die Data Science Teams vom Experiment bis zum produktiven Service bestmöglich zu unterstützen und ihre Produktivität zu erhöhen.

Kubeflow positioniert sich als Open Source Alternative zu Cloud Services wie AWS Sagemaker. Es erlaubt ein hohes Maß an Konfigurierbarkeit, ist auf der anderen Seite allerdings aufwändiger im Betrieb. Im Vortrag werden weitere Vor- und Nachteile besprochen, um Entscheidern ein Gefühl für die Trade Offs und Rahmenbedingungen zu geben. Darüber hinaus wird skizziert, wie unsere Data Science Teams Kubeflow einsetzen und was wir im Rahmen der Einführung bzw. Migration gelernt haben.

Vorkenntnisse

Grundlegendes Verständnis, was Kubernetes ist

Lernziele

Der Vortag gibt einen Überblick in das Thema MLOps und hilft bei der Abwägung, unter welchen Voraussetzungen Kubeflow eine gute Alternative als Plattform für ein oder mehrere Teams von Data Scientists sein kann.

Speaker

 

Florian Müller
Florian Müller ist Wirtschaftsinformatiker und arbeitet als Lead Data Engineer für Kühne+Nagel in Hamburg. Dort verantwortet er das Thema MLOps im globalen Data Science Bereich.

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden