Der Call for Proposals für die Minds Mastering Machines 2025 ist gestartet. Wir freuen uns auf Eure Einreichungen!

Wie ML die Datenintegration verändert: Vorteile und innovative Anwendungen

Für die Nutzbarkeit von Daten in Unternehmen ist deren Qualität das herausragende Kriterium. Nur bei hoher Datenqualität kann ein Vertrauen der Anwender in Operations und BI hergestellt werden. Durch die zunehmende Heterogenität der Daten stoßen traditionelle Ansätze hier schnell an ihre Grenzen.

Wir geben einen Einblick in die Potenziale des Machine Learning in der Datenintegration, wie dieses die Data Governance verbessern kann und uns ein tieferes Verständnis und die Kontrolle über unsere Daten ermöglicht.

Anhand eines Beispiels zeigen wir, wie die Dublettenerkennung durch ML unterstützt werden kann. Dabei vergleichen wir traditionelle Modelle mit Transformer-basierten neuronalen Netzen.

Vorkenntnisse

Grundkenntnisse in Machine Learning, Datenintegration und ETL/ELT.

Lernziele

  • Grundlagen der Datenqualität inkl. eines kurzen Überblicks zu Messkriterien
  • Potenzielle Anwendung von Machine Learning im Prozess der Datenintegration und Datenbereinigung
  • Machine-Learning-Modelle für die Duplikaterkennung sowie deren Performance
  • Machine Learning zur Unterstützung der Data Governance

Speaker

 

Felix Lammermann
Felix Lammermann ist Lead Consultant bei der PRODATO Integration Technology GmbH. Dort setzt Hr. Lammermann Projekte in den Bereichen Datenintegration und Datenvisualisierung selbst um und managed Projekte zur Weiterentwicklung von Individualsoftware mithilfe modernster Technologien.

Igor Shmelev
Igor Shmelev ist Lead Consultant bei PRODATO und hat sich auf Data Governance mit Schwerpunkt Data Quality und Master Data spezialisiert. Dabei sieht er den Einsatz von Machine Learning als essenzielles Mittel, um datenzentrierte Herausforderungen von heute und morgen effektiv anzugehen.

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden