Multimodale Ansätze in der KI: eine Fallstudie zur Betrugserkennung
In vielen Prozessen fallen multimodale Daten wie Bilder, Texte und Graphdaten an. Ihre Kombination ist essentiell, stellt jedoch durch ihre Heterogenität eine große Herausforderung dar, z.B. bei der Plausibilitätsprüfung zwischen Bildern und Beschreibungen.
Aktuelle Methoden reichen von Ensembles bis zu End-to-End- Modellen. Bei ControlExpert verbinden wir Technologien wie CLIP-Bild-Embedder, LLM- Textembedder und Graph-Modelle, ergänzt durch weitere Transformeransätze, zur effektiven Datenverarbeitung in einem multimodalen Ansatz.
Am Beispiel der Betrugserkennung demonstrieren wir, wie die Verbindung verschiedener Modalitäten entscheidend ist, und präsentieren erfolgreiche Modelle und Ansätze.
Vorkenntnisse
Vorkenntnisse im Bereich Machine Learning/Deep Learning können von Vorteil sein.
Lernziele
Teilnehmer lernen, wie multimodale Daten in automatisierten Prozessen für effektive Problemlösungen genutzt werden können. Die Präsentation demonstriert die Anwendung von KI-Technologien in der Betrugserkennung als Fallstudie und betont die Übertragbarkeit dieser Erkenntnisse auf andere Sektoren, in denen die Integration multimodaler Daten für die Wahrung der Prozessintegrität entscheidend ist.