Konferenz für
Machine Learning und Künstliche Intelligenz
Köln, 24.-26. April 2018

Minds Mastering Machines 2018 » Programm »

// Bidirectional RNN zur Extraktion relevanter Felder in Rechnungen

Die automatische Extraktion relevanter Daten in Rechnungsdokumenten kann als wertvolle Grundlage für viele Dienstleistungen in der Finanz- und Buchhaltungsbranche dienen. Die Anwendung von Deep Learning für diesen Zweck ist vor allem durch die enorme Vielzahl an unterschiedlichen Layouts auf dem Markt motiviert.

Ich möchte die grundlegende Architektur des "Invoice Extractor" von SMACC vorstellen, der auf einem Bidirectional Multilayered Recurrent Neural Network basiert. Dabei werde ich auch über die wesentlichen Probleme und unsere Lösungsansätze diskutieren, indem ich auf die entsprechenden Implementierungsdetails eingehe.

Vorkenntnisse
Grundlegende Kenntnisse über Machine Learning, Neural Networks und evtl. Deep Learning sind notwendig. Den Begriff "RNN" sollte der Besucher schon mal gehört haben und es grob einordnen können.

Lernziele
Der Besucher soll einen Einblick in die Entwicklung und Optimierung eines Recurrent Neural Network (RNN) am Beispiel eines "Real World Use Case" bekommen. Die speziellen Probleme und deren Lösungsansätze dieses Beispiels sollen nachvollzogen werden.

// Chi Nhan Nguyen Chi Nhan Nguyen

absolvierte Studium und Promotion der Physik an der Universiät Hamburg im Bereich der Hochenergiephysik. Danach war er tätig als Postdoc an der Texas A&M University im Bereich Hochenergiephysik sowie als Data Scientist in diversen Unternehmen der freien Wirtschaft. Seit 2017 ist er Head of Data Science bei SMACC.