Aus der Praxis: Texte analysieren mit NLP

Im Jahr 2018 wurde durch die erfolgreiche Anwendung von Transfer Learning auf natürlichsprachige Texte mit BERT eine gesamte Branche umgebrochen.

Im Vortrag zeigen wir verschiedene Anwendungsmöglichkeiten, wie man NLP-Probleme mit BERT und Transfer Learning lösen kann. Als Beispiel nutzen wir Daten aus dem Heise-Newsticker. Wir nutzen die Embeddings, um besonders erfolgreiche Tickermeldungen vorherzusagen. Dabei werden wir auch semantisch ähnliche Meldungen identifizieren. Neben BERT selbst gibt es eine ganze Reihe davon abgeleiteter Modelle. Wir geben einen Überblick und erklären kurz ihre spezifischen Vor- und Nachteile.

Zum Abschluss ordnen wir Transfer Learning im größeren Kontext ein und zeigen, bei welchen anderen Nicht-NLP-Probleme ähnliche Techniken zum Einsatz gebracht werden können.

Lernziele

Teilnehmer können nach dem Workshop eigene Textanalyse-Projekte mit der vorgestellten Pipeline starten und kennen sich mit den verwendeten Techniken (NLP, Vektorisierung, Klassifikation, Topic Modelling) aus.

 

Speaker

 

Christian Winkler
Christian Winkler ist ein Gründer der datanizing GmbH und promovierte an der FAU Erlangen Nürnberg. Er arbeitet seit 20 Jahren in der Softwareentwicklung im Bereich Big Data/KI, insbesondere mit Fokus auf intelligente Algorithmen zur Massendatenverarbeitung im Bereich des maschinellen Lernens, der Geodatenverarbeitung und Statistik. Als Data Scientist und Solution Architect begleitet Dr. Winkler Projekte in den Bereichen Text Mining, Netzwerkanalyse, Forum Analytics und Sentiment Analyse. Er ist Speaker auf Konferenzen und Autor von Artikeln zu Big Data/KI.

Gold-Sponsor

Novatec

Silber-Sponsor

inovex

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden