Am Anfang war der Content. Dann kam ganz viel User Generated Content (UGC). Und mit ihm entstanden neben neuen Einsichten auch Schwierigkeiten. Social Media Manager und Chief Digital Officer lieben UGC. Durch die schiere Menge ist er jedoch schwer zu strukturieren und zu interpretieren, außerdem ist die Redaktion sehr aufwändig.
Wir zeigen anhand der Heise-Diskussionsforen, wie auch sehr große Mengen an UGC mithilfe moderner Analysemethoden (Graph-Analyse, Machine Learning) bewältigt werden können. Dazu analysieren und clustern wir Texte, in denen wir anschließend die gefundenen Themenzusammenhänge darstellen. User-Cluster zeigen Interaktionen und „Netzwerke“.
Die gewonnenen Erkenntnisse helfen Unternehmen direkt im operativen Geschäft, etwa durch vereinfachte Redaktion von Beiträgen. Sie können auch strategisch genutzt werden, z.B. für Produktentwicklungen.
Unser Beispiel basiert auf offen verfügbaren Quellen. Als Software benutzen wir Apache Solr, D3.js, python, scikit-learn und gensim.
Vorkenntnisse
* Besucher des Vortrags benötigen keine technischen Vorkenntnisse.
* Verständnis von UGC, Social Media, Machine Learning bzw. künstliche Intelligenz ist hilfreich.
Lernziele
* Technisch Interessierte verstehen den Prozess zur UGC-Analyse und können den Ansatz für sich selbst adaptieren.
* Teilnehmer mit fachlichem Hintergrund erkennen, wie sie UGC für ihre eigene Arbeit einsetzen können.
* Alle Zuhörer verstehen das heise-Forum mit Netzwerken, Szenarien und Fokuspunkten noch besser.
//
Stephanie Fischer
@S__Fischer
ist Co-Founder der datanizing GmbH und hat einen Abschluss in Betriebswirtschaftslehre von der Hochschule München. Sie verfügt über langjährige Beratungserfahrung im Bereich Big Data/KI, kundenzentrierte Innovation, Lean Startup und Agiles Coaching. Als Product Owner begleitet sie Projekte in den Bereichen Text Mining, Netzwerkanalyse, Forum Analytics und Sentiment Analyse. Sie ist Speaker auf Konferenzen und Autorin von Artikeln zu Big Data/KI.
// Christian Winkler
ist Co-Founder der datanizing GmbH und promovierte an der FAU Erlangen Nürnberg. Er arbeitet seit 20 Jahren in der Softwareentwicklung im Bereich Big Data/KI, insbesondere mit Fokus auf intelligente Algorithmen zur Massendatenverarbeitung im Bereich des maschinellen Lernens, der Geodatenverarbeitung und Statistik. Als Data Scientist und Solution Architect begleitet er Projekte in den Bereichen Text Mining, Netzwerkanalyse, Forum Analytics und Sentiment Analyse. Er ist Speaker auf Konferenzen und Autor von Artikeln zu Big Data/KI.