Dem User die relevantesten Ergebnisse zu präsentieren, ist das Ziel einer jeden Suchapplikation. Mittels Feldgewichten, Synonymen, Boostfunktionen die Relevanz zu optimieren ist über Branchen hinweg weit verbreitet. Weniger verbreitet, aber extrem mächtig ist eine Herangehensweise namens Learning to Rank (LTR). Mit ihrem Ursprung im Information Retrieval beschreibt sie, wie Machine Learning die Relevanz von Suchapplikationen verbessern kann.
Dieser Vortrag erläutert die Motivation hinter Relevanztuning, die traditionellen Methoden und deren Grenzen und zeigt, wie LTR einige dieser Grenzen meistert. Eine Demo basierend auf einer Filmdatenbank wird zeigen, wie LTR in Solr eingesetzt werden kann.
Vorkenntnisse
Vorkenntnisse im Bereich Suchmaschinen und/oder Information Retrieval, insbesondere wie Scoring und die Berechnung von Relevanzwerten funktionieren, sind hilfreich, aber nicht notwendig.
Lernziele
Der Vortrag soll auf anschauliche Art und Weise – illustriert mit einer Demo auf Basis von Daten einer Filmdatenbank – vermitteln, wann Relevanztuning auch eine Aufgabe für Machine Learning sein kann und welche Möglichkeiten ihm mit der Open-Source-Suchtechnologie Solr zur Verfügung stehen.
//
Daniel Wrigley
@wrigley_dan
ist seit 2012 als Search & Big Data Consultant bei SHI tätig. Dort beschäftigt er sich meist mit Search- und Big-Data-Anwendungen unter Verwendung moderner Open-Source-Technologien wie Solr, NiFi oder Zeppelin. Seine jahrelange Erfahrung als Solr Trainer hat er als Co-Autor des ersten deutschsprachigen Buch zu Solr verarbeitet.