Sie möchten mit Ihrem Team teilnehmen? Ab drei Personen gibt es im Shop automatisch einen Gruppenrabatt.

Effizientes Retrieval in RAG-Systemen: Methoden, Optimierungen und Best Practices

In diesem Vortrag beleuchten wir den Retrieval-Schritt von Retrieval-Augmented Generation (RAG), der relevante Informationen aus großen Datenquellen extrahiert und dem Sprachmodell für präzise und korrekte Antworten zur Verfügung stellt. Wir zeigen, wie das Retrieval mithilfe von sparse Methoden wie BM25, dense Methoden wie Embeddings oder einer Kombination aus beiden Ansätzen als hybride Suche erfolgen kann.

Wir diskutieren gängige Post-Retrieval-Techniken wie Reranking oder Corrective Retrieval, um die Dokumente basierend auf deren Relevanz zu ordnen und filtern. Darüber hinaus zeigen wir State-of-the-Art-Optimierungstechniken, darunter die Verbesserung von Suchanfragen über Query-Rewriting, Graph Search für das Einbeziehen von Strukturinformationen sowie Self-Query Retrieval, um anhand automatisch generierter Folgefragen oder zusätzlichen Agenten die Suchanfrage zu erweitern.

Schließlich thematisieren wir die Evaluierung von Retrieval-Systemen und stellen Methoden vor, mit denen Datensätze automatisch generiert werden können, um ein robustes Benchmarking zu ermöglichen. Anhand praktischer Erkenntnisse aus verschiedenen Anwendungsfällen zeigen wir, wie verschiedene Retrieval-Strategien und einfache Evaluationsmethoden zum Erfolg von RAG-Systemen beitragen.

Speaker

 

Alina Dallmann
Alina Dallmann ist Informatikerin und arbeitet als Data Scientist bei der scieneers GmbH. Ihre Begeisterung für klassische Softwareentwicklung und datengetriebene Projekte konnte sie zuletzt in verschiedenen Projekten zum Aufbau von RAG-Systemen ideal verbinden.

Arne Grobrügge
Arne Grobrügge ist M. Sc. Wirtschaftsinformatiker mit Schwerpunkt Maschinelles Lernen und Informationssicherheit und arbeitet als Data Scientist bei der scieneers GmbH. Im Rahmen von Kundenprojekten entwickelt und überwacht er den Einsatz von Sprachmodellen in Unternehmen, um innovative und wertschöpfende Lösungen zu schaffen.

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden