Internes Wissen in RAG-Systeme integrieren: Vorverarbeitung und Embeddings
Dieser Vortrag behandelt die entscheidenden Schritte beim Vorverarbeiten der Dokumente und der Generierung von Embeddings für RAG-Systeme (Retrieval-Augmented Generation). Wir besprechen Methoden zur Verarbeitung gängiger Dokumententypen wie PDFs und Webseiten, um sie für die Aufnahme in RAG-Pipelines nutzbar zu machen.
Um mit Dokumenten unterschiedlicher Längen arbeiten zu können, werden verschiedene Chunking-Strategien besprochen. Dann werden Embeddings vorgestellt, zusammen mit ihren wichtigsten Eigenschaften im Kontext von Information Retrieval und wie diese dabei helfen, die Antwortqualität des Gesamtsystems zu verbessern.
Der Vortrag betrachtet aktuelle Embedding-Modelle und -Anbieter. Er zeigt, wie man sie vergleichen kann und beleuchtet ihre Anwendungen über RAG hinaus. Die Präsentation schließt mit einem Überblick über Vektordatenbanken, die wesentliche Komponenten für eine effiziente Ähnlichkeitssuche in großen RAG-Systemen sind
Lernziele
Der Vortrag vermittelt denjenigen, die neu im Bereich RAG sind, ein umfassendes Verständnis dafür , wie internes Wissen effektiv für den Einsatz in fortschrittlichen Sprachmodellen und Information Retrieval-Systemen vorbereitet und verfügbar gemacht werden kann.