Real-Life GenAI: (M)ein RAG-System, vom Prototyp zu Production Ready
Generative AI ist derzeit in aller Munde. Eine einfache Lösung auf Hello-World-Niveau ist dank passender Frameworks und Libraries schnell aufgesetzt. Aber leider halten diese Lösungen den Anforderungen der Praxis nicht annähernd stand.
Im Rahmen des Workshops bauen wir Schritt für Schritt unsere eigene GenAI-Lösung in Form eines RAG-basierten Systems (Retrieval Augmented Generation) zur Abfrage von domänenspezifischem Fachwissen auf.
Dabei laufen wir bewusst in die eine oder andere Stolperfalle, unterziehen so unsere Lösung einem Reality-Check und nutzen die gewonnenen Erkenntnisse zur Verbesserung unseres Systems.
Am Ende steht ein GenAI-basiertes RAG-System, das ruhigen Gewissens in der Praxis eingesetzt werden kann – und das als integrierte Lösung aka „AI-as-a-Service“ für mehrere Sprachen parallel mit rollenbasierten Zugriffsberechtigungen auf die zugrundeliegenden Daten.
Folgende Aspekte werden wir in Theorie und Praxis im Detail beleuchten:
- GenAI Model Selection & Integration
- Prompt Engineering Best Practices
- Architekturbausteine eines RAG-Systems
- Guardrails zur Absicherung von Eingang und Ausgang
- Optimierung der Ingestion- und Retrieval-Strategien
- LLM Quality Assurance & Laufzeitmetriken
- Real-Life Best Practices & Pitfalls
Vorkenntnisse
Die Teilnehmer des Workshops sollten grundlegende Erfahrung mit GenAI-Lösungen sowie Python/Jupiter-Notebooks (für die Hands-on-Übungen) mitbringen.
Lernziele
Das Lernziel des Workshops ist es, ein GenAI-System über die Grenzen der gängigen Hello-World Tutorials hinaus in der Art aufzubauen, dass es den realen Anforderungen der Praxis stand hält.