Vielen Dank an alle Beteiligten für eine erfolgreiche M3 2024 in Köln! Im Herbst geht es weiter mit M3-Online-Events!

Vektordatenbank-Optimierung: Balance zwischen Speicher, Geschwindigkeit und Genauigkeit

Sprachmodelle wie ChatGPT und Llama 2 sind zunehmend in der Lage, mit unbekannten Informationsquellen zu interagieren – ein Prozess, der häufig durch die Nutzung von Vektordatenbanken ermöglicht wird. Diese Datenbanken stellen eine effektive Lösung dar, um relevante Informationen passend zur Nutzeranfrage zu suchen. Dabei stellt sich jedoch ein klassisches Dilemma: Es muss eine Balance zwischen Speichernutzung, Geschwindigkeit und Genauigkeit gefunden werden.

In diesem Vortrag werden verschiedene Optimierungsstrategien für Vektordatenbanken diskutiert und an Hand der Vektordatenbank Qdrant praktisch implementiert.

Vorkenntnisse

Es ist vorteilhaft, ein grundlegendes Verständnis für Programmiersprachen mitzubringen, da kurze Python-Skripte gezeigt werden.

Lernziele

  • Verständnis der Funktionsweise von Vektordatenbanken und ihrer Rolle in Sprachmodellen wie ChatGPT und Llama 2.
  • Fähigkeit, unterschiedliche Strategien zur Ressourcenoptimierung in Vektordatenbanken zu bewerten und anzuwenden.
  • (Mathematische) Intuition, wie diese Strategien implementiert sind.

Speaker

 

Jan Höllmer
Jan Höllmer ist M. Sc. Wirtschaftsingenieur mit Schwerpunkt Informationstechnik und arbeitet als Data Scientist bei der scieneers GmbH. Im Rahmen von diversen Kundenprojekten beschäftigt er sich momentan mit dem Einsatz von Sprachmodellen innerhalb von Unternehmen und Universitäten.

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden