Sie möchten mit Ihrem Team teilnehmen? Ab drei Personen gibt es im Shop automatisch einen Gruppenrabatt.

Liquid Foundation Models - die nächste Generation der LLMs

LLMs sind beeindruckend, können für vielfältige Aufgaben eingesetzt werden und sind doch in der Praxis relativ unpraktisch. Sie sind zu groß, zu unspezifisch, zu wenig nachvollziehbar, zu wenig verlässlich.

Das Konzept erreicht mittlerweile gewisse Grenzen. Zum einen gibt es da einfach nicht genug neue Daten. Oder wie Ilya Sutskever so schön sagte: Es gibt nur ein Internet, und das wurde schon zum Training verwendet. Wie sieht also ein mögliches Upgrade aus, welches idealerweise auch effizienter ist, nicht so viel Strom- und Memory-bedarf hat?

Bühne frei für die LFMs – die Liquid Foundation Models. Sie stellen einen Weg zu neuen Modellarchitekturen jenseits der GPTs – Generative Pretrained Transformers – dar, inspiriert durch den innovativen und extrem ressourceneffizienten Anzahl der Liquid Neural Networks. Sie können unter anderem mit längeren Kontexten umgehen, da sie einen deutlich geringeren eigenen Memory Footprint aufweisen als GPT-basierte LLMs. Dies und einiges mehr, beispielsweise ihre Performance in relevanten Benchmarks oder auch ihre Explainability-Eigenschaften, werden wir in diesem Vortrag untersuchen.

Lernziele

  • Erstes Kennenlernen von Liquid Foundation Models
  • Einstieg in die Konzepte hinter LFMs, wie z.B.
  • Liquid Neural Nets
  • Architekturen, die über GPTs hinausgehen
  • Besonderheiten in Bezug auf Memory Footprint und Explainability
  • Benchmarks, Performance, und ein erster Praxistest

Speaker

 

Stefan Kühn
Stefan Kühn beschäftigt sich seit vielen Jahren mit Data Science, Machine Learning und mathematischer Grundlagenforschung. Nach Stationen bei codecentric, Zalando, XING, Tom Tailor und Snap Inc. fokussiert er sich in seiner jetzigen Rolle als VP Data & AI bei der air up GmbH auf Themen wie Data Strategy und Organisationsentwicklung, sowie das wichtigste Thema von allen – Data Quality. Darüber hinaus interessiert er sich vor allem für innovative Methoden im Kontext von Deep Learning und verantwortet das Datenscouting für den FC St. Pauli.

M3-Newsletter

Ihr möchtet über die Minds Mastering Machines
auf dem Laufenden gehalten werden?

 

Anmelden