Große Sprachmodelle – Einführung und Trends
Fast jeder verwendet heute große Sprachmodelle, als ob sie etwas ganz Natürliches sind. Doch die dahinter liegende Technologie ist komplex.
Dieser Vortrag erklärt zunächst die Grundlagen und die damit verbundenen Schwierigkeiten. Viele dieser Herausforderungen wurden durch immer neue Modellarchitekturen und Trainingsmethoden bewältigt. In einer unglaublichen Geschwindigkeit erscheinen neue Modelle.
Im zweiten Teil konzentriert sich der Vortrag auf diese neuen Entwicklungen und hebt dabei sowohl technische als auch methodische Verbesserungen hervor.
Schließlich werden einige besonders innovative Modelle vorgestellt. Besonders interessant sind in diesem Zusammenhang offene Modelle, da man diese (selbst mit moderatem Hardwareeinsatz) selbst betreiben und feintunen kann.