Eine Einführung in Polars von einem Pandas-Fan
Pandas ist der De-facto-Standard für Datenmanipulation in Python, den ich persönlich wegen seiner flexiblen Syntax und Interoperabilität liebe. Aber Pandas hat bekannte Probleme wie mangelnde Speichereffizienz, inkonsistente Behandlung fehlender Daten und fehlende Multicore-Unterstützung. Mehrere Open-Source-Projekte versuchen, diese Probleme zu lösen. Das interessanteste ist Polars.
Polars nutzt Rust und Apache Arrow, um in allen Arten von Performance-Benchmarks zu gewinnen und entwickelt sich schnell weiter. Aber ist es bereits stabil genug, um eine bestehende Pandas Codebasis zu verarbeiten. Und erfüllt es die hohen Erwartungen von langjährigen Pandas-Liebhabern an die Flexibilität der Abfragesprache?
Vorkenntnisse
Solide Erfahrung im Umgang mit Pandas
Lernziele
In diesem Vortrag werde ich meine Erkenntnisse zur Migration von bestehendem Code von Pandas nach Polars vorstellen und einen Migrationsleitfaden für Pandas-Benutzer anbieten.