Polars简介
Polars 介绍
Polars 是一个用 Rust 编写的数据帧库,使用 Arrow 作为其底层数据结构。它旨在提供快速的 DataFrame 操作,并通过表达式语法支持查询优化和执行。
目标与非目标
Polars 的目标是通过并行化 DataFrame 上的查询,提供一个快速的解决方案。它通过减少冗余拷贝、高效遍历内存缓存和最小化并行中的争用来实现这一目标。Polars 还提供了强大的表达式语法,支持查询优化。
性能
Polars 的性能非常快,是目前性能最佳的解决方案之一。它通过优化器和执行器在运行时动态并行化计算,提高性能和内存效率。
当前状态
Polars 支持以下功能:
- Copy-on-write (COW) 语义学
- 面向列的数据存储
- 高效的算法
- 快速的 IO 操作
- 查询优化,包括谓词下推、投影下推、聚合下推等
- SIMD 矢量化
这些功能共同作用,使 Polars 成为一个高效、快速且易于使用的 DataFrame 库。
更多详细信息和高级用法,请访问Polars 官方文档。