Polars的Functions
Functions
- 转换(Transform)
- 示例
- 杂项(Miscellaneous)
- 示例
- 并行化(Parallelization)
- 示例
- 随机(Random)
- 示例
- StringCache
- 示例
Polars的Python API中的Functions
部分包含了一系列的实用函数,这些函数可以帮助用户进行数据转换、并行化操作、随机数据处理以及字符串缓存管理等。以下是Functions
部分的内容概述以及使用示例:
转换(Transform)
转换函数用于修改或转换数据。
chunked
: 将数据分割成指定大小的块。map_binary_expr
: 将一个表达式映射到DataFrame的列上。apply
: 对DataFrame的每个元素应用一个函数。
示例
import polars as pl
# 创建一个简单的DataFrame
df = pl.DataFrame({"a": [1, 2, 3],"b": [4, 5, 6]
})
# 使用apply函数将每个元素增加10
df = df.apply(lambda col: col + 10)
print(df)
杂项(Miscellaneous)
杂项函数提供了额外的数据处理功能。
argsort
: 对DataFrame的列进行排序并返回索引。unique
: 返回DataFrame中唯一值的集合。
示例
# 获取列'b'的唯一值
unique_values = pl.unique(df['b'])
print(unique_values)
并行化(Parallelization)
并行化函数用于在多核处理器上并行执行操作。
threadpool_size
: 设置线程池的大小。
示例
# 设置线程池大小为4
pl.threadpool_size(4)
随机(Random)
随机函数用于生成随机数据。
range
: 生成一个包含指定范围内整数的Series。random
: 生成一个包含随机浮点数的Series。
示例
# 生成一个包含10个随机浮点数的Series
random_series = pl.random(n=10)
print(random_series)
StringCache
字符串缓存函数用于优化字符串处理。
enable_string_cache
: 启用字符串缓存。disable_string_cache
: 禁用字符串缓存。
示例
# 启用字符串缓存
pl.enable_string_cache()
# 执行一些操作...
# 禁用字符串缓存
pl.disable_string_cache()
请注意,这些示例仅展示了Functions
部分的一部分功能。Polars的API可能会随着时间的推移而更新,因此建议查看最新的官方文档以获取最新信息。在编写实际代码时,应确保导入Polars库并使用最新版本的API。