Polars 的 Series
Series
- 聚合 (Aggregation)
- 数组操作 (Array Operations)
- 布尔值 (Boolean)
- 类别 (Categorical)
- 计算 (Computations)
- 描述性 (Descriptive)
- 导出 (Export)
- 列表操作 (List Operations)
- 选择 (Selection)
- 操作 (Operations)
- 杂项 (Miscellaneous)
- Operators
- Plot
- String
- 使用例子
Series是Polars库中的基本数据结构之一,用于表示一维数组。以下是对Series内容的详细描述,包括使用例子:
聚合 (Aggregation)
sum()
: 计算所有值的总和。mean()
: 计算平均值。max()
: 找到最大值。min()
: 找到最小值。count()
: 计算非空值的数量。
数组操作 (Array Operations)
arr.concat()
: 连接两个Series。arr.slice()
: 对Series进行切片。
布尔值 (Boolean)
is_null()
: 检查值是否为空。is_not_null()
: 检查值是否非空。
类别 (Categorical)
cat.set_ordering()
: 设置分类顺序。cat.get_categories()
: 获取分类类别。
计算 (Computations)
apply()
: 对每个元素应用一个函数。round()
: 四舍五入。
描述性 (Descriptive)
describe()
: 提供Series的描述性统计信息。
导出 (Export)
to_arrow()
: 将Series转换为Arrow数组。to_pandas()
: 将Series转换为Pandas Series。
列表操作 (List Operations)
list.get()
: 获取列表中的元素。list.concat()
: 连接列表。
选择 (Selection)
filter()
: 根据条件过滤元素。slice()
: 对Series进行切片。
操作 (Operations)
fill_null()
: 填充空值。drop_nulls()
: 删除空值。
杂项 (Miscellaneous)
alias()
: 给Series一个别名。
Operators
+
,-
,*
,/
: 算术运算符。
Plot
plot()
: 绘制Series的图表。
String
str.contains()
: 检查字符串是否包含子串。str.slice()
: 对字符串进行切片。
使用例子
以下是一些使用Series的基本例子:
import polars as pl
# 创建一个Series
s = pl.Series("ages", [25, 30, 35, None])
# 聚合操作
total_age = s.sum()
average_age = s.mean()
# 数组操作
sliced_ages = s.slice(1, 3)
# 布尔值操作
null_ages = s.is_null()
# 类别操作
categories = pl.Series("categories", ["A", "B", "A", "C"]).cast(pl.Categorical)
ordered_categories = categories.cat.set_ordering("B", "A", "C")
# 计算操作
rounded_ages = s.round(0)
# 描述性统计
description = s.describe()
# 导出操作
arrow_array = s.to_arrow()
pandas_series = s.to_pandas()
# 列表操作
list_series = pl.Series("list_of_ints", [[1, 2], [3, 4], [5, 6]])
first_elements = list_series.list.get(0)
# 选择操作
filtered_ages = s.filter(s > 30)
# 操作
filled_ages = s.fill_null(0)
# 杂项
aliased_ages = s.alias("age")
# 算术运算符
doubled_ages = s * 2
# 字符串操作
string_series = pl.Series("names", ["Alice", "Bob", "Charlie"])
contains_b = string_series.str.contains("b")
# 输出结果
print(f"Total Age: {total_age}")
print(f"Average Age: {average_age}")
print(f"Sliced Ages: {sliced_ages}")
print(f"Null Ages: {null_ages}")
print(f"Ordered Categories: {ordered_categories}")
print(f"Rounded Ages: {rounded_ages}")
print(f"Description: {description}")
print(f"Arrow Array: {arrow_array}")
print(f"Pandas Series: {pandas_series}")
print(f"First Elements: {first_elements}")
print(f"Filtered Ages: {filtered_ages}")
print(f"Filled Ages: {filled_ages}")
print(f"Aliased Ages: {aliased_ages}")
print(f"Doubled Ages: {doubled_ages}")
print(f"Contains 'b': {contains_b}")
这些例子展示了如何使用Series进行各种操作,包括聚合、数组操作、布尔值处理、类别处理、计算、描述性统计、导出、列表操作、选择、填充空值、别名设置、算术运算和字符串操作。通过这些操作,可以有效地处理和分析一维数据。