【Pandas】pandas DataFrame select_dtypes
Pandas2.2 DataFrame
Attributes and underlying data
| 方法 | 描述 |
|---|---|
| DataFrame.index | 用于获取 DataFrame 的行索引 |
| DataFrame.columns | 用于获取 DataFrame 的列标签 |
| DataFrame.dtypes | 用于获取 DataFrame 中每一列的数据类型 |
| DataFrame.info([verbose, buf, max_cols, …]) | 用于提供 DataFrame 的简要概述 |
| DataFrame.select_dtypes([include, exclude]) | 用于根据数据类型选择 DataFrame 中的列 |
pandas.DataFrame.select_dtypes
pandas.DataFrame.select_dtypes 是一个非常有用的函数,用于根据数据类型选择 DataFrame 中的列。通过指定 include 和 exclude 参数,可以选择包含或排除特定数据类型的列。
参数说明
- include: 可以是单个字符串或字符串列表,表示要包含的数据类型。
- exclude: 可以是单个字符串或字符串列表,表示要排除的数据类型。
数据类型字符串
以下是一些常用的数据类型字符串:
'object': 字符串'number': 数值类型(整数和浮点数)'float': 浮点数'int': 整数'bool': 布尔值'datetime64': 日期时间'timedelta[ns]': 时间差'category': 类别数据
示例
假设有一个 DataFrame 如下:
import pandas as pddata = {'A': [1, 2, 3],'B': [1.1, 2.2, 3.3],'C': ['x', 'y', 'z'],'D': [True, False, True]
}df = pd.DataFrame(data)
示例1:选择所有数值类型的列
df.select_dtypes(include=['number'])
结果:
A B
0 1 1.1
1 2 2.2
2 3 3.3
示例2:选择所有整数类型的列
df.select_dtypes(include=['int'])
结果:
A
0 1
1 2
2 3
示例3:排除布尔类型的列
df.select_dtypes(exclude=['bool'])
结果:
A B C
0 1 1.1 x
1 2 2.2 y
2 3 3.3 z
示例4:选择所有字符串和浮点类型的列
df.select_dtypes(include=['object', 'float'])
结果:
B C
0 1.1 x
1 2.2 y
2 3.3 z
通过这些示例,你可以看到 select_dtypes 函数如何帮助你根据数据类型选择 DataFrame 中的列。
