在Python中读取Excel文件
在Python中读取Excel文件,最常用的库是openpyxl
(针对.xlsx
格式)和xlrd
(针对.xls
格式,但请注意xlrd
从版本2.0开始不再支持.xlsx
文件)。
推荐使用openpyxl
和pandas
则成为了处理.xlsx
文件
1、使用openpyxl
读取.xlsx
文件
首先,需要安装openpyxl
库:
pip install openpyxl
然后,可以使用以下代码读取.xlsx
文件:
from openpyxl import load_workbook # 加载工作簿
wb = load_workbook(filename='example.xlsx') # 激活工作表
sheet = wb.active # 读取A1单元格的值
value = sheet['A1'].value
print(value) # 遍历所有行
for row in sheet.iter_rows(values_only=True): print(row)
2、使用pandas
读取Excel文件
pandas
是一个强大的数据分析和处理库,它也提供了读取Excel文件的功能。首先,需要安装pandas
和openpyxl
(pandas
用于数据处理,openpyxl
用于读取.xlsx
文件):
pip install pandas openpyxl
然后,可以使用以下代码读取Excel文件:
import pandas as pd # 读取Excel文件
df = pd.read_excel('example.xlsx', engine='openpyxl') # 显示前几行数据
print(df.head()) # 访问特定列
print(df['ColumnName'])
注意:
engine='openpyxl'
参数指定了用于读取Excel文件的底层库。pandas
支持多种Excel文件读取引擎,但openpyxl
是专门用于读取.xlsx
(即Excel 2007及以上版本的文件)文件的。
如果不指定engine
参数,pandas
通常会自动选择适当的引擎来读取文件,但这样可能会出现兼容性问题或错误。
3、注意
使用pandas
读取Excel文件的好处在于,它提供了丰富的数据处理功能,如数据清洗、筛选、分组等。
因此,如果只是需要读取Excel文件并对其进行简单的操作(如获取单元格值),openpyxl
可能就足够了。但如果需要进行复杂的数据分析或处理,选pandas
更好。