当前位置：首页 > news >正文

在Python中读取Excel文件

news 2025/12/16 3:31:14

在Python中读取Excel文件，最常用的库是openpyxl（针对.xlsx格式）和xlrd（针对.xls格式，但请注意xlrd从版本2.0开始不再支持.xlsx文件）。

推荐使用openpyxl和pandas则成为了处理.xlsx文件

1、使用`openpyxl`读取`.xlsx`文件

首先，需要安装openpyxl库：

pip install openpyxl

然后，可以使用以下代码读取.xlsx文件：

from openpyxl import load_workbook  # 加载工作簿  
wb = load_workbook(filename='example.xlsx')  # 激活工作表  
sheet = wb.active  # 读取A1单元格的值  
value = sheet['A1'].value  
print(value)  # 遍历所有行  
for row in sheet.iter_rows(values_only=True):  print(row)

2、使用`pandas`读取Excel文件

pandas是一个强大的数据分析和处理库，它也提供了读取Excel文件的功能。首先，需要安装pandas和openpyxl（pandas用于数据处理，openpyxl用于读取.xlsx文件）：

pip install pandas openpyxl

然后，可以使用以下代码读取Excel文件：

import pandas as pd  # 读取Excel文件  
df = pd.read_excel('example.xlsx', engine='openpyxl')  # 显示前几行数据  
print(df.head())  # 访问特定列  
print(df['ColumnName'])

注意：

engine='openpyxl'参数指定了用于读取Excel文件的底层库。pandas支持多种Excel文件读取引擎，但openpyxl是专门用于读取.xlsx（即Excel 2007及以上版本的文件）文件的。

如果不指定engine参数，pandas通常会自动选择适当的引擎来读取文件，但这样可能会出现兼容性问题或错误。