当前位置: 首页 > news >正文

在Python中读取Excel文件

在Python中读取Excel文件,最常用的库是openpyxl(针对.xlsx格式)和xlrd(针对.xls格式,但请注意xlrd从版本2.0开始不再支持.xlsx文件)。

推荐使用openpyxlpandas则成为了处理.xlsx文件

1、使用openpyxl读取.xlsx文件

首先,需要安装openpyxl库:

pip install openpyxl

 

然后,可以使用以下代码读取.xlsx文件:

from openpyxl import load_workbook  # 加载工作簿  
wb = load_workbook(filename='example.xlsx')  # 激活工作表  
sheet = wb.active  # 读取A1单元格的值  
value = sheet['A1'].value  
print(value)  # 遍历所有行  
for row in sheet.iter_rows(values_only=True):  print(row)

 

2、使用pandas读取Excel文件

pandas是一个强大的数据分析和处理库,它也提供了读取Excel文件的功能。首先,需要安装pandasopenpyxlpandas用于数据处理,openpyxl用于读取.xlsx文件):

pip install pandas openpyxl

 

然后,可以使用以下代码读取Excel文件:

import pandas as pd  # 读取Excel文件  
df = pd.read_excel('example.xlsx', engine='openpyxl')  # 显示前几行数据  
print(df.head())  # 访问特定列  
print(df['ColumnName'])

注意:

engine='openpyxl'参数指定了用于读取Excel文件的底层库。pandas支持多种Excel文件读取引擎,但openpyxl是专门用于读取.xlsx(即Excel 2007及以上版本的文件)文件的。

如果不指定engine参数,pandas通常会自动选择适当的引擎来读取文件,但这样可能会出现兼容性问题或错误。

 

3、注意

使用pandas读取Excel文件的好处在于,它提供了丰富的数据处理功能,如数据清洗、筛选、分组等。

因此,如果只是需要读取Excel文件并对其进行简单的操作(如获取单元格值),openpyxl可能就足够了。但如果需要进行复杂的数据分析或处理,选pandas更好。

 


http://www.mrgr.cn/news/22162.html

相关文章:

  • PAT甲级-1085 Perfect Sequence
  • Linux下的PWM驱动
  • C++万字解析类和对象(上)
  • 面试真题 | 记录一次面试真题
  • 「iOS学习」——Masonry学习
  • 如何解决缓存(redis)和数据库(MySQL)数据不一致的问题?
  • 衡石分析平台使用手册-快速入门
  • 长短期记忆神经网络-LSTM回归预测-MATLAB代码实现
  • 一名优秀的工程师应该学会在工作中提升自己,面试篇
  • matlab读取NC文件(含group)
  • vulhub远程执行命令漏洞CVE-2022-22963
  • SprinBoot+Vue校园数字化图书馆系统的设计与实现
  • Vulhub Apache Airflow (CVE-2020-11978)
  • QML入门之创建可重用的组件(一)
  • 828华为云征文|Flexus X实例C#/.Net Core 结合(git代码管理、docker自定义镜像)快速发布部署-让你的项目飞起来~
  • 【微前端记录】微前端qiankun初体验
  • 面试字节视觉大模型算法岗,太难了。。。
  • Linux在桌面上创建软件启动快捷方式
  • systemverilog如何用一行code输出两个队列在可变范围内的对比结果
  • 【大数据算法】一文掌握大数据算法之:空间亚线性算法。