当前位置: 首页 > news >正文

python实战三-提取Word数据到Excel

视频+源码:
链接:https://pan.quark.cn/s/83db5bb15383

一个文件夹下有大量会议通知文件,为word文件,文件格式都是一致的,现在要将文件中的一些字段提取出来汇总到Excel文件中。
会议通知文件格式如下:

要提取学习时间、学习内容、学习形式、主持人汇总到 会议汇总.xlsx 中,每新增一条记录序号加1

Excel表格式如下:

代码如下:

from docx import Document
from openpyxl import load_workbook
import globdef 提取数据汇总(file_dir):tempfile = file_dir + r'\汇总模版.xlsx'workbook = load_workbook(tempfile)  # 打开模板文件sheet = workbook.activenumber = 1  # 计数docFiles = glob.glob(file_dir + r'\*.docx')  # 筛选出指定文件下所有.docx后缀文件for file in docFiles:print(file)doc = Document(file)contentList = []  # 学习内容studyTime = ''  # 学习时间studyType = ''  # 学习形式host = ''  # 主持人for paragraph in doc.paragraphs:if paragraph.text[2:7] == '学习时间:':studyTime = paragraph.text[7:]if paragraph.text[2:6] == '主持人:':host = paragraph.text[6:]if paragraph.text[2:7] == '学习形式:':studyType = paragraph.text[7:]if len(paragraph.text) >= 2:if paragraph.text[0].isdigit() and paragraph.text[1] == '、':contentList.append(paragraph.text)content = ' '.join(contentList)  # 列表转化为字符串sheet.append([number, studyTime, content, studyType, host])number += 1workbook.save(file_dir + r'\会议汇总.xlsx')if __name__ == '__main__':提取数据汇总(r'D:\自动化')

很简单自己创建 几个word试试吧:

关于党委理论学习中心组

2021 年第一次学习会的通知

公司党委领导班子成员:

定于3月1日组织公司党委理论学习中心组2021年第一次学习会,现将有

关事项通知如下:

一、学习时间:2021年3月10日下午4:00.

二、学习地点:5楼会议室,

三、参加人员:公司领导班子成员

四、主持人:李 XX。

五、学习形式:集中学习。I

六、学习内容:

                 1、2022谢谢小星星

                 2、生的点点滴滴

七、相关要求:

1.学习资料提前发给与会人员,请与会人员做好学习及发言准备;

2.请与会人员妥善安排工作,准时参加,学习时间如有变

运行结果: 


http://www.mrgr.cn/news/16625.html

相关文章:

  • opencv之图像平滑处理
  • 如何将线程绑定到特定的CPU核
  • PMP错题总结(十六)
  • ElementPlus下拉框实现可选择,可输入
  • Llamaindex RAG实践
  • 世界上装机量最大的数据库SQLite,低调但不小众
  • 【代码随想录训练营第42期 Day45打卡 - 编辑距离问题 - LeetCode 115.不同的子序列 583. 两个字符串的删除操作 72. 编辑距离
  • unbuntu 安装
  • Java多进程调用dll程序和exe程序
  • python 天气与股票的关系--第2部分,清洗数据
  • 基于yolov8的人头计数检测系统python源码+onnx模型+评估指标曲线+精美GUI界面
  • 求解组合优化问题的具有递归特征的无监督图神经网络
  • 【QNX+Android虚拟化方案】117 - QNX 以太网 iperf3 上行带宽吞吐量低的问题分析优化
  • 操作符详细解析
  • YOLOv9改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络
  • 数学建模--K-Means聚类分析
  • LMDeploy 量化部署实践闯关任务
  • Lagent 自定义 Agent 智能体
  • 从智慧城市与代理IP看未来科技与个人隐私间的微妙平衡
  • [合集]一汽大众(斯柯达、奥迪、兰博基尼、宾利等)故障代码查询合集