当前位置: 首页 > news >正文

【页面提取】将搜索到的内容进行截屏保存,搜索到的标题及链接输出到电子表格

一、需求

将百度搜索到的内容进行截屏保存,并提取前五页搜索到的标题及链接,输出到电子表格

二、截图内容

三、代码实现

这段代码主要是使用  DrissionPage  库来实现对百度搜索页面的操作,并获取搜索结果中的标题和链接,将其存储在列表中,然后转换为  DataFrame  并保存为 Excel 文件。
 
以下是对代码的逐步分析:
 
1. 导入所需的库和模块,包括  ChromiumPage 、 ChromiumOptions  和  pandas 。
2. 设置了 Chrome 浏览器的路径。
3. 创建  ChromiumPage  对象,并访问百度首页。
4. 在搜索框中输入文本并点击搜索按钮。
5. 创建一个空列表  list  用于存储结果。
6. 通过循环获取 5 页的搜索结果:
- 等待 2 秒。
- 截取当前页面的全屏截图并保存。
- 遍历所有的  h3  元素,获取每个元素中的标题和链接,并将其存储在字典中,然后添加到列表中。
- 将列表转换为  DataFrame  并保存为 Excel 文件。
- 打印每个标题和链接。
- 点击“下一页”按钮,并等待页面加载开始。

from DrissionPage import ChromiumPage,ChromiumOptions
import pandas as pd
#ch

http://www.mrgr.cn/news/1936.html

相关文章:

  • 探索 Resolume Arena 7 - 引领 VJ 音视频创作的卓越软件
  • 【AI学习】LLaMA模型的微调成本有几何?
  • spark client mode cluster mode 区别 与选择
  • C#中的S7协议
  • python_tutorials_t1,print input操作
  • JMeter常见的高频面试题整理
  • 【前缀和算法】--- 一维和二维前缀和模板
  • jenkins 发布镜像清理
  • LLM才硬件(显存)需求
  • 《AI视频类工具之十六——​ Apple Motion》
  • Vue UI 组件库
  • 【Redis】数据类型详解及其应用场景
  • 修改Patroni ttl和retry_timeout
  • 探索AWS免费资源:无账号也能体验云计算魅力
  • 微信小程序 request请求 本地存储
  • 基于STM32开发的智能电能监测系统
  • conda版本与源码版本中的cpp不同
  • [SDK]-键盘消息和鼠标消息
  • python3 pip install psutil
  • 网络工作原理