当前位置：首页 > news >正文

【页面提取】将搜索到的内容进行截屏保存，搜索到的标题及链接输出到电子表格

news 2026/2/15 13:06:11

一、需求

将百度搜索到的内容进行截屏保存，并提取前五页搜索到的标题及链接，输出到电子表格

二、截图内容

三、代码实现

这段代码主要是使用 DrissionPage  库来实现对百度搜索页面的操作，并获取搜索结果中的标题和链接，将其存储在列表中，然后转换为 DataFrame  并保存为 Excel 文件。

以下是对代码的逐步分析：

1. 导入所需的库和模块，包括 ChromiumPage 、 ChromiumOptions  和 pandas 。
2. 设置了 Chrome 浏览器的路径。
3. 创建 ChromiumPage  对象，并访问百度首页。
4. 在搜索框中输入文本并点击搜索按钮。
5. 创建一个空列表 list  用于存储结果。
6. 通过循环获取 5 页的搜索结果：
- 等待 2 秒。
- 截取当前页面的全屏截图并保存。
- 遍历所有的 h3  元素，获取每个元素中的标题和链接，并将其存储在字典中，然后添加到列表中。
- 将列表转换为 DataFrame  并保存为 Excel 文件。
- 打印每个标题和链接。
- 点击“下一页”按钮，并等待页面加载开始。

from DrissionPage import ChromiumPage,ChromiumOptions
import pandas as pd
#ch

查看全文

http://www.mrgr.cn/news/1936.html

探索 Resolume Arena 7 - 引领 VJ 音视频创作的卓越软件

【AI学习】LLaMA模型的微调成本有几何？

spark client mode cluster mode 区别与选择

C#中的S7协议

python_tutorials_t1,print input操作

JMeter常见的高频面试题整理

【前缀和算法】--- 一维和二维前缀和模板

jenkins 发布镜像清理

LLM才硬件（显存）需求

《AI视频类工具之十六—— Apple Motion》

Vue UI 组件库

【Redis】数据类型详解及其应用场景

修改Patroni ttl和retry_timeout

探索AWS免费资源:无账号也能体验云计算魅力

python3 pip install psutil

网络工作原理

相关文章：