当前位置: 首页 > news >正文

jsoup常用语法功能汇总

这里写目录标题

  • 一、解析HTML字符串或URL获取Document对象
  • 二、使用选择器选择元素
  • 三、提取元素数据
  • 四、遍历元素
  • 五、过滤和提取元素
  • 六、过滤和提取元素

一、解析HTML字符串或URL获取Document对象

Document doc = Jsoup.connect("http://example.com").get();
// 或者
Document doc = Jsoup.parse(htmlString);

二、使用选择器选择元素

Element element = doc.select("div#myId").first(); // 根据ID选择
Elements elements = doc.select("div.myClass"); // 根据类名选择
Elements elements = doc.select("div[title]"); // 选择包含title属性的div

三、提取元素数据

String text = element.text(); // 获取文本内容
String html = element.html(); // 获取HTML内容
String attr = element.attr("href"); // 获取属性值

四、遍历元素

for (Element link : doc.select("a")) {System.out.println(link.attr("href")); // 打印每个链接的href属性
}

五、过滤和提取元素

Elements elements = doc.select("div").filter(new ElementFilter() {public boolean matches(Element elem) {return elem.id().equals("myId");}
});

六、过滤和提取元素

Element parent = element.parent();
Elements children = element.children();
element.appendElement("tagName").attr("key", "value");

http://www.mrgr.cn/news/59599.html

相关文章:

  • 通过企业架构蓝图(EA Blueprint)构建企业数字化转型之路
  • 文件实时备份软件下载
  • 充分统计量
  • MediaGo(m3u8视频下载工具) v3.0.0.5 免费版
  • w~大模型~合集11
  • .net core 读取 appsettings.json 值
  • 基于SSM轻型卡车零部件销售系统的设计
  • 对角两对双差速轮AGV的动力学解算
  • SpringBoot中yaml配置文件中文字符异常以及将多个独立的IDEA项目整合到一个项目里当做模块的处理
  • visual studio断点无法命中
  • 【学术论文投稿】Windows11开发指南:打造卓越应用的必备攻略
  • Oracle 第7章:数据完整性约束
  • 10月27日
  • 【前端面试】Typescript
  • 【遗传算法】基于遗传模拟退火算法的风电功率聚类分析
  • springboot094基于web的酒店客房管理系统(论文+源码)_kaic
  • 利用编程思维做题之计算二叉树最大宽度
  • 《战场车辆及部件损毁识别与评估的神经网络新路径》
  • MirrorMaker2配置后同步数据至目标集群的topic都加上一个源集群别名的前缀A.
  • C++从入门到起飞之——红黑树封装map和set 全方位剖析!