当前位置: 首页 > news >正文

打卡学习Python爬虫第二天|Web请求过程刨析

一、服务器渲染

服务器端渲染(Server-Side Rendering,简称SSR)是一种网页渲染技术。在这种技术中,服务器在接收到客户端的请求后,会生成页面的初始HTML内容,并将其发送给客户端。客户端浏览器接收到这些HTML内容后,直接进行解析和渲染,呈现给用户。这种模式下,页面的大部分内容在服务器端已经渲染完成,因此页面加载速度相对较快,并且对搜索引擎友好。但是,交互式的内容和功能需要等待客户端的JavaScript代码执行完成后才能实现。

流程如图: 

百度搜索科比,得到相关内容: 

查看该页面的源代码:

 

直接在网页的HTML代码中可以找到相同的内容! 在服务器上直接把数据和HTML整合在一起,统一返回浏览器就是服务器渲染。页面源代码中有数据。

二、客户端渲染 

客户端渲染(Client-Side Rendering,简称CSR)是网页渲染的另一种常见模式。在这种模式下,服务器主要负责返回一个基本的HTML页面结构以及必要的JavaScript和CSS文件。客户端的浏览器通过执行这些JavaScript代码来请求数据,并根据数据动态生成页面内容。 

客户端渲染在第一次请求时只得到一个HTML骨架和必要的Js和CSS ,第二次请求才能拿到数据,进行数据展示,在页面源代码中看不到数据。

 问题来了,HTML页面中没有数据,那么第二次请求要怎么去得到数据呢?

使用浏览器抓包工具

1、在相应的页面按F12或者右键-->检查

2、点击网络后,按Ctrl+R刷新页面

 找到第一次请求的url,预览看效果:

我们会发现只有简单的骨架,并没有我们需要的数据: 

3、继续往下,直到找到数据

 这时候点击标头就能得到我们需要的url:

将这个url复制到浏览器搜索,我们就能看到一个标准的json类型的数据:


http://www.mrgr.cn/news/4765.html

相关文章:

  • 【jvm】栈和堆的区别
  • 编译linux内核时,让版本号不跟着git变化
  • c#中Task.Run 和使用 Task 构造函数创建任务的区别
  • PhpStorm环境配置与应用
  • (秋招复习)自动驾驶与机器人中的SLAM技术(三)
  • rust操作rabbitmq
  • Notion使用详解
  • EmguCV学习笔记 VB.Net 2.S 特别示例
  • 【Python】Pydantic:快速上手
  • 【与C++的邂逅】--- 类和对象(中)
  • Web客户端软件测试
  • 通过剪枝与知识蒸馏优化大型语言模型:NVIDIA在Llama 3.1模型上的实践与创新
  • 供应链技术
  • 动态规划篇-代码随想录算法训练营第三十六天l 279.完全平方数,139.单词拆分,多重背包问题
  • 博物馆地图导览:利用GIS与蓝牙定位技术,融合语音解说功能
  • 软考-软件设计师(程序设计语言习题)
  • C# 程序运行内存优化的点
  • 【iOS】——响应者链和事件传递链
  • ES6解构赋值详解;全面掌握:JavaScript解构赋值的终极指南
  • Ubuntu 下 通过 Docker 部署 Vaultwarden 服务器