当前位置: 首页 > news >正文

打卡学习Python爬虫第二天|HTTP协议

什么是HTTP协议?

协议:两个计算机之间为了能够进行流畅的沟通而设置的一个君子协议,常见的协议有TCP/IP、SOAP协议,HTTP协议,SMTP协议等......

HTTP协议:Hyper Text Transfer Protocol(超文本传输协议),是用于从万维网(WWW:World Wide Web)服务器传输超文本到本地浏览器的传输协议。浏览器与服务器之间的数据交互遵守的就是HTTP协议。

HTTP协议将一条消息分为三大内容,无论是请求还是响应都是这三个内容:

请求:

请求行 --> 请求方式(get/post)  请求url地址  协议                                                                         

请求头 --> 一些服务器要使用的附加信息                                                                                       

请求体 --> 一般放一些请求参数

响应:

状态行 --> 协议  状态码   200为正常                                                                                                 

响应头 --> 一些客户端要使用的一些附加信息 (数据加密,密钥等)                                             

响应体 --> 服务器返回真正的用户端要用的内容(HTML,json)等

请求头内容如图:

请求头中最常见的一些重要内容(爬虫需要):

1、User-Agent:请求载体的身份标识(我们的电脑信息,所用的浏览器等)

2、Referer:防盗链(这次请求是从哪个页面来的?反爬会用到)                                                   

3、cookie:本地字符串数据信息(用户登录信息,反爬的token)

响应头内容:

  响应头中的重要内容:

1、cookie:本地字符串数据信息(用户登录信息,反爬的token)                                                   

2、各种字符串(一般是token字样,防止各种攻击和反爬)

请求方式:

GET:显示提交

POST: 隐式提交


http://www.mrgr.cn/news/2282.html

相关文章:

  • Linux驱动入门实验班——步进电机模块驱动(附百问网视频链接)
  • QT-计算器
  • 数据结构(6_2_3)——十字链表法和多重领接表
  • 32位入门级MCU(ARM Cortex-M3内核)STM32F103系列
  • 计算机基础知识复习8.14
  • 4款AI 生成 PPT的工具,帮你赶上演示文稿的新趋势!
  • HTML静态网页成品作业(HTML+CSS)——花主题介绍网页设计制作(1个页面)
  • Tomcat 部署与优化
  • 探索生成式AI在文档处理中的应用:llm Whisperer
  • 数字媒体产业发展现状剖析,洞悉数字产业园的创新之举
  • HCIP | 三层架构
  • 如何在HTML中创建链接?什么是CSS定位?什么是CSS优化?
  • JavaScript语法基础之流程结构(顺序、选择、循环结构)
  • XXX【5】观察者模式
  • 你是如何克服编程学习中的挫折感的?(-@-^-0-)
  • 数学建模预测类—【多元线性回归】
  • C# 不一样的洗牌算法---Simd指令
  • 只用一个 HTML 元素可以写出多少形状?——伪元素篇(上)
  • 微服务架构
  • 网易云音乐崩了!冲上热搜第一