当前位置: 首页 > news >正文

python爬虫案例——处理验证码登录网站(12)

文章目录

  • 前言
  • 1、任务目标
  • 2、网页分析
  • 3、代码编写

前言

我们在爬取某些网站数据时,可能会遇到必须登陆才能获取网页内容的情况,而大部分网站登录都需要输入验证码才能登录成功,所以接下来我将会通过实际案例来讲解如何实现验证码登录网站

1、任务目标

目标站点:中文古诗网(https://www.gushiwen.cn/)
要求:利用爬虫实现验证码登录该网站

2、网页分析

  1. 打开网站,进入 我的,来到登陆页面,可以看到登录网站需要:账号、密码、验证码
    在这里插入图片描述

  2. 打开开发者模式,随意输入一个错误的账号,跳转到登陆接口,在 Network-Doc 下发现一个login开头的接口,发现其需要携带以下参数,其中就有email、password、code,分别对应账号、密码、验证码;并且该接口是一个post请求,由此可知该接口


http://www.mrgr.cn/news/44322.html

相关文章:

  • Renesas R7FA8D1BH (Cortex®-M85)和蓝牙模块通信
  • 【量子计算】开辟全新计算范式
  • Crypto虐狗记---”你“和小鱼(外传)
  • 使用STM32单片机实现无人机控制系统
  • Python入门--数据容器
  • Python类和子类的小示例:建模农场
  • 遥感滑坡目标检测数据集 2300张 滑坡 带标注 voc yolo 1类
  • 如何通过 Alt 键打出所有特殊字符?
  • Java重修笔记 第六十一天 坦克大战(十一)IO 流 - 节点流和处理流、BufferedReader 和 BufferedWriter
  • [C++][第三方库][Websocket]详细讲解
  • 河网结构指标对应的英文名称
  • Crypto虐狗记---”你“和小鱼(六)
  • NRF52832
  • 调试意义、步骤及方式
  • 在Ubuntu 16.04上使用Logrotate管理日志文件
  • 通信工程学习:什么是IOT物联网
  • scipy.stats.nakagami简介
  • 智能制造领域的系统都有啥,MES、APS、PLC、SCADA等
  • import torch报错问题:OSError: [WinError 126] 找不到指定的模块。
  • rocketmq