当前位置: 首页 > news >正文

爬虫解析:python如何判断requests库请求返回的是json还是html还是其他? - 指南

爬虫解析:python如何判断requests库请求返回的是json还是html还是其他? - 指南

更多内容请见: 《爬虫和逆向教程》 - 专栏介绍和目录

文章目录

    • 一、检查 `Content-Type` 响应头(最推荐)
      • 1.1 核心步骤
      • 1.2 验证代码
      • 1.3 输出结果
    • 二、利用 `requests` 的内置方法
      • 2.1 方法对比
      • 2.2 验证代码(尝试法):
    • 三、封装成实用函数
      • 3.1 自动处理内容类型方法封装
      • 3.2 解析html并捕获异常

一、检查 Content-Type 响应头(最推荐)

要判断 requests 库返回的内容类型,最可靠、最标准的方法是检查 HTTP 响应头中的 Content-Type字段。服务器会在响应头中明确告知客户端返回的数据是什么类型。

1.1 核心步骤

  1. 发送请求后,通过 response.headers 获取响应头字典。
  2. 访问 response.headers.get('Content-Type', '') 来获取 Content-Type 的值。使用 .get() 并提供默认值可以避免因该字段不存在而报错。
  3. 使用字符串的 in 操作符来判断类型。

1.2 验证代码

import requests
# 示例URLs
json_url = 'https://api.github.com/ev
http://www.jsqmd.com/news/269609/

相关文章:

  • 2026年AI市场支出预计增长44%至2.52万亿美元
  • 企业引入智能体开发服务,到底有什么实实在在的好处?
  • 企业草坪理论:数据如何成为自主商业增长的养分
  • 微信小程序毕设项目:(源码+文档,讲解、调试运行,定制等)
  • potato-crop 数据集 于马铃薯作物病害检测数据集 无人机土豆叶片病害检测数据集
  • AICG海报设计案例
  • 海量文件传输与私有化部署:企业数据流通的安全基石
  • ACM 数据结构与算法思想记录
  • “推三返一”裂变模型深度拆解:如何让用户从消费者变为增长合伙人?
  • 微信小程序毕设项目:基于nodejs的大众点评美食版小程序(源码+文档,讲解、调试运行,定制等)
  • 苹果OLED MacBook Pro或提前发布,三星屏幕已量产
  • 华为鸿蒙应用开发者基础认证
  • 第一性原理计算方法及应用
  • 小程序计算机毕设之基于nodejs的演唱会路演活动报名小程序的设计与实现(完整前后端代码+说明文档+LW,调试定制等)
  • 高效安全的数字化工作空间:VDI桌面云与私有化部署的价值解析
  • 【毕业设计】基于nodejs的大众点评美食版小程序(源码+文档+远程调试,全bao定制等)
  • 当AI重塑数据价值曲线,存储底座正在被重新定义
  • 微型导轨精度等级如何检测?
  • 五度易链企业数据服务架构思考:从“存数据”到“用数据”的全周期解决方案
  • 实时云渲染:重塑数字体验的技术革新
  • 野路子编问卷 VS 科学设计?宏智树 AI 让实证数据告别 “无效废纸”
  • 如何让大模型实现复杂、精准的推理与规划?
  • 人群仿真软件:AnyLogic_(5).行为和交互规则定义
  • 丑数 II:一题看穿你是“暴力选手”,还是“结构化思维玩家”
  • 数据不会 “说话”?宏智树 AI:一键解锁论文实证分析的通关密码
  • LLM兽医牙科影像实时诊断提速
  • 开题报告写作零门槛!宏智树 AI 教你避开 90% 的导师驳回坑
  • 云交互:开启数字体验的全新时代
  • Git 添加文件基本操作与简单原理
  • 知识图谱如何结合 RAG实现更精确的知识问答