当前位置：首页 > news >正文

selenium抓包的具体操作（学习自用）

news 2026/3/26 19:19:19

我采用以下代码进行解释

#抓网络包 logs = browser.get_log('performance') print(f"7. 捕获到 {len(logs)} 个性能日志") count = 0 for entry in logs: # 第一步：解析日志条目（JSON字符串转Python字典） message = json.loads(entry['message']) # 第二步：筛选出"网络响应已接收"类型的日志 if message['message']['method'] == 'Network.responseReceived': request_id = message['message']['params']['requestId'] # 第三步：提取响应的核心信息 response = message['message']['params']['response'] url = response['url'] # 第四步：筛选我们关心的视频相关API请求 if 'bilibili.com' in url: count += 1 # print(f"8. 找到第{count}个B站请求：{url}") # 第五步：通过requestId获取完整的响应体内容 try: res = browser.execute_cdp_cmd('Network.getResponseBody', {'requestId': request_id}) # 第六步：处理并保存响应体 if res.get('body'): body = res['body'] # print(f"9. 响应体长度：{len(body)}") print(f"10. 完整响应体内容：\n{body}") # with open('d:\\aitems\\ktv\\backend\\first_response.txt', 'w', encoding='utf-8') as f: # f.write(body) # print("\n11. 响应体已保存到 first_response.txt") break else: print() # print(f"9. 响应体为空，继续查找...") except Exception as e: # print(f"9. 获取响应体失败：{str(e)}，继续查找...") continue

浏览器手动操作 ↔ 代码对应逻辑 ------------------------------------------------- 打开F12+网络面板 ↔ chrome_options.set_capability('goog:loggingPrefs', {'performance': 'ALL'}) 刷新页面抓请求 ↔ browser.get(url) + browser.get_log('performance') 筛选目标请求 ↔ 遍历logs，筛选method='Network.responseReceived' + url含bilibili.com 查看响应体 ↔ browser.execute_cdp_cmd('Network.getResponseBody', {'requestId': xxx})

1、基础配置：开启性能日志采集（不开抓不到日志）

chrome_options = Options() chrome_options.set_capability('goog:loggingPrefs', {'performance': 'ALL'})

2、获取日志

logs = browser.get_log('performance') print(f"7. 捕获到 {len(logs)} 个性能日志")

3、遍历日志

for entry in logs: # 第一步：解析日志条目（JSON字符串转Python字典） message = json.loads(entry['message'])

4、筛选「响应已接收」的请求

# 第二步：筛选出"网络响应已接收"类型的日志 if message['message']['method'] == 'Network.responseReceived':

我们从基础配置到筛选请求的操作都是固定操作

接下来就是根据我们所需要内容的需求进行提取

5、提取请求 ID 和 URL

request_id = message['message']['params']['requestId'] # 第三步：提取响应的核心信息 response = message['message']['params']['response'] url = response['url'] #这一行固定写法

6、筛选目标 URL

# 第四步：筛选我们关心的视频相关API请求 if 'bilibili.com' in url:

只处理和 B 站相关的请求，根据需求进行筛选

7. 获取响应体

# 第五步：通过requestId获取完整的响应体内容 try: res = browser.execute_cdp_cmd('Network.getResponseBody', {'requestId': request_id}) # 第六步：处理并保存响应体 if res.get('body'): body = res['body'] print(f"10. 完整响应体内容：\n{body}") break # 找到第一个就退出 except Exception as e: continue

总结

除了筛选url这一步，其他基本都是固定流程

1. 配置Chrome：开启performance日志采集 → 固定 2. 访问目标页面：browser.get(url) → 自定义URL 3. 获取日志：browser.get_log('performance') → 固定 4. 遍历日志： a. 解析message为JSON → 固定 b. 筛选method='Network.responseReceived' → 固定 c. 提取requestId和url → 固定 d. 筛选目标url（比如含bilibili.com）→ 自定义 e. 调用Network.getResponseBody获取响应体 → 固定 f. 处理响应体（保存/解析）→ 自定义

查看全文

http://www.jsqmd.com/news/449579/