当前位置: 首页 > news >正文

【BUG】【Python】【爬虫】爬取加载中的数据

示例网页链接:https://movie.douban.com/subject/36907263/

BUG

浏览器开发者模式可以看到所需信息有对应的HTML显式结构

但代码爬取时发现结构被hidden,需要二次加载

importrequests url='https://movie.douban.com/subject/36907263/'headers={'User-Agent':'Mozilla/5.0'}response=requests.get(url,headers=headers)print(response.text)


即便使用selenium将修改type属性,让其不隐藏,再取出被隐藏的数据,也不行

fromseleniumimportwebdriver driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')js="document.getElementById('red').type='text';"driver.execute_script(js)content=driver.find_element(by='id',value='red').textprint(content)driver.quit()



其实我觉得这个逻辑是对的,但结果非预期,求助是不是哪块代码没写对? T^T 想打印下修改后的HTML也没打印出来 o(╥﹏╥)o

DEBUG

Selenium 的核心功能是模拟用户在浏览器中的操作,所以只需要增加等待时间,等待页面全部加载出来即可。加载后的页面就是我们在浏览器开发者模式下看到的全部HTML结构。

fromseleniumimportwebdriverimporttime driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')time.sleep(5)# 等待页面加载content=driver.find_element(by='id',value='info').textprint(content)driver.quit()


注意加载后要找的就是加载后的数据,即id=info,不再是之前的id=red。

http://www.jsqmd.com/news/299664/

相关文章:

  • 【BUG】【Python】清除字符串空格问题
  • ParseNet: LOOKING WIDER TO SEE BETTER——拓宽视野以更好地理解 - 实践
  • Python Dash 快速搭建交互式Web应用
  • 22-5. PLC的程序控制指令(子程序)
  • 先过滤后关联的优化经验分享
  • 【视觉大模型论文精读】带你逐段解析 (持续更新)——总览
  • 「LUCKY STUN穿透」使用UptimeRobot使UPnP映射的TCP规则保持活跃
  • AI应用架构师详解:智能供应链预测系统模型服务化设计(TensorFlow Serving实践)
  • A. Perfect Root
  • 曲线Curve
  • 「LUCKY STUN穿透」在Docker中使用MiniUPnP为BT客户端自动添加内外端口不同的映射规则
  • 【论文学习】重新审视面向持续图像分割的基于查询的 Transformer || 用于二分类图像分割的多视图聚合网络
  • 基于STM32的智能停车场系统设计(实物设计)
  • Kafka与RabbitMQ相比有什么优势? - 详解
  • MiniMax的全球化之路:中国AI公司出海的新样本
  • C++工程师的前端之旅:前后端对话 - 实时通信篇 02 - WebSocket订阅(观察者模式实现)
  • 动态注册RBAC
  • YOLO26改进 - 采样 | ICCV 顶会技术:WaveletPool 小波池化强化采样,保留小目标细节
  • P1948 [USACO08JAN] Telephone Lines S
  • 深度测评10个AI论文平台,研究生高效写作必备!
  • 图神经网络分享系列-GGNN(GATED GRAPH SEQUENCE NEURAL NETWORKS)(三)
  • 音视频学习(八十六):宏块
  • 完整教程:(数据结构)栈和队列
  • day11|150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素
  • 求多个乘法逆元(模板)
  • 语义分割实战——基于EGEUNet神经网络印章分割系统3:含训练测试代码、数据集和GUI交互界面
  • 语义分割实战——基于EGEUNet神经网络印章分割系统2:含训练测试代码和数据集
  • 语义分割实战——基于EGEUNet神经网络印章分割系统1:数据集说明(含下载链接)
  • 强烈安利!本科生毕业论文必备TOP8 AI论文网站测评
  • STM32F0实战:基于HAL库开发【2.3】