当前位置: 首页 > news >正文

爬取电影数据并保存至csv文件

image
url = 'https://ssr1.scrape.center/'
image

from parsel import Selector
import requests
import csv
import certifidef get_page():# 翻页1-10页for i in range(1,11):url = f'https://ssr1.scrape.center/page/{i}'headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/139.0.0.0 Safari/537.36'}# 1.发送请求response = requests.get(url,headers=headers,verify=certifi.where())# print(response.text)# 2.解析页面selector = Selector(response.text)# 3.获取所有div标签(根据class属性定位div标签),返回数据列表,列表里每一个元素都是selector对象name_list = selector.css('div[class="el-card item m-t is-hover-shadow"]')# print(name_list)# exit()for name in name_list:title = name.css('h2[class="m-b-sm"]::text').get()score = name.css('p[class="score m-t-md m-b-n-sm"]::text').get().strip()type = name.css('button[type="button"] span::text').getall()type_clean = "/".join(type)area = name.css('div[class="m-v-sm info"] span::text').getall()[0]year = name.css('div[class="m-v-sm info"] span::text').getall()[-1]# print(f"{title} {score} {type}")# breakwriter.writerow({"电影":title,"评分":score,"类型":type_clean,"制片地区":area,"上映年份":year})def save_data():fieldname = ["电影","评分","类型","制片地区","上映年份"]global writerwith open("center_movie.csv","w",encoding='utf-8-sig',newline='') as f:writer = csv.DictWriter(f,fieldname)writer.writeheader()   # 写入表头,省略会报错get_page()if __name__ == '__main__':save_data()"""
https://ssr1.scrape.center/page/1
https://ssr1.scrape.center/page/2
https://ssr1.scrape.center/page/3
"""

image

http://www.jsqmd.com/news/149118/

相关文章:

  • 2025钢制拖链生产厂TOP5权威推荐:专业服务商技术评测指南 - myqiye
  • 【Java毕设全套源码+文档】基于springboot的金雁在线考试系统设计与实现(丰富项目+远程调试+讲解+定制)
  • 震惊!企业AI落地难?Agentic AI Stack三层九阶模型来救场,代码小白也能秒懂!
  • 为什么顶尖团队都在关注Open-AutoGLM?(背后隐藏的4大技术壁垒)
  • 编程小白一行代码没写,5分钟搞定小游戏开发、部署上线
  • 2025年靠谱金属探测器正规厂商排行榜,新测评精选金属探测器生产企业推荐 - 工业推荐榜
  • 2025年度塑料抗静电剂技术领先厂家TOP5推荐 - 工业品牌热点
  • 大语言模型(LLM)训练与推理的硬件需求差异全解析,建议收藏!
  • Open-AutoGLM遇上Windows系统:常见报错解析与实战避坑手册
  • 2025口碑好的微通风窗户生产厂家TOP5权威推荐 - 工业设备
  • 1.Docker 命令大全
  • 模型推理延迟高?vLLM + Open-AutoGLM方案来了,性能提升8倍真能实现吗?
  • AI Agent卡壳?不是模型不行,而是数据没准备好!AI-ready data全攻略
  • 昇腾RecSDK Torch整体方案介绍
  • 2025年新疆汽车托运公司权威推荐榜单:二手车托运/火车托运汽车/轿车托运源头服务商精选 - 品牌推荐官
  • 【独家】Open-AutoGLM内部架构首次曝光:6层流水线设计颠覆传统GLM
  • 【Open-AutoGLM下载提速全攻略】:揭秘5大卡顿根源与高效解决方案
  • 初学者必看:搞懂 JavaScript map() 和 forEach() 的差异,写出更高
  • 如何用TensorFlow训练舞蹈动作生成模型?
  • 如何用TensorFlow优化城市交通信号灯?
  • daemon not running; starting now at tcp5037解决
  • Open-AutoGLM一键部署方案曝光(限时开源配置文件)
  • 使用TensorFlow进行心律失常检测研究
  • 城市仿真软件:MATSim_(14).MATSim社区与支持资源
  • 毕业季 “论文搭子” 大赏:这八款工具,承包你从选题到答辩的全流程
  • Open-AutoGLM为何突然爆火?背后隐藏的6个技术真相
  • 手机变身AI大脑:Open-AutoGLM本地化部署全流程详解
  • Nacos 配置加载优先级详解:Spring Cloud Alibaba 微服务配置管理的核心机制 - 指南
  • 使用TensorFlow进行客户流失预测建模
  • Open-AutoGLM如何实现零样本推理?深度剖析其4层架构原理