当前位置: 首页 > news >正文

20252220 2025-2026-2 《Python程序设计》实验四报告

20252220 2025-2026-2 《Python程序设计》实验四报告

课程:《Python程序设计》
班级: 2522
姓名: 岳金涛
学号:20252220
实验教师:王志强
实验日期:2026年5月11日
必修/选修: 公选课

1.实验要求

Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。
课代表和各小组负责人收集作业(源代码、视频、综合实践报告)

Python综合应用:爬虫、数据处理、可视化、机器学习、神经网络、游戏、网络安全等。
例如:编写从社交网络爬取数据,实现可视化舆情监控或者情感分析。
例如:利用公开数据集,开展图像分类、恶意软件检测等
例如:利用Python库,基于OCR技术实现自动化提取图片中数据,并填入excel中。
例如:爬取天气数据,实现自动化微信提醒
例如:利用爬虫,实现自动化下载网站视频、文件等。
例如:编写小游戏:坦克大战、贪吃蛇、扫雷等等
注:在Windows/Linux系统上使用VIM、PDB、IDLE、Pycharm等工具编程实现。

批阅:注意本次实验不算做实验总分,前三个实验每个实验15分,累计45分。本次实践算入综合实践,打分为45分。
评分标准:
(1)程序能运行,功能丰富(至少5个功能)。(需求提交源代码,并建议录制程序运行的视频)15分
(2)综合实践报告,要体现实验分析、设计、实现过程、结果等信息,格式规范,逻辑清晰,结构合理。20分。
(3)在实践报告中,需要对全课进行总结,并写课程感想体会、意见和建议等。10分

2.实验选题:豆瓣电影Top250榜单爬取

2.1 分析网页

打开Top250的界面,打开页面源代码

1

往下翻可以发现,电影的信息都是全部导入进入网页的,相当于我们直接爬取网页源代码就可以了

2

在F12的“网络”里面,查询到top250是GET请求,尝试直接GET

3

4

发现没有返回

尝试伪装,加headers

5

返回了网址界面

7

2.2 提取信息

接下来需要提取信息,观察这个格式,我这个尝试使用正则表达式提取,但是有Bug,问了AI发现我用了re.S( . )只不能匹配夸行内容

9

(AI提供的正则匹配)

爬取第一页成功

10

观察网址,发现start="?"就是该页上一页的最后一个电影编号,我们可以推出每一页的Url

14

爬取所有的电影

11

发现爬取成功了

13

在使用的时候我发现同一个IP且是游客连续多次访问会被禁止,我们可以考虑一次性爬取再本地查询,我们现在把电影信息保存到本地了,然后再写一个可视化软件用于查询电影
(LLM生成),用PyQt5实现,本来还想加入液态玻璃,但是我自己调格式调错了,AI也做不出来,暂时放弃了。

18

17

功能 简介
电影搜索 输入关键词即可模糊查找影片
榜单展示 表格形式呈现Top250排行数据
详情查看 展示电影评分、导演、台词等信息
统计分析 查看平均分、年代分布等数据
一键清空 快速重置搜索内容和展示结果

3.在华为云上搭服务器查询

通过爬取数据到本地,建立自己的网页

创建服务器后,把文件传到服务器上面

1

2

写一个新的Webapp端

8

打开服务器后,在Edge打开前端

5

4

尝试查询,前后端都有反馈,成功

3

6

全课总结:

上了Python课,我发现Python语言的强大(与C++相比),学到了很多编程基础概念和基础知识,也学了很多Python的函数和库的用法。

还有socket和爬虫这种应用性很强的东西,更重要的是我意识到我们写代码的时候需要有计算机的思维,要考虑很多意外的情况。

比如溢出处理,死循环等等,还有命名的规范,代码的调试。让我系统的重新学会了一个项目的代码应该怎么写。同时我也了解了Gitee/Github这种代码库网站

也学习到了任何建立自己的库。

课程感想:

老师的课讲得简单易懂,我能学到很多东西,很喜欢上老师的Python课,不愧是dky第一难抢的课)。

http://www.jsqmd.com/news/804961/

相关文章:

  • 北京小红书代运营服务商实力排行:全域能力对比 - 奔跑123
  • 独立开发者如何借助Taotoken快速验证不同大模型的创意应用
  • 行业媒体生存之道:从《EE Times》看专业媒体的编辑伦理与价值坚守
  • 代码之外的风景:一位云原生专家的户外生存指南
  • 从被看不起到被追更:《凰标》的逆袭就是行业缩影@凤凰标志
  • 百度网盘限速终极解决方案:BaiduPCS-Web完整使用指南
  • ADI收购Maxim:模拟芯片巨头的战略整合与边缘计算布局
  • Maya-glTF插件终极指南:快速掌握3D模型导出技术 [特殊字符]
  • 领域模型
  • 北京抖音代运营公司实测评测:资质与效果硬核对比 - 奔跑123
  • 西安爱尔古城眼科医院:29年深耕近视手术领域 同步国际技术 守护市民清晰视界 - 速递信息
  • 从专用芯片到可编程硅:AI硬件如何应对算法快速迭代的挑战
  • 智能工厂数据价值解锁:从数据治理到AI应用的实战路径
  • WRC-15频谱协调:700MHz频段如何重塑全球蜂窝物联网格局
  • 2026品牌推荐|广州晶石超窄型石英式动态称重传感器,头部品牌实力担当 - 品牌速递
  • 桌面贴片机:从开源硬件到DIY,如何实现小批量电子原型快速制造
  • Springer Nature新政策下Perplexity检索失效?紧急应对方案上线:2个替代接口+1套动态UA轮询策略(限时开源)
  • 厚街宠物寄养哪家值得推荐:秒杀宠物寄养品质典范 - 13425704091
  • 成都热轧开平板厂家直销|Q235B/Q355B 现货批发|四川盛世钢联|今日价格电议 - 四川盛世钢联营销中心
  • DeepSeek Serverless架构落地指南:5步完成从单体到全托管AI服务的平滑迁移(附压测数据与SLA保障清单)
  • 厚街商标注册哪家值得推荐:秒杀商标注册匠心服务 - 13724980961
  • 医疗报告单OCR识别实战:如何自动提取检查结果?
  • 避开热电偶测温的那些坑:聊聊MAX6675和MAX1241在51单片机项目里的实战区别
  • 北京微信视频号代运营服务商实力排行权威盘点 - 奔跑123
  • 磁电机原理与现代应用:从经典点火到能量收集的机电转换技术
  • 周日那天参加的力扣周赛... —— 10号
  • cfg80211基础知识总结
  • 广州晶石石英压力传感器,2026十大品牌优选,值得信赖的传感专家 - 品牌速递
  • 2026年海南仿石PC路沿石公司排行榜就选择:海南博泰彩砖有限公司 - 品牌策略师
  • 福建莆田别墅设计哪个价格合理