当前位置: 首页 > news >正文

day10-影刀RPA下载梨视频

今日内容

1 使用影刀RPA获取梨视频

1.1 目标

# 1  获取 梨视频 人物板块下,两页的视频--》下载到本地

1.2 具体步骤

# 1 新建PC自动化应用-修改应用名字-修改应用图标。。。# 2 获取系统文件夹路径-获取桌面路径--》把下载的视频放在桌面上# 3 创建文件夹-在桌面创建video01文件夹# 4 打开网页:输入地址https://www.pearvideo.com/category_1-已经有驱动了,不用装了# 5 鼠标滚动【可以滑动多次,加载更多页】-加载下一页# 6 循环相似元素-有很多相似的视频--》都获取到后--》一个个循环## 6.1 获取元素 属性-一个标签a--》有很多属性--》href--》是一个超连接--》鼠标点击--》就会跳转到href对应的地址<a href="video_1805352"</a>## 6.2 设置变量拼接成正常的视频地址:"https://www.pearvideo.com/"+video_1805352## 6.3 打开视频详情地址## 6.4 获取元素 属性-->src属性
<video src="https://video.pearvideo.com/mp4/short/20260308/cont-1805352-16073393-hd.mp4"></video>## 6.5 http下载--》保存到video中--》视频名字?-https://video.pearvideo.com/mp4/short/20260308/cont-1805352-16073393-hd.mp4-video_1805352.mp4--->python 语法是:video_href +"mp4"# 7 循环结束

1.3 流程截图

image-20260402203452500

image-20260402205034603

image-20260402205401123

image-20260402205618492

image-20260402210115837

image-20260402210442024

image-20260402211109364

image-20260402211333916

image-20260402213415655

扩展

获取视频标题

image-20260402214526112

打印日志

image-20260402214615352

爬取的时候,尽量加点等待-随机等待

image-20260402215410261

拓展--》爬更多页

同学问题

1 "字符串" 与 "None" 无法做 "+" 运算2 老师,是不是所以网站或者APP取数据元素名字不一定都是SRC之类?-右键--》检查--》看到后--》去获取--》是什么就写什么3 不编程,很多元素啊,变量啊名字都不熟悉 html
<html><head></head><div><a class='ss' href='www.baidu.com'></a><video src='视频地址' id='sss'></videw></div>
</html>4 问老师,还是要讲讲网页的基本术语,比如对象、元素、标签等-回答过了5 梨视频网页点不开,总是提醒风险-爬的太多,封ip了-明天再试--》一定要加 等待6 为什么我循环相似元素,捕获都是a标签,而不是a上级的div-用a 获取hrf属性-如果用div没有href属性7 如果我运行的时候意外终止了,下次运行从头开始还是继续下载没下载的,如果是从头 怎么让他继续。而不是从头下载-逻辑问题--》不是技术问题-影刀可以打开文件夹,读出文件夹中所有的文件--》拿到文件名--》只留 video_数字-解析出的video_href 循环跟每个 video_数字 --》如果想等--》就不下载这个了8 点赞低于多少的不下载,怎么操作?9 这个是视频,那如果去下载列表类型的元素信息是不是也一样的操作?比如去下载雷速体育赛事的相关信息?https://live.leisu.com/--->不行-如果是考试试题的网站,怎么爬文字的数据,整理成Excel
10 下载超时怎么解决?1 换网络环境,提高网速2 把超时时间 放大点11 刚开始循环打开视频页面显示404是为什么12 为啥我拿了一个视频就停了,循环没跑起来-在影刀操作过程中,不要动13 在循环里,获取元素信息时,获取不到目标元素为:web_loop_element 的目标,怎么回事呢14 如何修改错的指令,我的获取上出问题了,需要修改15 谷歌浏览器不行,使用影刀浏览器16 [WinError 3] 系统找不到指定的路径。: ''

image-20260402215816243


http://www.jsqmd.com/news/590994/

相关文章:

  • 3步攻克NCM加密:ncmdumpGUI让音乐文件重获自由
  • STM32贪吃蛇移植踩坑记:从2.4寸TFT屏到OLED,我如何搞定链表内存溢出和按键中断
  • Webtoon Downloader完全指南:漫画批量下载的5个高效技巧
  • 2026年四川景区仿真恐龙制作费用,揭秘信誉好的公司 - 工业品网
  • [网络/硬盘/数据存储] RaiDrive: 将云存储和网络空间映射为本地磁盘的工具
  • RISC-V SV39三级页表实战:从虚拟地址到物理地址的完整转换流程
  • 魔兽争霸3 Windows 11兼容性完全解决方案:从崩溃到满帧的技术适配指南
  • League Akari:英雄联盟智能辅助工具提升游戏效率全指南
  • 2026年西安本地户外遮阳防雨玻璃雨棚厂家,口碑好的有哪些 - myqiye
  • 最新AI顶刊影响因子大比拼:TPAMI vs IJCV vs AI vs JMLR
  • 微信小助手:Mac微信终极效率提升方案,告别信息焦虑
  • Translumo:专业级屏幕翻译工具的技术解析与应用指南
  • 英雄联盟皮肤修改器的技术革新:R3nzSkin如何重新定义游戏个性化体验
  • 3分钟搞定Windows苹果驱动安装:告别iTunes的繁琐体验
  • 万物识别中文镜像效果实测:多张图片批量识别,效率翻倍
  • Onekey终极指南:5分钟掌握Steam Depot清单下载的完整解决方案
  • KMS_VL_ALL_AIO:智能激活解决方案完全指南
  • # 短剧剧本创作
  • 3个步骤掌握Ghidra逆向工程工具完整部署与应用
  • 阐释不锈钢钢丝切丸生产厂家哪个口碑好,聊聊性价比高产品特点 - 工业推荐榜
  • 实战演练:在快马平台用pytest构建电商订单集成测试项目
  • StarRocks异步物化视图实战:从多表关联到湖仓加速,一份保姆级配置指南
  • Bilibili缓存视频合并:安卓用户的离线观影终极解决方案
  • 如何在极域电子教室环境下实现自主学习?JiYuTrainer的技术突破与应用指南
  • Intv_AI_MK11卷积神经网络(CNN)原理详解与模型调优实战
  • 零基础也能用!Fish-Speech 1.5 WebUI制作播客配音全流程
  • 暗黑破坏神3终极按键助手:3分钟配置,彻底解放双手的游戏神器
  • YimMenu:GTA V安全防护与体验增强的开源解决方案
  • 聊聊翼龙仿真模型、梁龙仿真模型,自贡彩灯性价比哪家高? - 工业设备
  • 抖音无水印批量下载工具:让内容管理效率提升90%的技术方案