当前位置: 首页 > news >正文

使用豆包多模态API(doubao-seed-1-8模型)分析小红书视频内容pyhton代码

爬虫任务

有一个爬取小红书上视频内容并且分析的任务,下面是一个简单可以运行的demo。

注意加载环境变量,这里的.env表示读取相同路径下.env里面的ARK_API_KEY

import os from volcenginesdkarkruntime import Ark from dotenv import load_dotenv # 加载环境变量 env_path=os.path.join(os.path.dirname(__file__),'.env')load_dotenv(env_path)# 初始化豆包客户端 client=Ark(base_url='https://ark.cn-beijing.volces.com/api/v3',api_key=os.getenv('ARK_API_KEY'),)# 测试视频URL video_url="http://sns-video-hs.xhscdn.com/stream/1/110/259/01e95ce6da070f66010370039b92e65e08_259.mp4"response=client.responses.create(model="doubao-seed-1-8-251228",input=[{"role":"user","content":[{"type":"input_video","video_url":video_url,"fps":1},{"type":"input_text","text":"请详细描述这个视频的内容。"}],}])print("="*80)print("响应对象类型:",type(response))print("="*80)print("\n响应对象属性:")forattr indir(response):ifnot attr.startswith('_'):try:value=getattr(response,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passprint("\n"+"="*80)print("response.output 结构:")print("="*80)ifhasattr(response,'output')and response.output:print(f"output 类型: {type(response.output)}")print(f"output 长度: {len(response.output)}")fori,item inenumerate(response.output):print(f"\noutput[{i}] 类型: {type(item)}")print(f"output[{i}] 属性:")forattr indir(item):ifnot attr.startswith('_'):try:value=getattr(item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passifhasattr(item,'content')and item.content:print(f"\n content 类型: {type(item.content)}")print(f" content 长度: {len(item.content)}")forj,content_item inenumerate(item.content):print(f"\n content[{j}] 类型: {type(content_item)}")print(f" content[{j}] 属性:")forattr indir(content_item):ifnot attr.startswith('_'):try:value=getattr(content_item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passelse:print("response.output 为空或不存在")print("\n"+"="*80)print("尝试提取文本:")print("="*80)try:ifresponse.output andlen(response.output)>0:output_msg=response.output[0]ifhasattr(output_msg,'content')and output_msg.content:forcontent in output_msg.content:ifhasattr(content,'text'):print(f"找到文本: {content.text[:200]}...")breakexcept Exception as e:print(f"提取失败: {e}")

提取的内容为:

output[1] 类型: <class ‘volcenginesdkarkruntime.types.responses.response_output_message.ResponseOutputMessage’>
output[1] 属性:
content: list = [ResponseOutputText(type=‘output_text’, text=‘这个视频是小红书平台的趣味内容,围绕“图书馆的桌子怎么搬进来”展开,内容分段如下:\n\n0-4秒:画面呈现图书馆学习区域,前景是摆满学习用品的桌面——写有笔记的本子、黄色边框平板、咖啡杯、卡通图案笔筒、白色鼠标等,背景有一位女生在整理物品;配文和顶部标题接连抛出疑问:“你们说图书馆这么多张桌子”“真的是一张一张搬进来的吗?”“图书馆这么多桌子咋搬进来的”。\n\n5-6秒:切换到评论区,展示第一条网友评论:“不学你就回宿舍”,发布地为山东,获2091个赞,可展开81条回复,下方同步配有对应字幕。\n\n7-9秒:展示第二条评论:“不想学把手机电脑平板充满电就回宿舍吧”(附带彩虹表情),发布地为上海,获5.4万赞,可展开625条回复;中间插入吐舌头的猫猫表情包,配文字“嘿嘿嘿”,呼应评论的调侃语气。\n\n10-13秒:展示第三条评论:“宿舍门这么小 床又是怎么搬进来的”(搭配带问号的白色小人表情包),发布地为广东,获2164个赞;下方还有一条搞笑回复:“床小时候搬进来的”,延续趣味调侃的风格。\n\n14-17秒:展示第四条评论:“搬一个,然后啃臭加v啃臭加c复制粘贴”,是电脑快捷键“Ctrl+C、Ctrl+V”的谐音梗,发布地为湖北,获2442个赞,可展开46条回复;最后画面是两个紧挨的仓鼠脸表情包,右上角配有红色问号图案,为视频收尾,强化搞笑氛围。\n\n整个视频通过“提出疑问+展示神评论”的形式,借网友的幽默回复制造笑点,风格轻松有趣。’, annotations=None)]
id: str = msg_02176839283688100000000000000000000ffffac1531daa551d8
model_computed_fields: dict = {}
model_config: dict = {‘extra’: ‘allow’, ‘defer_build’: True, ‘protected_namespaces’: ()}
model_extra: dict = {}

后记

2026年1月14日于上海,周三。

http://www.jsqmd.com/news/245853/

相关文章:

  • 硬核解析:高防 IP 是如何拦截 DDoS 攻击的?从清洗中心到流量调度
  • 国产AI眼镜量产,产学研合作落地,英伟达升级平台,谷歌沃尔沃车载协同
  • 制造业场景人工智能应用分类分级蓝皮书2025
  • 通义千问2.5-7B实战教程:构建多模态问答系统
  • 人形机器人行业深度报告:人形机器人海内外竞速,政策护航迈入千亿产业黄金期
  • Super Resolution部署指南:系统盘持久化与WebUI配置
  • AI基础设施网络展望2026
  • IQuest-Coder-V1 vs Claude-3-Opus:代码任务部署成本对比
  • 2026年软考从报名到拿证全流程解读,看完不会踩坑!
  • PyTorch 2.9模型安全测试:云端对抗样本生成工具集
  • 安达发|钣金冲压厂:APS排程软件如何让金属“乖乖听话”?
  • 通义千问实时翻译demo:云端GPU加速,延迟低至0.5秒
  • 汽车维修:技师诊断过程语音记录与知识沉淀
  • Fun-ASR支持中英日三语,多语言识别这样设置
  • LCD/LED行李吊钩秤PCBA方案
  • DeepSeek-R1-Distill-Qwen-1.5B论文辅助神器:云端1小时1块
  • CSDN博主亲授:Qwen2.5-7B LoRA微调全流程详细拆解
  • Live Avatar网络配置要求:多机多卡通信带宽评估
  • 新中地学员转行学GIS开发原因盘点(1)
  • verl实测报告:内存冗余消除带来的性能飞跃
  • Glyph架构剖析:视觉-语言协同处理的设计精髓
  • Sonic数字人开发者文档解读:核心模块源码结构剖析
  • Qwen All-in-One功能测评:轻量级模型的多任务表现如何?
  • Java-线程池(八股)
  • Python3.10生物信息学:云端处理基因数据,隐私有保障
  • STM32波形发生器设计:ADC反馈控制应用
  • 5个AI图像增强工具对比测评:Super Resolution镜像免配置推荐
  • Vllm-v0.11.0避坑指南:云端自动配环境,避开CUDA版本冲突
  • Hunyuan-OCR模型微调入门:云端GPU+预置数据集开箱即用
  • VibeThinker-1.5B显存不足?轻量模型GPU适配优化部署教程