当前位置: 首页 > news >正文

小红书商品笔记抓取:笔记ID与商品关联关系解析

在小红书电商生态中,笔记 ID是内容唯一标识,商品 ID是货品唯一标识,二者的关联关系是种草归因、选品分析、流量投放的核心数据链路。本文从关联逻辑、抓取路径、字段解析、合规边界四个维度,完整拆解笔记与商品的绑定机制与采集方法。


一、笔记 ID 与商品 ID 的基础定义

  • 笔记 ID(note_id)小红书单条笔记的唯一字符串标识,出现在 URL、接口返回值、分享链接中,是定位内容的核心主键。
  • 商品 ID(product_id/sku_id)平台店铺商品或 SKU 的唯一编号,用于商品上架、挂载、交易、数据统计。
  • 核心关系一条笔记可挂载 1~18 个商品,一个商品可被多篇笔记关联,形成多对多映射。

二、笔记与商品的三种关联形态

1. 官方挂载关联(强关联)

博主在编辑页点击「商品」图标,选择平台内商品完成绑定,笔记内出现可点击商品卡片。

  • 数据特征:接口items/cards字段包含完整商品 ID、标题、价格、店铺信息。
  • 适用场景:带货笔记、商单笔记、店铺自播笔记。

2. 内容提及关联(弱关联)

笔记正文 / 标签 / 图片出现商品名称、型号,但未官方挂载。

  • 数据特征:无商品 ID 字段,需通过 NLP 关键词匹配、图片 OCR 建立关联。
  • 适用场景:纯种草、口碑分析、竞品舆情。

3. 广告投放关联(付费关联)

聚光 / 乘风平台将笔记与商品绑定投放,支持单笔记多商品批量关联。

  • 数据特征:广告接口返回ad_id+product_id+note_id三元组,带投放标记。
  • 适用场景:投流效果分析、转化归因。

三、抓取笔记 ID 与商品关联的实操路径

1. 手动获取 ID(适合小批量)

  • 笔记 ID:分享链接中explore/后字符串,或详情页 URL 末尾字段。
  • 商品 ID:商品详情页 URL、购物车、订单页提取。

2. 接口抓包获取(适合批量)

  • 笔记详情接口:传入 note_id,返回items数组,直接提取关联商品 ID 列表。
  • 商品关联笔记接口:传入 product_id,返回绑定的 note_id 列表。
  • 搜索接口:按关键词检索,批量获取笔记 + 挂载商品数据。

3. 页面渲染获取(备用方案)

使用 Selenium/Playwright 渲染页面,提取 DOM 中的商品卡片 style="margin-top:12px">

http://www.jsqmd.com/news/653610/

相关文章:

  • Kaneo Docker部署教程:从本地开发到生产环境的完整方案
  • 签证时效、暴雨预警、小众民宿库存——AI旅游攻略如何实时联动27类动态因子?SITS2026技术委员会独家拆解
  • 5种WaveNet vocoder输出分布对比:MoL vs 高斯 vs μ-law量化
  • 终极指南:如何在 NestJS 中集成 Chrono 实现智能日期解析
  • 生成式AI错误日志形同虚设?教你用LangChain+Prometheus+自定义Error Schema实现错误可追溯、可归因、可复现
  • 2026奇点大会技术白皮书节选(机密级):AI简历优化器的对抗样本防御机制与反偏见训练日志(含真实A/B测试数据集)
  • LOD和UV光照贴图管理:Blender For Unreal Engine优化工作流程
  • 解锁WPS甘特图:从零搭建高效项目进度管理模板
  • 免费论文AIGC率检测工具推荐 学术场景直接可用
  • Python的__new__中的缓存弱引用
  • M920x黑苹果实战指南:从硬件解锁到完美macOS体验
  • 什么是“荒加工”(机械加工方向)
  • 从Prompt到出版级叙事,SITS2026演讲实录:7步构建可商用AI故事工作流
  • # 发散创新:用 Rust实现高性能物理引擎的底层架构设计与实战在游戏开发、虚拟仿真和机器人控
  • GPU推理优化教程:提升Local AI MusicGen生成速度
  • 纵向磨削和径向磨削
  • BongoCat终极指南:让可爱猫咪为你的输入操作增添无限乐趣
  • S7-1200与S7-1500跨网段通信实战:PN/PN耦合器配置避坑指南(TIA Portal V18)
  • PFAS (Forever Chemicals)
  • SITS2026现场实录:如何用轻量级LLM在200ms内生成高保真新闻摘要?
  • IndraDB大规模应用案例:维基百科链接图谱的完整实现方案
  • 如何拆分PDF文件?快速拆分PDF文件的2个方法
  • 避开这些坑:IGH EtherCAT控制伺服时PDO配置与状态机处理的实战心得
  • Alpamayo-R1-10B部署案例:多用户并发访问WebUI时的GPU资源隔离配置
  • 深入解析:如何利用eBPF USDT探针无侵入式追踪Python应用(以OpenStack为例)
  • Chrono流式解析终极指南:如何高效实时提取无限文本流中的日期时间
  • 深度拆解:HIS门诊医生站高保真原型设计的交互细节与业务逻辑
  • wan2.1-vae部署案例:高校AI实验室用双4090部署教学演示平台,支持30并发
  • 个人图床方案推荐
  • Proteus仿真STM32矩阵按键,从原理图到代码调试的保姆级避坑指南