爬虫餐饮类数据分析
经过对大众点评、美团、饿了么餐饮平台的店铺数据获取情况调研,目前可通过页面获取到的店铺信息包括:店铺名称、人均消费、评论数量、评分、点评榜单、营业状态、营业时间、店铺标签、地址、站点距离,以及部分推荐菜的菜名和推荐人数。
但餐饮菜单、菜品价格等核心信息仅在手机 App 端展示,PC 网页端无相关内容入口;同时 App 端接口加密严格,无法获取该类数据。
==================================================
调研大众点评、美团、饿了么等平台的店铺信息数据获取情况。
能获取信息:店名,人均消费价格,评论数量,评分,点评榜单,营业状态,营业时间,店铺标签,地址,站点距离,部分推荐菜的菜名和推荐人数
店铺菜单、菜品价格、详细规格等核心信息,目前仅在手机 App 端完整展示,PC 网页端并未开放查看入口,相关内容不做前端渲染、也不返回完整数据接口。因此,即使通过网页爬虫技术,也无法获取到菜单类数据;
同时平台对 App 接口采取了强加密、设备校验、签名验证、账号风控等多重反爬措施,不支持通过技术手段直接抓取,无法实现稳定、合规的数据获取。
==================================================
餐饮平台的菜单、菜品价格等信息仅在 App 端展示,PC 网页端无相关内容,且 App 接口加密严格,因此无法通过爬虫方式获取该类数据。
==================================================
App 爬虫与网页爬虫的核心区别(为什么更难)
PC 网页:数据在 HTML 或简单接口,易抓、易解析
App:
数据走加密 API 接口(JSON 加密、AES/RSA 加密)
请求带动态签名、时间戳、设备指纹、Token
强证书绑定(SSL Pinning)、模拟器检测、账号风控
菜单、价格、销量等核心接口仅 App 开放,PC 无入口
==================================================
反爬体系极严
1. 前端加密(JS 混淆 + 签名)
请求带动态签名、时间戳、设备指纹,每次请求算法不同
页面数据JSON 加密、接口参数加密,无法直接解析
2. 行为风控(AI 识别爬虫)
频率控制:1 分钟 > 10 次直接封
设备指纹:浏览器指纹、IP、UA、Cookie、鼠标轨迹综合识别
人机验证:滑块、点选、图文验证、AI 行为验证
账号风控:必须登录,异地 / 异常登录直接冻结
3. 数据脱敏(关键信息隐藏)
手机号:138****1234
地址:XX 区 XX 路(无门牌号)
评论:部分内容折叠、敏感词过滤
销量:月售 9999+(模糊化)
四、官方 API:权限极严
1. 美团 / 大众点评开放平台
仅限服务商 / 品牌商(需企业资质、行业认证)
接口分级:
基础 POI(店名 / 地址):需 ISV 资质,审批 15 天
销量 / 评价 / 营业数据:仅白名单服务商可用(个人 / 小公司没戏)
费率 + 配额:调用收费、每日限额、数据脱敏
2. 饿了么开放平台
仅限商家自用:只能拿自己店铺数据
批量数据接口已下线(2025Q2 起)
无公开批量商家库接口
3. 核心结论
个人 / 普通公司 → 拿不到批量餐饮数据 API 权限
