当前位置: 首页 > news >正文

Zillow 数据抓取器

本仓库提供两种抓取 Zillow 数据的方法:

  1. 免费的小规模抓取器,用于基础数据收集
  2. 面向企业的大规模数据提取 API 方案

目录

  • 免费 Zillow 数据抓取器
  • 免费抓取器的限制
  • Zillow 抓取 API
    • 核心功能
    • 快速开始
    • 通过 URL 获取 Zillow 房源详情
    • 通过筛选条件获取 Zillow 房源列表
    • 通过 URL 获取 Zillow 房源列表
    • Zillow 价格历史
  • 无代码抓取选项
  • 其他可选项
  • 支持与资源

免费 Zillow 数据抓取器

免费抓取器可用于在小规模范围内从 Zillow 的搜索页面收集房源数据。

输入要求

参数必填描述
coords边界坐标 [西, 东, 南, 北]
pages要抓取的页数

实现

使用抓取器时,请根据你的地理位置和数据需求,在以下代码中修改坐标和页数:

# free_zillow_scraper/property_data.py def get_search_params(): return ( -118.668176, # 西经 -118.155289, # 东经 33.703652, # 南纬 34.337306, # 北纬 5 # 要抓取的页数 )

提示:任意位置的 Zillow 搜索页都可在标签中找到地理坐标。查找以下标签:

<script id="__NEXT_DATA__" type="application/json">

示例输出

{ "id": "20595672", "price": "$1,599,900", "zestimate": 1605500, "location": { "address": "2215 Wellington Rd, Los Angeles, CA 90016", "city": "Los Angeles", "state": "CA", "zip": "90016", "coordinates": {"lat": 34.036064, "lon": -118.33622}, }, "details": { "beds": 4, "baths": 3.0, "area_sqft": 1886, "lot_acres": 8577.0, "property_type": "SINGLE_FAMILY", }, "listing": { "status": "House for sale", "days_on_zillow": 5, "broker": "ehomes", "url": "https://www.zillow.com/homedetails/2215-Wellington-Rd-Los-Angeles-CA-90016/20595672_zpid/", }, },

免费抓取器的限制

免费 Zillow 抓取器适合小规模数据提取,但存在以下限制:

  • 速率限制:抓取几次后 Zillow 会限制请求。
  • IP 封禁:同一 IP 频繁抓取可能被封禁。
  • 可扩展性有限:不适合高容量数据收集。
  • 验证码:Zillow 可能通过验证码阻止自动化请求。
  • 蜜罐:Zillow 使用蜜罐机制识别并拦截机器人。

若需大规模抓取,请考虑使用下方的 Zillow 抓取 API。

Zillow 抓取 API

Bright Data 的 Zillow 抓取 API 可在无需自建和维护基础设施的情况下,提供可扩展、可靠、免操心的大规模 Zillow 数据提取方案。

核心功能

  • 可扩展且可靠:针对高吞吐与实时采集优化。
  • 反封锁:内置代理轮换与验证码处理。
  • 合规:完全符合 GDPR 与 CCPA。
  • 全球覆盖:可访问任意地区与语言的数据。
  • 实时数据:低延迟的新鲜数据。
  • 高级筛选:通过精确过滤器自定义采集。
  • 按用量计费:仅为成功响应付费。
  • 免费试用:赠送 20 次免费 API 调用。
  • 7x24 支持:提供全天候技术支持。
  • 无代码选项:支持通过 API 或无代码抓取器采集 Zillow 数据。

快速开始

  • 注册:创建一个 Bright Data 账户。
  • 获取 API 令牌:在控制台获取你的 API key。
  • 选择接口:从下方可用的 API 端点中进行选择。

1. 通过 URL 获取 Zillow 房源详情

通过提供房源 URL 来收集房源详情。

输入参数

参数必填描述
urlZillow 房源 URL

示例请求

Python 代码:
properties = [ {"url": "https://www.zillow.com/homedetails/73-Beverly-Park-Ln-Beverly-Hills-CA-90210/20533547_zpid/"}, {"url": "https://www.zillow.com/homedetails/1945-N-Edgemont-St-Los-Angeles-CA-90027/20809871_zpid/"} ]

👉 完整 Python 脚本:zillow_properties.py

cURL 命令:
curl -H "Authorization: Bearer YOUR_API_TOKEN" \ -H "Content-Type: application/json" \ -d '[ { "url": "https://www.zillow.com/homedetails/2506-Gordon-Cir-South-Bend-IN-46635/77050198_zpid/?t=for_sale" } ]' \ "https://api.brightdata.com/datasets/v3/trigger?dataset_id=gd_lfqkr8wm13ixtbd8f5&include_errors=true"

响应示例结构

{ "property_overview": { "address": "73 Beverly Park Ln, Beverly Hills, CA 90210", "price": "$89,900,000", "status": "FOR_SALE", "living_area": "28,500 sq ft", "lot_size": "2.68 acres", "bedrooms": 9, "bathrooms": 22, }, "key_features": { "highlights": [ "85-foot infinity lap pool", "Two kitchens (including commercial-grade)", "5,000 sq ft primary suite", "Screening room", "Gated community with guard", ], "views": ["City", "Ocean", "Mountain", "Canyon"], }, "financial": { "last_sold": "2021-04-08 for $28,500,000", "property_tax_rate": "1.18%", "monthly_hoa": "$6,216", }, }

👉 以上为部分响应。完整字段请参见完整 JSON 响应。

2. 通过筛选条件获取 Zillow 房源列表

使用位置和其他条件搜索房源。

提示:部分房源可能包含多个单元,导致返回多条记录。若需限制结果量,请使用 Limit per input。

输入参数

参数必填描述
location可为邮编、城市或州
listingCategory选项:Sold、House for rent、House for sale
HomeType来自 Zillow 的户型类型(如 Houses、Apartments、Townhomes)

示例请求

Python 代码:
filters = [ {"location": "92027", "listingCategory": "Sold", "HomeType": "Houses"}, {"location": "New York", "listingCategory": "House for rent", "HomeType": "Condos"}, {"location": "Colorado", "listingCategory": "", "HomeType": ""}, ]

👉 完整 Python 脚本:zillow_discovered_properties.py

cURL 命令:
curl -H "Authorization: Bearer YOUR_API_TOKEN" \ -H "Content-Type: application/json" \ -d '[{"location": "New York", "listingCategory": "House for rent", "HomeType": "Houses"}, {"location": "02118", "listingCategory": "House for sale", "HomeType": "Condos"}, {"location": "Colorado", "listingCategory": "", "HomeType": ""}]' \ "https://api.brightdata.com/datasets/v3/trigger?dataset_id=gd_lfqkr8wm13ixtbd8f5&include_errors=true&type=discover_new&discover_by=input_filters"

响应示例结构

{ "address": { "streetAddress": "569 Hayward Pl", "city": "Escondido", "state": "CA", "zipcode": "92027", }, "homeStatus": "SOLD", "bedrooms": 4, "bathrooms": 2, "livingArea": 1446, "livingAreaUnits": "Square Feet", "lotSize": 5933, "lotAreaUnits": "Square Feet", "homeType": "SINGLE_FAMILY", "yearBuilt": 1987, "lastSoldPrice": 689000, "dateSoldString": "2022-08-11", "zestimate": 818100, "rentZestimate": 3752, "schools": [ { "name": "Glen View Elementary School", "distance": 0.6, "rating": 5, "grades": "K-5", }, { "name": "Hidden Valley Middle School", "distance": 1.2, "rating": 5, "grades": "6-8", }, { "name": "Orange Glen High School", "distance": 1.4, "rating": 5, "grades": "9-12", }, ], "url": "https://www.zillow.com/homedetails/569-Hayward-Pl-Escondido-CA-92027/16696746_zpid/", }

👉 以上为部分响应。完整字段请参见完整 JSON 响应。

3. 通过 URL 获取 Zillow 房源列表

直接使用 Zillow 搜索页面的 URL 搜索房源。

提示:部分房源可能包含多个单元,导致返回多条记录。若需限制结果量,请使用 Limit per input。

输入参数

参数必填描述
url包含完整搜索参数的 Zillow 搜索 URL

示例请求

Python 代码:
urls = [ {"url": "https://www.zillow.com/south-bend-in/?searchQueryState=%7B%22pagination%22%3A..."}, {"url": "https://www.zillow.com/new-york-ny/rentals/?searchQueryState=%7B%22isMapVisible%22%3A..."}, {"url": "https://www.zillow.com/sands-point-ny/rentals/?searchQueryState=%7B%22isMapVisible%22%3A..."}, ]

👉 完整 Python 脚本:zillow_discovered_properties_by_url.py

cURL 命令:
curl -H "Authorization: Bearer YOUR_API_TOKEN" \ -H "Content-Type: application/json" \ -d '[{"url": "https://www.zillow.com/south-bend-in/?searchQueryState=%7B%22pagination%22%3A..."}]' \ "https://api.brightdata.com/datasets/v3/trigger?dataset_id=gd_lfqkr8wm13ixtbd8f5&include_errors=true&type=discover_new&discover_by=url"

响应示例结构

{ "zpid": 77029580, "address": { "streetAddress": "1937 Churchill Dr", "city": "South Bend", "state": "IN", "zipcode": "46617", }, "price": 435000, "bedrooms": 4, "bathrooms": 4, "livingArea": 3197, "lotAreaValue": 0.46, "lotAreaUnits": "Acres", "yearBuilt": 1968, "homeStatus": "FOR_SALE", "zestimate": 420400, "lastSoldPrice": 134000, "dateSold": "2013-05-20", "schools": [ {"name": "McKinley Elementary School", "rating": 4}, {"name": "Edison Intermediate Center", "rating": 2}, {"name": "Rise Up Academy At Eggleston", "rating": 1}, ], "mortgageRates": {"thirtyYearFixedRate": 6.536}, "listingProvidedBy": {"name": "Eric M Bomkamp", "phoneNumber": "574-360-2569"}, "url": "https://www.zillow.com/homedetails/1937-Churchill-Dr-South-Bend-IN-46617/77029580_zpid/", }

👉 以上为部分响应。完整字段请参见完整 JSON 响应。

4. Zillow 价格历史

收集某个房源的历史价格信息。

输入参数

参数必填描述
urlZillow 房源 URL

示例请求

Python 代码:
urls = [ {"url": "https://www.zillow.com/homedetails/8305-Blue-Heron-Way-Raleigh-NC-27615/6468808_zpid/"}, {"url": "https://www.zillow.com/homedetails/930-3rd-St-SE-Hickory-NC-28602/71557289_zpid/"}, ]

👉 完整 Python 脚本:zillow_price_history.py

cURL 命令:
curl -H "Authorization: Bearer YOUR_API_TOKEN" \ -H "Content-Type: application/json" \ -d '[{"url": "https://www.zillow.com/homedetails/8305-Blue-Heron-Way-Raleigh-NC-27615/6468808_zpid/"}, {"url": "https://www.zillow.com/homedetails/930-3rd-St-SE-Hickory-NC-28602/71557289_zpid/"}]' \ "https://api.brightdata.com/datasets/v3/trigger?dataset_id=gd_lxu1cz9r88uiqsosl&include_errors=true"

响应示例结构

{ "url": "https://www.zillow.com/homedetails/8305-Blue-Heron-Way-Raleigh-NC-27615/6468808_zpid/", "zpid": "6468808", "date": "2020-11-13T00:00:00.000Z", "event": "Sold", "price": 440000, "price_per_squarefoot": 127, "source": "Doorify MLS", "timestamp": "2025-02-09T16:56:42.074Z", }

👉 以上为部分响应。完整字段请参见完整 JSON 响应。

无代码抓取选项

Bright Data 的无代码抓取器为无需编程即可收集 Zillow 数据提供了友好的方式。

  • 几分钟即可完成抓取器配置
  • 全自动化数据采集流程
  • 结果可直接以多种格式下载

详细说明请参阅我们的快速上手指南。

其他可选项

通过以下参数微调你的数据采集:

参数类型描述示例
limitinteger每个输入的最大返回数量limit=10
include_errorsboolean返回错误报告以便排查include_errors=true
notifyurl任务完成时回调通知的 Webhook URLnotify=https://notify-me.com/
formatenum输出格式(如 JSON、NDJSON、JSONL、CSV)format=json

专业提示:你可以将数据传送至外部存储或Webhook。

支持与资源

  • API 文档:Bright Data Docs
  • 抓取最佳实践:避免被封锁
  • 技术支持:联系我们
http://www.jsqmd.com/news/932784/

相关文章:

  • 2026年现阶段宁波全屋定制公司推荐:本土服务商竞争格局深度解析 - 2026年企业资讯
  • 【Linux系统编程】线程池项目实战与基于策略模式的日志系统
  • 别再用余弦相似度了!用Python手写PMI(点间互信息)从零到一搞定关键词共现分析
  • 终极窗口强制调整工具:3分钟掌握任意窗口尺寸修改技巧
  • PTT5-base-t5-vocab实战案例:葡萄牙语摘要生成与翻译应用
  • MySQL版饭店点餐系统数据库一键部署包(含建表脚本、初始化数据与操作指南)
  • 如何让AI生成项目的单元测试,propmt技巧详解
  • OpencvSharp 算子学习教案之 - Cv2.GetOptimalDFTSize
  • 拾贰指沐影院式足道费用高不高 - mypinpai
  • 基于Rao-Blackwellized粒子滤波与多融合策略全阶 EKF 的双车协同 SLAM 研究(Matlab代码实现)
  • Sora 2交互设计白皮书首发,揭秘OpenAI未公开的7层反馈闭环机制,含真实A/B测试数据集
  • VisualCppRedist AIO深度解析:一站式自动化部署的技术实现与架构剖析
  • 2026 无锡瓷砖空鼓翘边维修哪家靠谱?七大区优质修缮企业综合盘点 - 吉修匠
  • 别再只会生成黑白方块了!用Python的qrcode库给你的二维码换个皮肤(附完整代码)
  • 2026立式食品包装机技术解析:立式粉料包装机/立式粉末包装机/立式酱料包装机/立式零食包装机/立式颗粒包装机/选择指南 - 优质品牌商家
  • OmenSuperHub终极指南:5步解锁惠普OMEN游戏本隐藏性能
  • 隐私保护计算在AI大模型中的关键技术与应用
  • 用Python和NumPy模拟一个健康预测模型:从保险案例到代码实现
  • 2026南通商铺瓷砖空鼓翘边维修机构排名 八大区商业修缮服务商盘点 - 吉修匠
  • 2026年6月成都稳压器供应商选择指南:专业、可靠与本地化服务是关键 - 2026年企业资讯
  • 2026AI Agent元年:从“会聊天“到“能干活“,万亿市场变革!企业如何抢占先机?
  • DMA控制器原理
  • 2026年硅胶灯带防水罩价格排名 - mypinpai
  • Arduino引脚扩展实战:用74HC595驱动数码管与PCB设计
  • ThinkPad R61i升级T9300处理器专用BIOS刷写包:含WinPE启动工具、校验脚本与完整操作指引
  • 2026南通厨卫瓷砖空鼓翘边维修机构排名 八大区正规服务商精选 - 吉修匠
  • 2026 无锡厨卫瓷砖空鼓翘边维修机构排名 七大区正规服务商精选 - 吉修匠
  • 2026年推荐:瘦身期亚麻籽油美味吃法靠谱吗 - mypinpai
  • 与AI同行,答案在人手中:普通人如何逆袭,稳稳向前冲?
  • 优选算法——栈