采集器 / Walmart

Walmart 采集器。
任意 URL 转为 JSON。

将任意 Walmart URL 转为结构化 JSON。商品详情、搜索结果和分类列表。
内置住宅代理和反爬处理。无需运行浏览器。

99% 成功率1.4 亿住宅 IP30 个地区
Walmart URL结构化 JSONwalmart.com/ip/55088165Crawlbase路由渲染提取商品详情搜索结果品类列表walmart-product-detailswalmart-serpwalmart-categorywalmart.com · captcha cleared · 200
实时抓取信息流 · Walmart1.24M req/min正在流式传输
301walmart.com/browse/sports/4125AU190ms
200walmart.com/ip/778812003DE63ms
200walmart.com/ip/778812003CA71ms
200walmart.com/ip/304561120SG110ms
200walmart.com/browse/electronics/tvs/3944SG76ms
200walmart.com/browse/home/4044IN180ms
200walmart.com/search?q=4k+tvGB129ms
200walmart.com/ip/778812003NL124ms
200walmart.com/search?q=gaming+laptopJP167ms
200walmart.com/ip/55088165AU72ms
200walmart.com/ip/778812003NL219ms
200walmart.com/cp/grocery/976759AU42ms
200walmart.com/search?q=coffee+makerES48ms
301walmart.com/ip/55088165FR59ms
200walmart.com/browse/toys/4171ES205ms
301walmart.com/browse/electronics/tvs/3944JP126ms
200walmart.com/search?q=gaming+laptopCA214ms
200walmart.com/ip/55088165SG103ms
200walmart.com/search?q=coffee+makerIN124ms
200walmart.com/search?q=4k+tvFR54ms
200walmart.com/browse/toys/4171US72ms
200walmart.com/ip/778812003BR41ms
200walmart.com/search?q=gaming+laptopUS186ms
200walmart.com/browse/electronics/tvs/3944FR57ms
200walmart.com/browse/electronics/tvs/3944DE181ms
200walmart.com/ip/660092145ES60ms
301walmart.com/browse/sports/4125AU190ms
200walmart.com/ip/778812003DE63ms
200walmart.com/ip/778812003CA71ms
200walmart.com/ip/304561120SG110ms
200walmart.com/browse/electronics/tvs/3944SG76ms
200walmart.com/browse/home/4044IN180ms
200walmart.com/search?q=4k+tvGB129ms
200walmart.com/ip/778812003NL124ms
200walmart.com/search?q=gaming+laptopJP167ms
200walmart.com/ip/55088165AU72ms
200walmart.com/ip/778812003NL219ms
200walmart.com/cp/grocery/976759AU42ms
200walmart.com/search?q=coffee+makerES48ms
301walmart.com/ip/55088165FR59ms
200walmart.com/browse/toys/4171ES205ms
301walmart.com/browse/electronics/tvs/3944JP126ms
200walmart.com/search?q=gaming+laptopCA214ms
200walmart.com/ip/55088165SG103ms
200walmart.com/search?q=coffee+makerIN124ms
200walmart.com/search?q=4k+tvFR54ms
200walmart.com/browse/toys/4171US72ms
200walmart.com/ip/778812003BR41ms
200walmart.com/search?q=gaming+laptopUS186ms
200walmart.com/browse/electronics/tvs/3944FR57ms
200walmart.com/browse/electronics/tvs/3944DE181ms
200walmart.com/ip/660092145ES60ms
01 在线演示

输入任意 Walmart URL。输出结构化 JSON。

三个 Walmart 采集器,实时输入。切换标签页,或悬停暂停以便阅读。

就绪
按键 1-3 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 采集器

Walmart 的每个部分,均已解析。

三个托管的 Walmart 采集器共享同一个 API、同一个令牌和同一套住宅代理网络。将其中任意一个指向某个 URL,即可获得类型化的 JSON,而非原始 HTML。

walmart-product-details

商品详情

将商品页面解析为 标题、品牌、价格、评分、reviewsCount、图片、功能要点、描述、 soldBy、配送选项、保修以及 Walmart 的 itemId

walmart-serp

搜索结果

将任意搜索 URL 转为商品列表,每个商品包含位置、标题、价格、评分和评论数,以及畅销和缺货标记、结果数量和分页。

walmart-category

分类列表

将任意分类或浏览 URL 读取为有序的 JSON:逐页返回每个商品的位置、标题、价格、评分和库存状态。

one token

三者共用同一个 API

只需更改一个参数即可切换采集器。底层的代理、地理定位、渲染和反爬处理保持一致。 查看在线演示

03 输出

干净的字段,而非原始 HTML。

walmart-product-details 的调用会返回类型化的 JSON。以下是单个 Walmart 商品页面的数据结构。

{ "title": "onn. 50 inch 4K UHD Roku Smart TV", "brand": "onn.", "price": "$248.00", "currency": "USD", "itemId": "55088165", "ratings": "4.6", "reviewsCount": "1240", "soldBy": "Walmart.com", "deliveryOption": "Free shipping", "images": [ "...", "..." ], "features": [ "4K UHD", "..." ], "warranty": "1-year limited" }

标识

title · string  brand · string  itemId · string

定价

price · string  currency · string

评分

ratings · string  reviewsCount · string  reviews · array

履约

soldBy · string  deliveryOption · string  returnPolicy · string

内容

features · array  description · string  images · array

04 工作原理

一次调用,从 URL 到 JSON。

每个 Walmart 请求都经过同一条路径。你发送一个 URL,中间的一切由我们处理。

01

发送 URL

携带你的令牌和一个采集器,传入任意 Walmart 商品、搜索或分类 URL。

02

轮换代理

从覆盖 30 个地区的 1.4 亿 IP 中选取一个可干净访问 Walmart 的住宅 IP 和地理位置。

03

渲染页面

当 Walmart 需要 JavaScript 时,由真实浏览器加载列表,从而捕获实时价格和库存。

04

清除反爬

Walmart 的机器人拦截页和访问检查会被自动清除。无需求解任何内容,Walmart 变更时也无需维护。

05

返回 JSON

页面被解析为类型化字段并以 JSON 返回,如果你更愿意自行解析,也可返回原始 HTML。

05 应用场景

各团队基于 Walmart 数据构建什么。

USE / 01定价

价格与库存监控

跨数千个 Walmart 商品和地区跟踪价格与库存,为重新定价、告警和仪表板提供支持。

USE / 02商品组合

商品组合与目录

读取分类和搜索页面,以描绘 Walmart 的目录、货架占比以及随时间推移的新品情况。

USE / 03评论

评论与评分洞察

大规模收集评分和评论,用于情感分析、缺陷检测和产品研究。

USE / 04履约

卖家与履约跟踪

查看是谁售出了商品以及配送选项,以跟踪第一方与第三方以及购买栏(buy box)。

USE / 05研究

竞争与市场研究

将 Walmart 的列表与其他零售商进行对比,以描绘需求、价格差距和竞争对手动向。

USE / 06AI

训练数据与智能体

通过同一个 API 将干净的 Walmart JSON 输入到模型、RAG 流程和购物智能体中。

06 须知

采集 Walmart 时需要了解的事项。

itemId 与规范 URL

Walmart 商品以 /ip/ URL 中的数字 itemId 作为键。每个响应都会返回该 itemId 以及规范的 productLink,因此你可以干净地去重,并与自己的目录进行关联。

第一方与第三方

soldBy 字段会告诉你商品是由 Walmart.com 还是由第三方卖家履约,而这正是驱动购买栏(buy box)、MAP 和商品组合分析的因素。

搜索与分类共用同一结构

walmart-serp 读取关键词搜索,walmart-category 读取浏览页面;两者返回带有位置和分页的相同商品对象,因此一个解析器即可处理二者。

实时库存与配送

outOfStock 和 deliveryOption 字段反映实时可用性,因此跨地区的地理定位对于准确的本地库存和定价至关重要。

07 为何选择 Crawlbase

专为大规模采集 Walmart 而打造。

Walmart 采集器运行在同一套网络上,该网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Walmart 变更时也无需修补任何内容。

99%
平均请求成功率
140M
住宅 IP,另加 9800 万数据中心 IP
30
用于准确本地定价的地区数
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。

08 常见问题

Walmart 采集常见问题。

携带你的令牌和 scraper=walmart-product-details,将 Walmart 商品 URL 发送到 Crawlbase Crawling API。Crawlbase 会处理代理、渲染和反爬检查,并返回干净的 JSON,其中包含 title、brand、price、ratings、reviewsCount、soldBy、deliveryOption、images 和 features 等字段。
三个托管采集器覆盖 Walmart:walmart-product-details 用于商品页面,walmart-serp 用于搜索结果,walmart-category 用于分类和浏览页面。
Crawlbase 会将每个请求通过覆盖 30 个地区的轮换住宅 IP 转发,在需要时渲染 JavaScript,并自动清除机器人检查。你无需管理代理或求解 CAPTCHA,Walmart 变更其反爬设置时你也无需维护任何内容。
不需要。跨 1.4 亿住宅 IP 的代理轮换和地理定位是 Walmart 采集器的一部分。你发送一个 URL,即可收到结构化数据。
可以。使用 walmart-serp 将搜索 URL 解析为商品列表,使用 walmart-category 读取任意分类或浏览页面,每个商品均带有位置、标题、价格、评分和库存状态,以及结果数量和分页。
是的。每个 Walmart 采集器都会返回已解析的类型化 JSON。如果你更愿意自行解析,也可以请求原始 HTML。
你可以免费开始,含最多 10,000 次请求且无需信用卡。付费套餐随用量扩展,同一个令牌可在每个 Crawlbase 采集器和 Crawling API 中通用。

开始采集 Walmart。
无需代理,无需浏览器。

免费开始,含最多 10,000 次请求。一个令牌适用于每个 Walmart 采集器。