任意 Amazon URL 输入。结构化 JSON 输出。
四款 Amazon 抓取器,实时输入。切换标签页,或悬停以暂停并阅读。
Amazon 的每个部分,皆已解析。
五款托管的 Amazon 抓取器共享同一个 API、同一个令牌和同一个住宅代理网络。将它们中的任意一个指向某个 URL,即可获得类型化的 JSON,而非原始 HTML。
商品详情
将商品页面解析为 name、brand、price、availability、rating、reviews_count、主图和图库、功能要点、描述、类目以及 ASIN。
搜索结果
将任意搜索或类目 URL 转为商品列表,每个商品都带有 name、ASIN、price、rating 和赞助标记,外加用于分页的结果计数。
评论
提取单条评论,包含作者、评分、标题、正文、日期和已验证购买状态,同时附带总体评分和星级分布。
畅销榜
将任意畅销榜或类目排名读取为有序 JSON:列表中每个商品的排名、name、ASIN、price 和 rating。
报价
列出某个商品页上的每个卖家,包含价格、成色、配送和 Prime 资格,让你可以跟踪购物车按钮和第三方报价。
干净的字段,而非原始 HTML。
对 amazon-product-details 的调用返回类型化的 JSON。以下是单个 Amazon 商品页面的数据结构。
标识
name · string asin · string brand · string
定价
price · string list_price · string availability · string
评分
rating · number reviews_count · number
媒体
main_image · string images · array
内容
features · array description · string categories · array
一次调用,从 URL 到 JSON。
每个 Amazon 请求都走同一条路径。你发送一个 URL,其间的一切由我们运营。
发送 URL
带上你的令牌和一款抓取器,传入任意 Amazon 商品、搜索、评论或畅销榜 URL。
轮换代理
从覆盖 30 个地区的 1.4 亿个 IP 中,选取一个能干净抵达 Amazon 的住宅 IP 和地区。
渲染页面
当 Amazon 需要 JavaScript 时,由真实浏览器加载商品页,从而捕获实时价格和评分。
清除反机器人
自动清除 Amazon 的 CAPTCHA、机器人检测和各市场的速率限制。无需求解,Amazon 变更时也无需维护。
返回 JSON
页面被解析为类型化字段并以 JSON 返回,若你更愿意自行解析,也可返回原始 HTML。
团队用 Amazon 数据构建什么。
价格与库存监控
跨数千个 ASIN 和地区跟踪价格、标价和库存,为动态调价、告警和仪表盘提供支撑。
MAP 与购物车合规
监视每个商品页上的报价和卖家,实时捕捉 MAP 违规和购物车变化。
评论与评分洞察
随时间收集评论和评分,用于情感分析、缺陷检测和大规模产品研究。
目录与内容丰富化
抓取标题、图片、功能和类目,以丰富你自己的目录或初始化产品数据库。
竞争与市场研究
读取搜索结果和畅销榜排名,以描摹需求、货架占有率和竞争对手动向。
训练数据与智能体
通过同一个 API 将干净的 Amazon JSON 输入模型、RAG 流水线和购物智能体。
抓取 Amazon 时需要了解的事项。
ASIN 与市场
每个商品都有一个 10 字符的 ASIN,每次调用都会返回。将任意 Amazon 域名(amazon.com、.co.uk、.de、.co.jp 等)指向同一款抓取器,即可获得该市场的本地化价格、库存和货币。
搜索与类目参数
附加有效的 Amazon URL 参数,如 pageno、ref 和 node,它们会直接透传,因此 amazon-serp 和 amazon-best-sellers 的分页和筛选与网站完全一致。
赞助与自然
amazon-serp 会标记赞助位,因此当你跟踪搜索占有率时,可以将付费广告与自然排名区分开来。
为规模而生
默认每秒 20 次请求,可按需提升。对于数百万个页面,将抓取器与异步的 Crawler 和 Cloud Storage 搭配,即可无人值守运行。
为大规模抓取 Amazon 而生。
Amazon 抓取器运行在同一个网络上,该网络为 46,000+ 付费客户和 70,000+ 开发者提供服务。无需购买代理,无需运行浏览器,Amazon 变更时也无需修补。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。