Crawling API / Target

Target 抓取器。
价格,完整渲染。

发送任意 Target URL,即可拿回完整渲染的 HTML,通过住宅代理并内置反机器人处理。
使用 generic extractor 将其转为 JSON。

99% 成功率1.4 亿住宅 IP30 个地区
目标 URLHTML or JSONtarget.com/p/-/A-79348122Crawlbase路由渲染提取已渲染 HTML结构化 JSONcrawling-apigeneric-extractortarget.com · captcha cleared · 200
实时抓取动态 · Target1.24M req/min流式传输
301target.com/s?searchTerm=coffee+makerBR96ms
200target.com/c/grocery/-/N-5xt1aNL107ms
200target.com/s?searchTerm=coffee+makerBR185ms
200target.com/s?searchTerm=coffee+makerSG97ms
200target.com/c/furniture/-/N-5xtnrBR132ms
200target.com/s?searchTerm=air+fryerAU91ms
200target.com/s?searchTerm=coffee+makerNL156ms
200target.com/s?searchTerm=air+fryerES155ms
200target.com/s?searchTerm=4k+tvIN75ms
200target.com/p/-/A-85176342JP96ms
200target.com/s?searchTerm=air+fryerUS49ms
200target.com/c/grocery/-/N-5xt1aUS171ms
200target.com/p/-/A-85176342ES85ms
200target.com/c/furniture/-/N-5xtnrBR183ms
200target.com/s?searchTerm=coffee+makerIN127ms
200target.com/c/grocery/-/N-5xt1aUS55ms
200target.com/s?searchTerm=gaming+laptopFR189ms
404target.com/s?searchTerm=4k+tvUS178ms
200target.com/c/grocery/-/N-5xt1aES84ms
200target.com/c/tvs-home-theater-electronics/-/N-5xtdjSG98ms
200target.com/s?searchTerm=gaming+laptopBR125ms
200target.com/s?searchTerm=lego+setES159ms
301target.com/p/-/A-13290118SG90ms
200target.com/s?searchTerm=lego+setGB169ms
200target.com/s?searchTerm=coffee+makerCA163ms
301target.com/c/furniture/-/N-5xtnrDE216ms
301target.com/s?searchTerm=coffee+makerBR96ms
200target.com/c/grocery/-/N-5xt1aNL107ms
200target.com/s?searchTerm=coffee+makerBR185ms
200target.com/s?searchTerm=coffee+makerSG97ms
200target.com/c/furniture/-/N-5xtnrBR132ms
200target.com/s?searchTerm=air+fryerAU91ms
200target.com/s?searchTerm=coffee+makerNL156ms
200target.com/s?searchTerm=air+fryerES155ms
200target.com/s?searchTerm=4k+tvIN75ms
200target.com/p/-/A-85176342JP96ms
200target.com/s?searchTerm=air+fryerUS49ms
200target.com/c/grocery/-/N-5xt1aUS171ms
200target.com/p/-/A-85176342ES85ms
200target.com/c/furniture/-/N-5xtnrBR183ms
200target.com/s?searchTerm=coffee+makerIN127ms
200target.com/c/grocery/-/N-5xt1aUS55ms
200target.com/s?searchTerm=gaming+laptopFR189ms
404target.com/s?searchTerm=4k+tvUS178ms
200target.com/c/grocery/-/N-5xt1aES84ms
200target.com/c/tvs-home-theater-electronics/-/N-5xtdjSG98ms
200target.com/s?searchTerm=gaming+laptopBR125ms
200target.com/s?searchTerm=lego+setES159ms
301target.com/p/-/A-13290118SG90ms
200target.com/s?searchTerm=lego+setGB169ms
200target.com/s?searchTerm=coffee+makerCA163ms
301target.com/c/furniture/-/N-5xtnrDE216ms
01 现场演示

输入任意 Target URL。输出 HTML 或 JSON。

实时演示 Crawling API。获取渲染后的 HTML,或切换到 generic extractor 获取 JSON。悬停即可暂停阅读。

就绪
按键 1-2 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一次请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 功能

一个 API,应对 Target 抛给你的一切。

Target 在客户端渲染价格、促销、变体和库存,并进行激进的拦截。Crawling API 在真实浏览器中渲染它,通过住宅 IP 访问,并交给你干净的 HTML 或 JSON。

render

完整 JavaScript 渲染

真实浏览器执行页面,因此客户端的价格、促销、变体、评分和库存状况都会被捕获,而不仅仅是初始 HTML。

proxies

1.4 亿住宅 IP

每次请求都会在 30 个地区之间轮换住宅 IP,因此你能像真实的美国购物者一样访问 Target 并获得美国定价。

anti-bot

拦截由我们处理

CAPTCHA、机器人拦截墙和速率限制都会被自动清除。无需破解,无需维护。

format

HTML 或 JSON

获取完整渲染的 HTML,或添加 scraper=generic-extractor 即可将标题、内容、图片和链接作为结构化 JSON 返回。

extras

截图和异步

同一次调用即可捕获整页截图,或通过 webhook 和云存储异步运行。

one token

一个 API 通用于所有站点

Crawling API 适用于任意 URL,因此同一个令牌可覆盖 Target 以及你抓取的其他一切。 查看现场演示.

03 输出

渲染的 HTML,或干净的 JSON。

默认情况下你会得到渲染后的 HTML。添加 generic-extractor 后,同一页面会以类型化 JSON 返回。

{ "title": "4K UHD TV 55 inch : Target", "favicon": "https://www.target.com/favicon.ico", "meta": { "description": "Shop the 55 inch 4K UHD TV at Target...", "keywords": "..." }, "content": "55 inch 4K UHD smart TV with HDR, streaming apps and voice control...", "canonical": "https://www.target.com/p/-/A-79348122", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元数据

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

一次调用,从 URL 到数据。

每次 Target 请求都经过相同的路径。你发送一个 URL,其间的一切由我们操作。

01

发送 URL

用你的令牌传入任意公开的 Target URL:商品页、类目页、合集页或搜索页。

02

轮换代理

从 30 个地区的 1.4 亿 IP 中抽取一个能顺畅访问 Target 的美国住宅 IP 和地理位置。

03

渲染页面

真实浏览器加载页面,因此价格、促销、变体、评分和库存状态在捕获前完成渲染。

04

清除反机器人

Target 的机器人检测和速率限制会被自动处理,地理定位返回美国定价。无需破解,无需维护。

05

返回 HTML 或 JSON

返回完整渲染的 HTML,或在你添加 generic extractor 时返回类型化 JSON。

05 使用场景

团队用 Target 数据构建什么。

USE / 01价格

价格和促销监控

跨 Target 追踪商品价格、优惠和促销,快速反应并保持竞争力。

USE / 02品类

品类和目录追踪

监视类目页和搜索页,跟进 Target 上架、新增和下架了哪些商品。

USE / 03MAP

MAP 合规监控

对照最低广告价格政策检查标价,尽早标记违规。

USE / 04竞争对手

竞争对手分析

将价格、评分和库存状况与你自己的品类及其他零售商进行对比。

USE / 05库存

库存追踪

监控库存状态和变体,让你了解哪些有货、库存偏低或已售罄。

USE / 06AI

AI 和购物智能体

通过一个 API 将干净的商品数据输入模型、RAG 管道和购物智能体。

06 须知

抓取 Target 时应了解的事项。

像真实浏览器一样渲染

Target 在客户端加载价格、促销、变体和库存;Crawling API 运行真实浏览器,因此这些值在捕获前完成渲染。

默认 HTML,按需 JSON

你会得到完整渲染的 HTML。添加 scraper=generic-extractor 即可获得解析后的标题、内容、图片和链接,或自行解析 HTML。

仅公开页面

Crawling API 读取公开可见的页面,无需登录,因此你得到的是未登录访客所看到的内容。

地理定位的美国定价

请求通过 30 个地区的美国住宅 IP 路由,因此价格和促销与美国购物者所见一致,且无需管理代理。

07 为何选择 Crawlbase

为大规模抓取 Target 而打造。

Crawling API 运行在同一张网络上,为 46,000+ 付费客户和 70,000+ 开发者提供服务。无需购买代理,无需运行浏览器,Target 变动时也无需打补丁。

99%
平均请求成功率
140M
住宅 IP,另加 9,800 万数据中心 IP
30
用于精准本地结果的地区数
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。

08 FAQ

Target 抓取问题。

用你的令牌将 Target URL 发送到 Crawlbase Crawling API。Crawlbase 会轮换住宅代理、在真实浏览器中渲染页面、清除机器人检查,并返回完整渲染的 HTML。添加 scraper=generic-extractor 即可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染后的 HTML;添加 generic extractor(scraper=generic-extractor)即可以 JSON 形式接收标题、元数据、内容、图片和链接,或自行解析 HTML。
可以。真实浏览器执行页面,因此客户端的价格、促销、变体、评分和库存状况都会被捕获,而不仅仅是初始 HTML。
Crawlbase 将每次请求通过 30 个地区的轮换住宅 IP 路由,并自动清除机器人检查和速率限制。你无需管理代理或破解 CAPTCHA,Target 更改设置时也无需维护。
可以。通过美国住宅 IP 的地理定位会返回美国购物者所看到的价格和促销,因此监控保持准确和本地化。
任意公开 URL:商品页、类目页和合集页,以及搜索结果页。同一个 API 也适用于任何其他站点。
免费开始,赠送最多 10,000 次请求,无需信用卡。付费套餐随用量扩展,同一个令牌可通用于 Crawling API 和每个 Crawlbase 抓取器。

开始抓取 Target。
跳过代理和拦截。

免费开始,赠送最多 10,000 次请求。一个令牌通用于 Crawling API 和每个抓取器。