Crawling API / Tmall

Tmall 采集器。
任意页面,完整渲染。

发送任意天猫 URL,即可取回完整渲染的 HTML,通过中国住宅代理返回,并内置反爬处理。
使用通用提取器将其转为 JSON。

99% 成功率1.4 亿住宅 IP30 个地区
Tmall 网址HTML or JSONdetail.tmall.com/item.htm?id=623456789012Crawlbase路由渲染提取渲染后的 HTML结构化 JSONcrawling-apigeneric-extractortmall.com · 已通过验证码 · 200
实时爬取信息流 · Tmall1.24M req/min正在流式传输
200detail.tmall.com/item.htm?id=671209384756JP180ms
200www.tmall.com/SG172ms
200detail.tmall.com/item.htm?id=655190284417DE132ms
200list.tmall.com/search_product.htm?q=air+fryerDE180ms
200apple.tmall.com/CA209ms
200detail.tmall.com/item.htm?id=655190284417US137ms
200list.tmall.com/search_product.htm?cat=50016349GB158ms
200list.tmall.com/search_product.htm?cat=50016349AU125ms
200detail.tmall.com/item.htm?id=618029471053AU210ms
301nike.tmall.com/ES80ms
200list.tmall.com/search_product.htm?cat=50016349ES114ms
200detail.tmall.com/item.htm?id=671209384756BR67ms
200detail.tmall.com/item.htm?id=623456789012FR47ms
200detail.tmall.com/item.htm?id=618029471053FR47ms
200list.tmall.com/search_product.htm?q=coffee+makerDE107ms
200chaoshi.tmall.com/NL60ms
200apple.tmall.com/AU118ms
200detail.tmall.com/item.htm?id=549120837465ES124ms
200list.tmall.com/search_product.htm?q=coffee+makerFR90ms
200list.tmall.com/search_product.htm?q=running+shoesBR219ms
200detail.tmall.com/item.htm?id=671209384756SG192ms
200chaoshi.tmall.com/JP156ms
200detail.tmall.com/item.htm?id=602384715209BR58ms
200list.tmall.com/search_product.htm?cat=50025135DE122ms
200detail.tmall.com/item.htm?id=549120837465JP166ms
200list.tmall.com/search_product.htm?q=air+fryerSG79ms
200detail.tmall.com/item.htm?id=671209384756JP180ms
200www.tmall.com/SG172ms
200detail.tmall.com/item.htm?id=655190284417DE132ms
200list.tmall.com/search_product.htm?q=air+fryerDE180ms
200apple.tmall.com/CA209ms
200detail.tmall.com/item.htm?id=655190284417US137ms
200list.tmall.com/search_product.htm?cat=50016349GB158ms
200list.tmall.com/search_product.htm?cat=50016349AU125ms
200detail.tmall.com/item.htm?id=618029471053AU210ms
301nike.tmall.com/ES80ms
200list.tmall.com/search_product.htm?cat=50016349ES114ms
200detail.tmall.com/item.htm?id=671209384756BR67ms
200detail.tmall.com/item.htm?id=623456789012FR47ms
200detail.tmall.com/item.htm?id=618029471053FR47ms
200list.tmall.com/search_product.htm?q=coffee+makerDE107ms
200chaoshi.tmall.com/NL60ms
200apple.tmall.com/AU118ms
200detail.tmall.com/item.htm?id=549120837465ES124ms
200list.tmall.com/search_product.htm?q=coffee+makerFR90ms
200list.tmall.com/search_product.htm?q=running+shoesBR219ms
200detail.tmall.com/item.htm?id=671209384756SG192ms
200chaoshi.tmall.com/JP156ms
200detail.tmall.com/item.htm?id=602384715209BR58ms
200list.tmall.com/search_product.htm?cat=50025135DE122ms
200detail.tmall.com/item.htm?id=549120837465JP166ms
200list.tmall.com/search_product.htm?q=air+fryerSG79ms
01 实时演示

输入任意天猫 URL。输出 HTML 或 JSON。

实时演示 Crawling API。获取渲染后的 HTML,或切换到通用提取器获取 JSON。悬停暂停以阅读。

就绪
按键 1-2 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 功能

一套 API,应对天猫抛给你的一切。

天猫通过阿里巴巴服务渲染产品详情、价格和评价,背后设有严格的反爬机制,并按地区限定在中国。Crawling API 在真实浏览器中渲染页面,通过中国住宅 IP 访问,并向你返回干净的 HTML 或 JSON。

render

完整 JavaScript 渲染

真实浏览器会执行页面,因此通过阿里巴巴服务加载的产品详情、价格、规格、评分和评价都会被捕获,而不仅是初始 HTML。

proxies

中国住宅 IP

天猫按地区限定在中国。每个请求都会轮换中国或亚洲住宅 IP,让你像真实的本地购物者一样访问天猫。

anti-bot

拦截由我们处理

阿里巴巴的 CAPTCHA、机器人防护墙和速率限制都会被自动清除。无需破解,无需维护。

format

HTML 或 JSON

获取完整渲染的 HTML,或添加 scraper=generic-extractor,即可将标题、内容、图片和链接作为结构化 JSON 返回。

extras

截图与异步

同一次调用即可捕获整页截图,或配合 webhook 和云存储异步运行。

one token

一套 API 适配所有站点

Crawling API 适用于任意 URL,因此同一个令牌既覆盖天猫,也覆盖你爬取的其他一切。 查看实时演示.

03 输出

渲染后的 HTML,或干净的 JSON。

默认情况下,你会获得渲染后的 HTML。添加 generic-extractor,同一页面即会以类型化 JSON 返回。

{ "title": "Product listing | Tmall.com", "favicon": "https://www.tmall.com/favicon.ico", "meta": { "description": "Tmall.com: China's premier B2C online marketplace.", "keywords": "..." }, "content": "Product title, price, specs, ratings and seller info...", "canonical": "https://detail.tmall.com/item.htm?id=623456789012", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元数据

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

一次调用,从 URL 到数据。

每个天猫请求都走同一条路径。你发送一个 URL,其余的一切由我们运行。

01

发送 URL

带上你的令牌传入任意公开天猫 URL:产品详情页、搜索、分类或旗舰店。

02

轮换代理

一个中国或亚洲住宅 IP,从遍布 30 个地区的 1.4 亿个 IP 中选取,可干净地访问按地区限定的天猫。

03

渲染页面

真实浏览器会加载页面,使阿里巴巴提供的产品详情、价格、规格和评价在捕获前完成渲染。

04

清除反爬

天猫严格的阿里巴巴机器人检测和速率限制都会被自动处理。无需破解,无需维护。

05

返回 HTML 或 JSON

完整渲染的 HTML 会返回,或在你添加通用提取器时返回类型化 JSON。

05 应用场景

团队基于天猫数据构建什么。

USE / 01价格

价格与竞品监控

追踪天猫各卖家的产品价格、促销和折扣,以便与你自己的商品列表进行对比。

USE / 02目录

产品与目录数据

从详情页拉取标题、规格、图片、评分和卖家信息,用于构建和丰富产品目录。

USE / 03品牌

品牌保护

监控旗舰店和第三方店铺,防范未授权卖家、假冒商品和最低广告价格(MAP)违规。

USE / 04市场

中国市场研究

衡量中国电商中的需求、品类趋势和商品结构,为市场进入和战略提供依据。

USE / 05评价

评价与情感分析

收集评分和评价文本,了解中国购物者对产品和竞品的看法。

USE / 06覆盖范围

任意 URL,一套 API

爬取产品、搜索、分类和店铺页面,以及你需要的任何其他站点。

06 说明

采集天猫时需要了解的要点。

按地区定向到中国

天猫按地区限定在中国,因此 Crawling API 通过中国和亚洲住宅 IP 路由请求,以干净地获取产品、价格和评价数据。

默认 HTML,按需 JSON

你会获得完整渲染的 HTML。添加 scraper=generic-extractor 即可获得已解析的标题、内容、图片和链接,或自行解析 HTML。

像真实浏览器一样渲染

产品详情、价格和评价通过阿里巴巴服务加载;真实浏览器会运行页面,使这些动态内容在提取前被捕获。

处理严格的反爬

阿里巴巴运行重度的机器人检测和 CAPTCHA。Crawling API 会自动清除它们,让你无需管理代理或破解器。

07 为什么选择 Crawlbase

为大规模爬取天猫而生。

Crawling API 运行在同一张网络上,这张网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,天猫变更时也无需修补任何东西。

99%
平均请求成功率
140M
住宅 IP,另有 9,800 万数据中心 IP
30
个地区,带来精准的本地结果
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。

08 常见问题

天猫采集常见问题。

带上你的令牌将天猫 URL 发送到 Crawlbase Crawling API。Crawlbase 会轮换一个中国住宅代理,在真实浏览器中渲染页面,清除机器人检测,并返回完整渲染的 HTML。添加 scraper=generic-extractor 即可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染后的 HTML;添加通用提取器(scraper=generic-extractor)即可以 JSON 形式接收标题、元数据、内容、图片和链接,或自行解析 HTML。
会。天猫通过阿里巴巴服务加载产品详情、价格和评价,因此真实浏览器会执行页面并捕获动态内容,而不仅是初始 HTML。
天猫按地区限定在中国。Crawlbase 会将请求按地区定向到中国和亚洲住宅 IP,使请求干净地访问天猫,无需你自行寻找本地代理。
Crawlbase 会将每个请求通过轮换的住宅 IP 路由,并自动清除阿里巴巴的机器人检测。你无需管理代理或破解 CAPTCHA,天猫变更其配置时也无需维护任何东西。
任意公开 URL:detail.tmall.com 上的产品详情页、list.tmall.com 上的搜索和分类列表、旗舰店页面以及天猫超市。同一套 API 也适用于任何其他站点。
免费开始,赠送最多 10,000 次请求,无需信用卡。付费套餐随用量扩展,同一个令牌可在 Crawling API 和每个 Crawlbase 采集器之间通用。

开始采集天猫。
访问中国,免受拦截。

免费开始,赠送最多 10,000 次请求。一个令牌通用于 Crawling API 和每个采集器。