输入任意天猫 URL。输出 HTML 或 JSON。
实时演示 Crawling API。获取渲染后的 HTML,或切换到通用提取器获取 JSON。悬停暂停以阅读。
一套 API,应对天猫抛给你的一切。
天猫通过阿里巴巴服务渲染产品详情、价格和评价,背后设有严格的反爬机制,并按地区限定在中国。Crawling API 在真实浏览器中渲染页面,通过中国住宅 IP 访问,并向你返回干净的 HTML 或 JSON。
完整 JavaScript 渲染
真实浏览器会执行页面,因此通过阿里巴巴服务加载的产品详情、价格、规格、评分和评价都会被捕获,而不仅是初始 HTML。
中国住宅 IP
天猫按地区限定在中国。每个请求都会轮换中国或亚洲住宅 IP,让你像真实的本地购物者一样访问天猫。
拦截由我们处理
阿里巴巴的 CAPTCHA、机器人防护墙和速率限制都会被自动清除。无需破解,无需维护。
HTML 或 JSON
获取完整渲染的 HTML,或添加 scraper=generic-extractor,即可将标题、内容、图片和链接作为结构化 JSON 返回。
截图与异步
同一次调用即可捕获整页截图,或配合 webhook 和云存储异步运行。
渲染后的 HTML,或干净的 JSON。
默认情况下,你会获得渲染后的 HTML。添加 generic-extractor,同一页面即会以类型化 JSON 返回。
页面
title · string canonical · string favicon · string
元数据
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
一次调用,从 URL 到数据。
每个天猫请求都走同一条路径。你发送一个 URL,其余的一切由我们运行。
发送 URL
带上你的令牌传入任意公开天猫 URL:产品详情页、搜索、分类或旗舰店。
轮换代理
一个中国或亚洲住宅 IP,从遍布 30 个地区的 1.4 亿个 IP 中选取,可干净地访问按地区限定的天猫。
渲染页面
真实浏览器会加载页面,使阿里巴巴提供的产品详情、价格、规格和评价在捕获前完成渲染。
清除反爬
天猫严格的阿里巴巴机器人检测和速率限制都会被自动处理。无需破解,无需维护。
返回 HTML 或 JSON
完整渲染的 HTML 会返回,或在你添加通用提取器时返回类型化 JSON。
团队基于天猫数据构建什么。
价格与竞品监控
追踪天猫各卖家的产品价格、促销和折扣,以便与你自己的商品列表进行对比。
产品与目录数据
从详情页拉取标题、规格、图片、评分和卖家信息,用于构建和丰富产品目录。
品牌保护
监控旗舰店和第三方店铺,防范未授权卖家、假冒商品和最低广告价格(MAP)违规。
中国市场研究
衡量中国电商中的需求、品类趋势和商品结构,为市场进入和战略提供依据。
评价与情感分析
收集评分和评价文本,了解中国购物者对产品和竞品的看法。
任意 URL,一套 API
爬取产品、搜索、分类和店铺页面,以及你需要的任何其他站点。
采集天猫时需要了解的要点。
按地区定向到中国
天猫按地区限定在中国,因此 Crawling API 通过中国和亚洲住宅 IP 路由请求,以干净地获取产品、价格和评价数据。
默认 HTML,按需 JSON
你会获得完整渲染的 HTML。添加 scraper=generic-extractor 即可获得已解析的标题、内容、图片和链接,或自行解析 HTML。
像真实浏览器一样渲染
产品详情、价格和评价通过阿里巴巴服务加载;真实浏览器会运行页面,使这些动态内容在提取前被捕获。
处理严格的反爬
阿里巴巴运行重度的机器人检测和 CAPTCHA。Crawling API 会自动清除它们,让你无需管理代理或破解器。
为大规模爬取天猫而生。
Crawling API 运行在同一张网络上,这张网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,天猫变更时也无需修补任何东西。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。