Crawling API / Booking.com

Booking.com 抓取器。
实时房价,完整渲染。

发送任意 Booking.com URL,即可获取完整渲染的 HTML,通过住宅代理返回,内置反爬处理。
借助 generic extractor 将其转换为 JSON。

99% 成功率140M 住宅 IP30 个地区
Booking.com URLHTML or JSONwww.booking.com/searchresults.html?ss=ParisCrawlbase路由渲染提取已渲染 HTML结构化 JSONcrawling-apigeneric-extractorbooking.com · JS 验证已通过 · 200
实时抓取动态 · Booking.com1.24M req/min流式传输中
200booking.com/country/jp.htmlSG89ms
200booking.com/searchresults.html?ss=TokyoES207ms
301booking.com/reviews/es/hotel/arts-barcelona.htmlJP188ms
200booking.com/hotel/ae/burj-al-arab-dubai.htmlCA204ms
200booking.com/searchresults.html?ss=TokyoUS104ms
200booking.com/reviews/nl/hotel/pulitzer-amsterdam.htmlGB126ms
200booking.com/searchresults.html?ss=BaliGB64ms
200booking.com/searchresults.html?ss=New+YorkUS185ms
200booking.com/searchresults.html?ss=New+YorkIN198ms
200booking.com/searchresults.html?ss=LisbonUS98ms
200booking.com/searchresults.html?ss=LisbonAU173ms
200booking.com/hotel/fr/le-meurice.htmlBR137ms
200booking.com/searchresults.html?ss=TokyoUS193ms
200booking.com/searchresults.html?ss=BaliCA159ms
200booking.com/searchresults.html?ss=BaliES143ms
200booking.com/reviews/es/hotel/arts-barcelona.htmlSG219ms
200booking.com/searchresults.html?ss=ParisNL117ms
200booking.com/searchresults.html?ss=New+YorkES179ms
301booking.com/country/it.htmlFR181ms
200booking.com/searchresults.html?ss=TokyoAU152ms
200booking.com/city/de/berlin.htmlJP61ms
200booking.com/searchresults.html?ss=LisbonBR172ms
200booking.com/searchresults.html?ss=RomeAU202ms
200booking.com/hotel/ae/burj-al-arab-dubai.htmlAU217ms
404booking.com/searchresults.html?ss=New+YorkIN217ms
200booking.com/city/us/miami.htmlDE105ms
200booking.com/country/jp.htmlSG89ms
200booking.com/searchresults.html?ss=TokyoES207ms
301booking.com/reviews/es/hotel/arts-barcelona.htmlJP188ms
200booking.com/hotel/ae/burj-al-arab-dubai.htmlCA204ms
200booking.com/searchresults.html?ss=TokyoUS104ms
200booking.com/reviews/nl/hotel/pulitzer-amsterdam.htmlGB126ms
200booking.com/searchresults.html?ss=BaliGB64ms
200booking.com/searchresults.html?ss=New+YorkUS185ms
200booking.com/searchresults.html?ss=New+YorkIN198ms
200booking.com/searchresults.html?ss=LisbonUS98ms
200booking.com/searchresults.html?ss=LisbonAU173ms
200booking.com/hotel/fr/le-meurice.htmlBR137ms
200booking.com/searchresults.html?ss=TokyoUS193ms
200booking.com/searchresults.html?ss=BaliCA159ms
200booking.com/searchresults.html?ss=BaliES143ms
200booking.com/reviews/es/hotel/arts-barcelona.htmlSG219ms
200booking.com/searchresults.html?ss=ParisNL117ms
200booking.com/searchresults.html?ss=New+YorkES179ms
301booking.com/country/it.htmlFR181ms
200booking.com/searchresults.html?ss=TokyoAU152ms
200booking.com/city/de/berlin.htmlJP61ms
200booking.com/searchresults.html?ss=LisbonBR172ms
200booking.com/searchresults.html?ss=RomeAU202ms
200booking.com/hotel/ae/burj-al-arab-dubai.htmlAU217ms
404booking.com/searchresults.html?ss=New+YorkIN217ms
200booking.com/city/us/miami.htmlDE105ms
01 实时演示

输入任意 Booking.com URL,输出 HTML 或 JSON。

Crawling API,实时呈现。获取渲染后的 HTML,或切换到 generic extractor 获取 JSON。悬停即可暂停细读。

就绪
按键 1-2 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 能力

一个 API,应对 Booking.com 抛给你的一切。

Booking.com 用 JavaScript 渲染价格、可订状态和评价,运行激进的机器人检测,并按地区和货币对结果设限。Crawling API 在真实浏览器中渲染页面,通过住宅 IP 访问它,并交给你干净的 HTML 或 JSON。

render

完整的 JavaScript 渲染

真实浏览器会执行页面,因此实时房价、可订日历、评价和懒加载媒体都会被捕获,而不仅仅是初始 HTML。

proxies

140M 住宅 IP

每个请求都会在 30 个地区间轮换住宅 IP,因此你能像真实的当地访客一样访问 Booking.com,看到该国家/地区的价格和货币。

anti-bot

拦截由我们代为处理

CAPTCHA、机器人墙和速率限制都会自动清除。无需破解,无需维护。

format

HTML 或 JSON

获取完整渲染的 HTML,或添加scraper=generic-extractor 以将标题、内容、图片和链接作为结构化 JSON 返回。

extras

截图与异步

同一次调用可以捕获整页截图,或借助 webhook 和云存储异步运行。

one token

一个 API,覆盖每个站点

Crawling API 适用于任意 URL,因此同一个令牌既覆盖 Booking.com,也覆盖你爬取的其他一切。查看实时演示.

03 输出

渲染后的 HTML,或干净的 JSON。

默认情况下你会获得渲染后的 HTML。添加generic-extractor,同一个页面就会作为带类型的 JSON 返回。

{ "title": "Paris: 1,200 hotels and apartments | Booking.com", "favicon": "https://www.booking.com/favicon.ico", "meta": { "description": "Book hotels, apartments and more on Booking.com.", "keywords": "..." }, "content": "Property results with prices, ratings, availability and reviews...", "canonical": "https://www.booking.com/searchresults.html?ss=Paris", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元数据

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

从 URL 到数据,一次调用完成。

每个 Booking.com 请求都走同一条路径。你发送一个 URL,其间的一切由我们来运营。

01

发送 URL

带上你的令牌,传入任意公开的 Booking.com URL:搜索结果、某个房源、城市页面或评价页面。

02

轮换代理

一个能以正确国家/地区和货币干净访问 Booking.com 的住宅 IP 和地区,取自遍布 30 个区域的 140M IP。

03

渲染页面

真实浏览器加载页面,因此实时房价、可订状态和评价会在捕获前完成渲染。

04

清除反爬

Booking.com 激进的机器人检测和速率限制都会自动处理。无需破解,无需维护。

05

返回 HTML 或 JSON

完整渲染的 HTML 会返回,或在你添加 generic extractor 时返回带类型的 JSON。

05 使用场景

团队用 Booking.com 数据构建什么。

USE / 01房价

酒店房价监控

跨搜索结果和房源页面追踪房价,观察价格如何随日期和目的地变化。

USE / 02OTA

OTA 聚合

拉取房源列表、价格和可订状态,为跨市场的元搜索或旅行聚合平台提供数据。

USE / 03价格一致性

价格一致性检查

按国家/地区和货币将你自己的房价与 Booking.com 对比,快速发现价格一致性差异。

USE / 04评价

评价监控

收集住客评价和评分,追踪房源口碑并浮现反复出现的投诉。

USE / 05研究

市场研究

挖掘可订状态、入住率信号和价格趋势,为营收与竞争策略提供依据。

USE / 06覆盖

任意 URL,一个 API

爬取搜索结果、房源、城市页面和评价,以及你需要的任何其他站点。

06 须知

抓取 Booking.com 时值得了解的事。

实时房价需要渲染

Booking.com 用 JavaScript 加载价格、可订状态和评价;Crawling API 运行真实浏览器,因此它们在捕获前就已就位。

默认 HTML,按需 JSON

你会获得完整渲染的 HTML。添加 scraper=generic-extractor 以获取解析后的标题、内容、图片和链接,或自行解析 HTML。

感知地区与货币

价格和可订状态因国家/地区和货币而异。将请求地理定向到你关注的市场,即可获得相匹配的本地结果。

仅限公开页面

Crawling API 读取公开可见的页面,无需登录,因此你获得的正是未登录访客所看到的内容。

07 为何选择 Crawlbase

为大规模爬取 Booking.com 而生。

Crawling API 运行在同一张网络上,这张网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Booking.com 变更时也无需打补丁。

99%
平均请求成功率
140M
住宅 IP,另加 98M 数据中心 IP
30
个地区,提供准确的本地结果
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。

08 常见问题

Booking.com 抓取相关问题。

带着你的令牌,将 Booking.com URL 发送到 Crawlbase Crawling API。Crawlbase 会轮换住宅代理,在真实浏览器中渲染页面,清除机器人检测,并返回完整渲染的 HTML。添加 scraper=generic-extractor 即可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染后的 HTML;添加 generic extractor(scraper=generic-extractor)即可以 JSON 形式接收标题、元数据、内容、图片和链接,或自行解析 HTML。
会。真实浏览器执行页面,因此由 JavaScript 渲染的房价、可订状态和评价会在捕获前加载,而不仅仅是初始 HTML。
Crawlbase 将每个请求通过遍布 30 个地区的轮换住宅 IP 路由,并自动清除机器人检测。你无需管理代理或破解 CAPTCHA,Booking.com 更改其配置时也没有什么需要维护。
可以。Booking.com 按地区和货币设限,因此将请求地理定向到特定国家/地区,会返回当地访客所能看到的本地价格和可订状态。
任意公开 URL:搜索结果、单个房源页面、城市和国家页面,以及评价页面。同一个 API 也适用于任何其他站点。
免费开始,赠送最多 10,000 次请求且无需信用卡。付费套餐随用量扩展,同一个令牌可在 Crawling API 和每个 Crawlbase 抓取器上通用。

开始抓取 Booking.com。
跳过地区拦截和机器人墙。

免费起步,赠送最多 10,000 次请求。一个令牌通用于 Crawling API 和每个抓取器。