输入任意 Booking.com URL,输出 HTML 或 JSON。
Crawling API,实时呈现。获取渲染后的 HTML,或切换到 generic extractor 获取 JSON。悬停即可暂停细读。
一个 API,应对 Booking.com 抛给你的一切。
Booking.com 用 JavaScript 渲染价格、可订状态和评价,运行激进的机器人检测,并按地区和货币对结果设限。Crawling API 在真实浏览器中渲染页面,通过住宅 IP 访问它,并交给你干净的 HTML 或 JSON。
完整的 JavaScript 渲染
真实浏览器会执行页面,因此实时房价、可订日历、评价和懒加载媒体都会被捕获,而不仅仅是初始 HTML。
140M 住宅 IP
每个请求都会在 30 个地区间轮换住宅 IP,因此你能像真实的当地访客一样访问 Booking.com,看到该国家/地区的价格和货币。
拦截由我们代为处理
CAPTCHA、机器人墙和速率限制都会自动清除。无需破解,无需维护。
HTML 或 JSON
获取完整渲染的 HTML,或添加scraper=generic-extractor 以将标题、内容、图片和链接作为结构化 JSON 返回。
截图与异步
同一次调用可以捕获整页截图,或借助 webhook 和云存储异步运行。
渲染后的 HTML,或干净的 JSON。
默认情况下你会获得渲染后的 HTML。添加generic-extractor,同一个页面就会作为带类型的 JSON 返回。
页面
title · string canonical · string favicon · string
元数据
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
从 URL 到数据,一次调用完成。
每个 Booking.com 请求都走同一条路径。你发送一个 URL,其间的一切由我们来运营。
发送 URL
带上你的令牌,传入任意公开的 Booking.com URL:搜索结果、某个房源、城市页面或评价页面。
轮换代理
一个能以正确国家/地区和货币干净访问 Booking.com 的住宅 IP 和地区,取自遍布 30 个区域的 140M IP。
渲染页面
真实浏览器加载页面,因此实时房价、可订状态和评价会在捕获前完成渲染。
清除反爬
Booking.com 激进的机器人检测和速率限制都会自动处理。无需破解,无需维护。
返回 HTML 或 JSON
完整渲染的 HTML 会返回,或在你添加 generic extractor 时返回带类型的 JSON。
团队用 Booking.com 数据构建什么。
酒店房价监控
跨搜索结果和房源页面追踪房价,观察价格如何随日期和目的地变化。
OTA 聚合
拉取房源列表、价格和可订状态,为跨市场的元搜索或旅行聚合平台提供数据。
价格一致性检查
按国家/地区和货币将你自己的房价与 Booking.com 对比,快速发现价格一致性差异。
评价监控
收集住客评价和评分,追踪房源口碑并浮现反复出现的投诉。
市场研究
挖掘可订状态、入住率信号和价格趋势,为营收与竞争策略提供依据。
任意 URL,一个 API
爬取搜索结果、房源、城市页面和评价,以及你需要的任何其他站点。
抓取 Booking.com 时值得了解的事。
实时房价需要渲染
Booking.com 用 JavaScript 加载价格、可订状态和评价;Crawling API 运行真实浏览器,因此它们在捕获前就已就位。
默认 HTML,按需 JSON
你会获得完整渲染的 HTML。添加 scraper=generic-extractor 以获取解析后的标题、内容、图片和链接,或自行解析 HTML。
感知地区与货币
价格和可订状态因国家/地区和货币而异。将请求地理定向到你关注的市场,即可获得相匹配的本地结果。
仅限公开页面
Crawling API 读取公开可见的页面,无需登录,因此你获得的正是未登录访客所看到的内容。
为大规模爬取 Booking.com 而生。
Crawling API 运行在同一张网络上,这张网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Booking.com 变更时也无需打补丁。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。