Crawling API / Hotels.com

Hotels.com 抓取工具。
实时价格,完整渲染。

发送任意 Hotels.com URL,即可获得完整渲染的 HTML,其中已加载房间价格和空房信息,通过住宅代理传输并内置反爬处理。
使用通用提取器将其转换为 JSON。

99% 成功率1.4 亿住宅 IP30 个地区
Hotels.com URLHTML or JSONhotels.com/Hotel-SearchCrawlbase路由渲染提取已渲染的 HTML结构化 JSONcrawling-apigeneric-extractorhotels.com · JS 质询已通过 · 200
实时抓取信息流 · Hotels.com1.24M req/min流式传输
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsAU74ms
200hotels.com/search?q=beach+resortCA40ms
200hotels.com/Paris-Hotels.d179900.Travel-Guide-HotelsIN109ms
200hotels.com/ho138224/JP142ms
200hotels.com/reviews/ho138224/GB63ms
200hotels.com/Hotel-Search?destination=SydneyBR199ms
200hotels.com/Hotel-Search?destination=Tokyo&sort=PRICE_LOW_TO_HIGHSG167ms
200hotels.com/ho138224/SG142ms
200hotels.com/Hotel-Search?destination=LondonES57ms
200hotels.com/reviews/ho138224/AU187ms
200hotels.com/Hotel-Search?destination=New+YorkJP168ms
200hotels.com/ho260539/AU192ms
200hotels.com/ho260539/US121ms
200hotels.com/ho512847/US203ms
200hotels.com/ho512847/BR180ms
200hotels.com/reviews/ho138224/BR188ms
200hotels.com/ho260539/JP102ms
200hotels.com/ho260539/US218ms
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsGB205ms
200hotels.com/Hotel-Search?destination=New+YorkES60ms
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsAU102ms
200hotels.com/ho260539/ES216ms
301hotels.com/reviews/ho138224/DE48ms
200hotels.com/ho260539/BR93ms
404hotels.com/search?q=beach+resortBR57ms
200hotels.com/Paris-Hotels.d179900.Travel-Guide-HotelsJP202ms
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsAU74ms
200hotels.com/search?q=beach+resortCA40ms
200hotels.com/Paris-Hotels.d179900.Travel-Guide-HotelsIN109ms
200hotels.com/ho138224/JP142ms
200hotels.com/reviews/ho138224/GB63ms
200hotels.com/Hotel-Search?destination=SydneyBR199ms
200hotels.com/Hotel-Search?destination=Tokyo&sort=PRICE_LOW_TO_HIGHSG167ms
200hotels.com/ho138224/SG142ms
200hotels.com/Hotel-Search?destination=LondonES57ms
200hotels.com/reviews/ho138224/AU187ms
200hotels.com/Hotel-Search?destination=New+YorkJP168ms
200hotels.com/ho260539/AU192ms
200hotels.com/ho260539/US121ms
200hotels.com/ho512847/US203ms
200hotels.com/ho512847/BR180ms
200hotels.com/reviews/ho138224/BR188ms
200hotels.com/ho260539/JP102ms
200hotels.com/ho260539/US218ms
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsGB205ms
200hotels.com/Hotel-Search?destination=New+YorkES60ms
200hotels.com/London-Hotels.d178279.Travel-Guide-HotelsAU102ms
200hotels.com/ho260539/ES216ms
301hotels.com/reviews/ho138224/DE48ms
200hotels.com/ho260539/BR93ms
404hotels.com/search?q=beach+resortBR57ms
200hotels.com/Paris-Hotels.d179900.Travel-Guide-HotelsJP202ms
01 实时演示

输入任意 Hotels.com URL。输出 HTML 或 JSON。

实时输入的 Crawling API。获取渲染后的 HTML,或切换到通用提取器获取 JSON。悬停可暂停并阅读。

就绪
按键 1-2 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 功能

一个 API,应对 Hotels.com 抛给你的一切。

Hotels.com 实时轮询房间价格和空房信息,在页面加载后渲染结果,并在反爬防御后按地区和货币限制房价。Crawling API 在真实浏览器中渲染它,通过住宅 IP 访问它,并向你交付干净的 HTML 或 JSON。

render

完整的 JavaScript 渲染

真实浏览器执行页面并等待,因此实时轮询的房价、空房信息和评论内容都会在采集前加载完成,而不只是初始的页面框架。

proxies

1.4 亿住宅 IP

每个请求都会在 30 个地区间轮换一个住宅 IP,让你像真实的本地访客一样访问 Hotels.com,并解析按地区和货币限制的房价。

anti-bot

为你处理封锁

CAPTCHA、机器人拦截墙和速率限制都会被自动清除。无需破解,无需维护。

format

HTML 或 JSON

获取完整渲染的 HTML,或添加 scraper=generic-extractor 即可将标题、内容、图片和链接以结构化 JSON 返回。

extras

截图与异步

同一个调用可以捕获整页截图,或通过 webhook 和云存储异步运行。

one token

一个 API 应对所有网站

Crawling API 适用于任意 URL,因此同一个令牌既覆盖 Hotels.com,也覆盖你抓取的其他一切。 查看实时演示.

03 输出

渲染后的 HTML,或干净的 JSON。

默认情况下你获得渲染后的 HTML。添加 generic-extractor 后同一个页面便以带类型的 JSON 返回。

{ "title": "London Hotels: book now | Hotels.com", "favicon": "https://www.hotels.com/favicon.ico", "meta": { "description": "Find and book hotels on Hotels.com.", "keywords": "..." }, "content": "Hotel results with prices, ratings, availability and reviews...", "canonical": "https://www.hotels.com/Hotel-Search?destination=London", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元信息

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

一次调用,从 URL 到数据。

每个 Hotels.com 请求都走同一条路径。你发送一个 URL,中间的一切由我们运行。

01

发送 URL

带上你的令牌传入任意公开的 Hotels.com URL:搜索页、目的地页、房源页或评论页。

02

轮换代理

选取一个能干净访问 Hotels.com 的住宅 IP 和地区,从 30 个地区的 1.4 亿 IP 中抽取。

03

渲染页面

真实浏览器加载页面,并等待实时轮询的房间价格、空房信息和评论渲染完成后再采集。

04

清除反爬

Hotels.com 的机器人检测、地区和货币限制以及速率限制都会被自动处理。无需破解,无需维护。

05

返回 HTML 或 JSON

返回完整渲染的 HTML,或在你添加通用提取器时返回带类型的 JSON。

05 应用场景

团队基于 Hotels.com 数据构建的东西。

USE / 01定价

酒店价格监控

跨日期和房源追踪房价,了解价格如何随季节、预订提前期和需求变化。

USE / 02聚合

OTA 聚合

将房源、房价和空房信息与其他旅游网站一并汇入单一信息流,形成一个综合视图。

USE / 03一致性

价格一致性核查

将公开房价与你自己的以及其他渠道的房价进行比对,发现低价倾销和价格一致性问题。

USE / 04评论

评论与口碑研究

收集住客评论和评分,跨房源追踪情绪、主题和口碑。

USE / 05市场

市场与需求研究

按目的地梳理库存、星级和定价,衡量市场规模并发现供给缺口。

USE / 06覆盖

任意 URL,一个 API

抓取搜索页、目的地页、房源页和评论页,以及你需要的任何其他旅游网站。

06 说明

抓取 Hotels.com 时值得了解的事。

价格在页面之后加载

房价和空房信息为实时轮询并由 JavaScript 渲染;Crawling API 运行真实浏览器并等待,因此在采集前结果已加载完成,而不是空的页面框架。

默认返回 HTML,按需返回 JSON

你获得完整渲染的 HTML。添加 scraper=generic-extractor 可获得解析后的标题、内容、图片和链接,或你自行解析 HTML。

地区和货币限制

房价和货币取决于访客所在地区。地理定位会在你需要的市场中选取一个住宅 IP,从而解析出本地价格,而不是默认的回退值。

从任何地方访问 Hotels.com

跨 30 个地区和 1.4 亿住宅 IP 的地理定位意味着稳定的访问,无需管理代理。

07 为什么选择 Crawlbase

为大规模抓取 Hotels.com 而生。

Crawling API 运行在为 46,000+ 付费客户和 70,000+ 开发者提供服务的同一套网络上。无需购买代理,无需运行浏览器,Hotels.com 变化时也无需打补丁。

99%
平均请求成功率
140M
住宅 IP,另有 9800 万数据中心 IP
30
用于获得准确本地结果的地区数
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。

08 FAQ

Hotels.com 抓取常见问题。

带上你的令牌将 Hotels.com URL 发送到 Crawlbase Crawling API。Crawlbase 会轮换一个住宅代理,在真实浏览器中渲染页面,等待价格和空房信息加载,清除机器人检测,并返回完整渲染的 HTML。添加 scraper=generic-extractor 即可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染后的 HTML;添加通用提取器(scraper=generic-extractor)即可以 JSON 形式接收标题、元信息、内容、图片和链接,或你自行解析 HTML。
可以。真实浏览器执行页面并等待实时轮询的房价和房间空房信息渲染完成,因此你捕获的是真实访客看到的价格,而不是空的页面框架。
Crawlbase 会将每个请求通过 30 个地区间轮换的住宅 IP 路由,并自动清除机器人检测。你无需管理代理或破解 CAPTCHA,Hotels.com 变更其配置时也无需维护。
可以。地理定位会在你需要的地区选取一个住宅 IP,从而将按地区和货币限制的房价解析为本地市场价格,而不是默认的回退值。
任意公开 URL:搜索页和目的地页、单个房源页、评论页,以及经过筛选或排序的结果页。同一个 API 同样适用于任何其他网站。
免费开始,含最多 10,000 次请求且无需信用卡。付费套餐随用量扩展,同一个令牌在 Crawling API 和每个 Crawlbase 抓取工具上均可使用。

开始抓取 Hotels.com。
跳过代理和封锁。

免费开始,含最多 10,000 次请求。一个令牌用于 Crawling API 和每个抓取工具。