输入任意 Hotels.com URL。输出 HTML 或 JSON。
实时输入的 Crawling API。获取渲染后的 HTML,或切换到通用提取器获取 JSON。悬停可暂停并阅读。
一个 API,应对 Hotels.com 抛给你的一切。
Hotels.com 实时轮询房间价格和空房信息,在页面加载后渲染结果,并在反爬防御后按地区和货币限制房价。Crawling API 在真实浏览器中渲染它,通过住宅 IP 访问它,并向你交付干净的 HTML 或 JSON。
完整的 JavaScript 渲染
真实浏览器执行页面并等待,因此实时轮询的房价、空房信息和评论内容都会在采集前加载完成,而不只是初始的页面框架。
1.4 亿住宅 IP
每个请求都会在 30 个地区间轮换一个住宅 IP,让你像真实的本地访客一样访问 Hotels.com,并解析按地区和货币限制的房价。
为你处理封锁
CAPTCHA、机器人拦截墙和速率限制都会被自动清除。无需破解,无需维护。
HTML 或 JSON
获取完整渲染的 HTML,或添加 scraper=generic-extractor 即可将标题、内容、图片和链接以结构化 JSON 返回。
截图与异步
同一个调用可以捕获整页截图,或通过 webhook 和云存储异步运行。
渲染后的 HTML,或干净的 JSON。
默认情况下你获得渲染后的 HTML。添加 generic-extractor 后同一个页面便以带类型的 JSON 返回。
页面
title · string canonical · string favicon · string
元信息
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
一次调用,从 URL 到数据。
每个 Hotels.com 请求都走同一条路径。你发送一个 URL,中间的一切由我们运行。
发送 URL
带上你的令牌传入任意公开的 Hotels.com URL:搜索页、目的地页、房源页或评论页。
轮换代理
选取一个能干净访问 Hotels.com 的住宅 IP 和地区,从 30 个地区的 1.4 亿 IP 中抽取。
渲染页面
真实浏览器加载页面,并等待实时轮询的房间价格、空房信息和评论渲染完成后再采集。
清除反爬
Hotels.com 的机器人检测、地区和货币限制以及速率限制都会被自动处理。无需破解,无需维护。
返回 HTML 或 JSON
返回完整渲染的 HTML,或在你添加通用提取器时返回带类型的 JSON。
团队基于 Hotels.com 数据构建的东西。
酒店价格监控
跨日期和房源追踪房价,了解价格如何随季节、预订提前期和需求变化。
OTA 聚合
将房源、房价和空房信息与其他旅游网站一并汇入单一信息流,形成一个综合视图。
价格一致性核查
将公开房价与你自己的以及其他渠道的房价进行比对,发现低价倾销和价格一致性问题。
评论与口碑研究
收集住客评论和评分,跨房源追踪情绪、主题和口碑。
市场与需求研究
按目的地梳理库存、星级和定价,衡量市场规模并发现供给缺口。
任意 URL,一个 API
抓取搜索页、目的地页、房源页和评论页,以及你需要的任何其他旅游网站。
抓取 Hotels.com 时值得了解的事。
价格在页面之后加载
房价和空房信息为实时轮询并由 JavaScript 渲染;Crawling API 运行真实浏览器并等待,因此在采集前结果已加载完成,而不是空的页面框架。
默认返回 HTML,按需返回 JSON
你获得完整渲染的 HTML。添加 scraper=generic-extractor 可获得解析后的标题、内容、图片和链接,或你自行解析 HTML。
地区和货币限制
房价和货币取决于访客所在地区。地理定位会在你需要的市场中选取一个住宅 IP,从而解析出本地价格,而不是默认的回退值。
从任何地方访问 Hotels.com
跨 30 个地区和 1.4 亿住宅 IP 的地理定位意味着稳定的访问,无需管理代理。
为大规模抓取 Hotels.com 而生。
Crawling API 运行在为 46,000+ 付费客户和 70,000+ 开发者提供服务的同一套网络上。无需购买代理,无需运行浏览器,Hotels.com 变化时也无需打补丁。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。