输入任意 Kayak URL,输出 HTML 或 JSON。
实时输入的 Crawling API。获取渲染后的 HTML,或切换到通用提取器以获取 JSON。悬停可暂停并阅读。
一个 API,应对 Kayak 抛给你的一切。
Kayak 实时轮询票价,在加载后流式传入结果,并会积极拦截。Crawling API 在真实浏览器中渲染页面,通过住宅 IP 访问,并向你返回干净的 HTML 或 JSON。
完整的 JavaScript 渲染
真实浏览器执行页面并等待实时票价流式传入,因此航班、酒店和租车结果都会被完整捕获,而不只是一个空壳。
1.4 亿住宅 IP
每个请求都会在 30 个地区之间轮换住宅 IP,因此你能像真实的本地旅行者一样访问 Kayak,看到当地货币和票价。
拦截由我们处理
CAPTCHA、机器人防护墙和速率限制都会被自动清除。无需破解,无需维护。
HTML 或 JSON
获取完整渲染的 HTML,或添加scraper=generic-extractor 以将标题、内容、图片和链接作为结构化 JSON 返回。
截图与异步
同一次调用即可捕获整页截图,或通过 webhook 和云存储异步运行。
渲染的 HTML,或干净的 JSON。
默认情况下你会获得渲染后的 HTML。添加generic-extractor,同一个页面就会以类型化 JSON 的形式返回。
页面
title · string canonical · string favicon · string
元数据
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
一次调用,从 URL 到数据。
每个 Kayak 请求都会经过相同的路径。你发送一个 URL,我们负责运行中间的一切。
发送 URL
带上你的令牌传入任意公开的 Kayak URL:航班搜索、酒店或租车结果、探索地图或目的地页面。
轮换代理
从 30 个地区的 1.4 亿 IP 中抽取一个能干净访问 Kayak 的住宅 IP 和地区。
渲染页面
真实浏览器加载页面,并在捕获前等待票价轮询和结果流式传入。
清除反机器人
Kayak 的机器人检查和速率限制会被自动处理。无需破解,无需维护。
返回 HTML 或 JSON
返回完整渲染的 HTML,或在你添加通用提取器时返回类型化 JSON。
团队用 Kayak 数据构建什么。
票价与价格监控
跨航线和日期跟踪航班、酒店和租车价格,以发现降价、涨价以及最佳预订时机。
旅行聚合与元搜索
通过一个 API 拉取实时票价、班次和可用性,为比价网站和应用提供动力。
市场调研
将价格、承运商和航线与竞争对手进行基准比较,以了解旅行市场。
航线与需求分析
梳理哪些航线、航空公司和时段会出现,以及它们的价格如何随时间变化。
收入与定价团队
将竞争对手的实时票价输入定价模型,让价格保持精准,无需人工核查。
任意 URL,一个 API
抓取航班、酒店、租车、探索和目的地页面,以及你需要的任何其他网站。
抓取 Kayak 时值得了解的事项。
价格在页面之后加载
Kayak 实时轮询票价并用 JavaScript 渲染结果;Crawling API 运行真实浏览器并等待结果流式传入,因此捕获的 HTML 反映的是实时价格,而不是一个空壳。
默认返回 HTML,按需返回 JSON
你会获得完整渲染的 HTML。添加 scraper=generic-extractor 即可获得解析后的标题、内容、图片和链接,或者你自己解析 HTML。
地区会改变价格
Kayak 会按地区调整货币和票价;跨 30 个位置的地理定位能捕获本地旅行者所看到的价格。
为激进拦截而打造
速率限制和机器人防护墙会在 1.4 亿住宅 IP 之间被自动清除,因此访问保持稳定,无需管理代理。
为大规模抓取 Kayak 而打造。
Crawling API 运行在同一个网络上,该网络为 46,000+ 付费客户和 70,000+ 开发者提供服务。无需购买代理,无需运行浏览器,Kayak 变化时也无需打补丁。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。