输入任意 Expedia URL。输出 HTML 或 JSON。
Crawling API 实时演示。获取渲染后的 HTML,或切换到通用提取器获取 JSON。悬停可暂停并阅读。
一个 API,应对 Expedia 抛给你的一切。
Expedia 实时轮询酒店和航班价格,用 JavaScript 渲染结果并运行激进的机器人检测。Crawling API 在真实浏览器中渲染它,通过住宅 IP 访问,并将干净的 HTML 或 JSON 交给你。
完整 JavaScript 渲染
真实浏览器执行页面并等待结果,因此实时轮询的价格、评分和可用性都会在采集前完成渲染,而不仅仅是初始 HTML。
1.4 亿住宅 IP
每个请求都会在 30 个地区轮换住宅 IP,因此你能像真实的本地访客一样访问 Expedia,获得正确的货币和价格。
拦截为你处理
CAPTCHA、机器人墙和速率限制都会被自动清除。无需破解,无需维护。
HTML 或 JSON
获取完整渲染的 HTML,或添加 scraper=generic-extractor,即可将标题、内容、图片和链接以结构化 JSON 返回。
截图与异步
同一个调用可以采集整页截图,或通过 webhook 和云存储异步运行。
渲染的 HTML,或干净的 JSON。
默认情况下你会得到渲染后的 HTML。添加 generic-extractor,同一页面便会以类型化 JSON 返回。
页面
title · string canonical · string favicon · string
元数据
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
一次调用,从 URL 到数据。
每个 Expedia 请求都经过相同的路径。你发送一个 URL,中间的一切由我们运行。
发送 URL
带上你的令牌传入任意公开的 Expedia URL:酒店搜索、航班搜索、酒店页面或目的地。
轮换代理
一个能干净访问 Expedia 的住宅 IP 和地区,从 30 个地区的 1.4 亿 IP 中选取。
渲染页面
真实浏览器加载页面并等待结果,因此实时轮询的价格、评分和可用性都会在采集前完成渲染。
清除反爬
Expedia 的机器人检测和速率限制会被自动处理。无需破解,无需维护。
返回 HTML 或 JSON
返回完全渲染的 HTML,或在你添加通用提取器时返回类型化 JSON。
团队用 Expedia 数据构建什么。
酒店价格监控
跟踪各个目的地和日期的房价,观察酒店价格随时间的变化。
航班票价跟踪
拉取航班搜索结果,按航线、日期和需求窗口跟踪票价。
OTA 聚合
聚合酒店、航班和套餐列表,为旅游元搜索或比价产品提供数据。
价格一致性检查
将你发布的价格与 Expedia 对比,捕捉低价和价格一致性问题。
市场与需求研究
挖掘可用性、评分和定价,研究季节性、需求和本地市场。
任意 URL,一个 API
爬取酒店搜索、航班搜索、酒店页面和活动,以及你需要的任何其他站点。
抓取 Expedia 时值得了解的要点。
像真实浏览器一样渲染
Expedia 实时轮询价格并用 JavaScript 渲染结果;Crawling API 运行真实浏览器并等待,因此酒店和航班价格会在采集前加载完成。
默认 HTML,按需 JSON
你会得到完整渲染的 HTML。添加 scraper=generic-extractor 可获得解析后的标题、内容、图片和链接,或自行解析 HTML。
地区与货币限制
Expedia 按地区和货币限制价格与可用性,因此请针对你所需地区的住宅 IP,以获得本地准确的价格。
从任何地方访问 Expedia
覆盖 30 个地区和 1.4 亿住宅 IP 的地理定位意味着即使面对激进的速率限制也能稳定访问,且无需管理代理。
专为大规模爬取 Expedia 而打造。
Crawling API 运行在为 46,000+ 付费客户和 70,000+ 开发者提供服务的同一网络上。无需购买代理,无需运行浏览器,当 Expedia 变更时也无需修补任何东西。
一个令牌,官方 Python、Node 和 Ruby SDK,底层是 99.99% 可用性的网络。