输入任意 Glassdoor URL,输出 HTML 或 JSON。
实时演示的 Crawling API。获取渲染后的 HTML,或切换到 generic extractor 获取 JSON。悬停可暂停阅读。
一个 API,应对 Glassdoor 的一切。
Glassdoor 需要登录且容易封锁,评价和薪资数据在浏览器中加载。Crawling API 用真实浏览器渲染它,通过住宅 IP 访问,并向你返回干净的 HTML 或 JSON。
完整的 JavaScript 渲染
真实浏览器执行页面,因此评价、评分明细、薪资数据和面试报告全部被捕获,而不仅仅是初始 HTML。
1.4 亿住宅 IP
每个请求都在 30 个地区间轮换住宅 IP,因此你能像真实本地访客一样访问 Glassdoor。
封锁由我们处理
机器人拦截墙、软登录提示和速率限制都会自动清除。无需破解,无需维护。
HTML 或 JSON
获取完全渲染的 HTML,或添加scraper=generic-extractor,将标题、内容、图片和链接作为结构化 JSON 返回。
截图与异步
同一个调用可以捕获整页截图,或通过 webhook 和云存储异步运行。
渲染的 HTML,或干净的 JSON。
默认情况下你会获得渲染的 HTML。添加generic-extractor,同一页面即以类型化 JSON 返回。
页面
title · string canonical · string favicon · string
元数据
meta.description · string meta.keywords · string
内容
content · string
媒体
images · array og_images · array
链接
links · array
一次调用,从 URL 到数据。
每个 Glassdoor 请求都走同样的路径。你发送一个 URL,中间的一切由我们运作。
发送 URL
带上你的令牌传入任意公开的 Glassdoor URL:评价页、薪资页、面试报告或公司概览。
轮换代理
选取能顺畅访问 Glassdoor 的住宅 IP 和地区,来自 30 个区域的 1.4 亿 IP。
渲染页面
真实浏览器加载评价、评分明细和薪资数据,呈现访客所见的样子,然后再捕获。
清除反爬
Glassdoor 的机器人拦截墙和软登录提示会自动处理;你读取的是公开页面。无需破解,无需维护。
返回 HTML 或 JSON
完全渲染的 HTML 会返回,或在你添加 generic extractor 时返回类型化 JSON。
团队用 Glassdoor 数据构建什么。
雇主品牌监测
随时间跟踪公司评分、评价和情感,了解你的雇主品牌如何被感知。
薪酬基准分析
汇总不同职位、级别和地点的薪资数据,将薪酬与市场对标。
人才与竞争对手 HR 情报
监测竞争对手如何被评分和评价,为招聘和留才策略提供依据。
情感分析
挖掘评价文本,提取各公司在文化、管理和工作生活平衡方面的主题。
市场研究
将公司评分、评价和薪资数据输入市场与劳动力研究。
AI 和 HR 智能体
通过一个 API 将干净的 Glassdoor 文本输入模型、RAG 流水线和 HR 智能体。
抓取 Glassdoor 时值得了解的事。
如真实浏览器般渲染
Glassdoor 在浏览器中加载评价、评分明细和薪资数据;Crawling API 运行真实浏览器,使它们在捕获前完成渲染。
默认 HTML,按需 JSON
你会获得完全渲染的 HTML。添加 scraper=generic-extractor 可获得解析后的标题、内容、图片和链接,或自行解析 HTML。
仅公开页面,无需登录
Crawling API 读取公开可见的页面,无需登录,因此你获得的是访客所见的未登录视图。
从任何地方访问 Glassdoor
横跨 30 个区域的地理定位和 1.4 亿住宅 IP,意味着无需管理代理即可获得稳定访问。
专为大规模抓取 Glassdoor 而生。
Crawling API 运行在同一网络之上,该网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Glassdoor 变化时也无需修补任何东西。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。