Crawling API / Glassdoor

Glassdoor 抓取工具。
任意页面,完全渲染。

发送任意 Glassdoor URL,即可拿回完全渲染的 HTML,通过住宅代理并内置反爬处理。
使用 generic extractor 将其转换为 JSON。

99% 成功率1.4 亿住宅 IP30 个地区
Glassdoor URLHTML 或 JSONglassdoor.com/Reviews/Google-Reviews-E9079.htmCrawlbase路由渲染提取渲染后的 HTML结构化 JSONcrawling-apigeneric-extractorglassdoor.com · bot check cleared · 200
实时抓取动态 · Glassdoor1.24M req/min推送中
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmCA117ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmCA121ms
200glassdoor.com/Overview/Working-at-Google-EI_IE9079.htmES88ms
200glassdoor.com/Reviews/Microsoft-Reviews-E1651.htmCA132ms
404glassdoor.com/Reviews/IBM-Reviews-E354.htmUS48ms
200glassdoor.com/Overview/Working-at-Apple-EI_IE1138.htmFR66ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmES187ms
200glassdoor.com/Reviews/Netflix-Reviews-E11891.htmBR171ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmBR91ms
200glassdoor.com/Overview/Working-at-Apple-EI_IE1138.htmBR143ms
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmNL123ms
200glassdoor.com/Reviews/Google-Reviews-E9079.htmUS51ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmIN175ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmFR96ms
200glassdoor.com/Salaries/meta-salaries-SRCH_KE0,4.htmFR143ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmJP141ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmDE100ms
200glassdoor.com/Reviews/Google-Reviews-E9079.htmUS135ms
200glassdoor.com/Reviews/IBM-Reviews-E354.htmNL148ms
404glassdoor.com/Salaries/microsoft-software-engineer-salaries-SRCH_KE0,9_KO10,27.htmBR106ms
200glassdoor.com/Reviews/Tesla-Reviews-E43129.htmSG60ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmFR70ms
200glassdoor.com/Salaries/microsoft-software-engineer-salaries-SRCH_KE0,9_KO10,27.htmES174ms
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmIN56ms
200glassdoor.com/Reviews/Microsoft-Reviews-E1651.htmFR136ms
200glassdoor.com/Salaries/google-salaries-SRCH_KE0,6.htmNL123ms
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmCA117ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmCA121ms
200glassdoor.com/Overview/Working-at-Google-EI_IE9079.htmES88ms
200glassdoor.com/Reviews/Microsoft-Reviews-E1651.htmCA132ms
404glassdoor.com/Reviews/IBM-Reviews-E354.htmUS48ms
200glassdoor.com/Overview/Working-at-Apple-EI_IE1138.htmFR66ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmES187ms
200glassdoor.com/Reviews/Netflix-Reviews-E11891.htmBR171ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmBR91ms
200glassdoor.com/Overview/Working-at-Apple-EI_IE1138.htmBR143ms
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmNL123ms
200glassdoor.com/Reviews/Google-Reviews-E9079.htmUS51ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmIN175ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmFR96ms
200glassdoor.com/Salaries/meta-salaries-SRCH_KE0,4.htmFR143ms
200glassdoor.com/Salaries/amazon-salaries-SRCH_KE0,6.htmJP141ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmDE100ms
200glassdoor.com/Reviews/Google-Reviews-E9079.htmUS135ms
200glassdoor.com/Reviews/IBM-Reviews-E354.htmNL148ms
404glassdoor.com/Salaries/microsoft-software-engineer-salaries-SRCH_KE0,9_KO10,27.htmBR106ms
200glassdoor.com/Reviews/Tesla-Reviews-E43129.htmSG60ms
200glassdoor.com/Reviews/Amazon-Reviews-E6036.htmFR70ms
200glassdoor.com/Salaries/microsoft-software-engineer-salaries-SRCH_KE0,9_KO10,27.htmES174ms
200glassdoor.com/Reviews/JPMorgan-Chase-Reviews-E145.htmIN56ms
200glassdoor.com/Reviews/Microsoft-Reviews-E1651.htmFR136ms
200glassdoor.com/Salaries/google-salaries-SRCH_KE0,6.htmNL123ms
01 在线演示

输入任意 Glassdoor URL,输出 HTML 或 JSON。

实时演示的 Crawling API。获取渲染后的 HTML,或切换到 generic extractor 获取 JSON。悬停可暂停阅读。

就绪
按键 1-2 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 能力

一个 API,应对 Glassdoor 的一切。

Glassdoor 需要登录且容易封锁,评价和薪资数据在浏览器中加载。Crawling API 用真实浏览器渲染它,通过住宅 IP 访问,并向你返回干净的 HTML 或 JSON。

render

完整的 JavaScript 渲染

真实浏览器执行页面,因此评价、评分明细、薪资数据和面试报告全部被捕获,而不仅仅是初始 HTML。

proxies

1.4 亿住宅 IP

每个请求都在 30 个地区间轮换住宅 IP,因此你能像真实本地访客一样访问 Glassdoor。

anti-bot

封锁由我们处理

机器人拦截墙、软登录提示和速率限制都会自动清除。无需破解,无需维护。

format

HTML 或 JSON

获取完全渲染的 HTML,或添加scraper=generic-extractor,将标题、内容、图片和链接作为结构化 JSON 返回。

extras

截图与异步

同一个调用可以捕获整页截图,或通过 webhook 和云存储异步运行。

one token

一个 API,适用所有网站

Crawling API 适用于任意 URL,因此同一个令牌可覆盖 Glassdoor 以及你抓取的所有其他站点。查看在线演示.

03 输出

渲染的 HTML,或干净的 JSON。

默认情况下你会获得渲染的 HTML。添加generic-extractor,同一页面即以类型化 JSON 返回。

{ "title": "Google Reviews | Glassdoor", "favicon": "https://www.glassdoor.com/favicon.ico", "meta": { "description": "Google has an overall rating of 4.4 out of 5", "keywords": "..." }, "content": "Read employee reviews and ratings for Google...", "canonical": "https://www.glassdoor.com/Reviews/Google-Reviews-E9079.htm", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元数据

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

一次调用,从 URL 到数据。

每个 Glassdoor 请求都走同样的路径。你发送一个 URL,中间的一切由我们运作。

01

发送 URL

带上你的令牌传入任意公开的 Glassdoor URL:评价页、薪资页、面试报告或公司概览。

02

轮换代理

选取能顺畅访问 Glassdoor 的住宅 IP 和地区,来自 30 个区域的 1.4 亿 IP。

03

渲染页面

真实浏览器加载评价、评分明细和薪资数据,呈现访客所见的样子,然后再捕获。

04

清除反爬

Glassdoor 的机器人拦截墙和软登录提示会自动处理;你读取的是公开页面。无需破解,无需维护。

05

返回 HTML 或 JSON

完全渲染的 HTML 会返回,或在你添加 generic extractor 时返回类型化 JSON。

05 使用场景

团队用 Glassdoor 数据构建什么。

USE / 01雇主品牌

雇主品牌监测

随时间跟踪公司评分、评价和情感,了解你的雇主品牌如何被感知。

USE / 02薪酬

薪酬基准分析

汇总不同职位、级别和地点的薪资数据,将薪酬与市场对标。

USE / 03HR 情报

人才与竞争对手 HR 情报

监测竞争对手如何被评分和评价,为招聘和留才策略提供依据。

USE / 04情感

情感分析

挖掘评价文本,提取各公司在文化、管理和工作生活平衡方面的主题。

USE / 05研究

市场研究

将公司评分、评价和薪资数据输入市场与劳动力研究。

USE / 06AI / HR

AI 和 HR 智能体

通过一个 API 将干净的 Glassdoor 文本输入模型、RAG 流水线和 HR 智能体。

06 提示

抓取 Glassdoor 时值得了解的事。

如真实浏览器般渲染

Glassdoor 在浏览器中加载评价、评分明细和薪资数据;Crawling API 运行真实浏览器,使它们在捕获前完成渲染。

默认 HTML,按需 JSON

你会获得完全渲染的 HTML。添加 scraper=generic-extractor 可获得解析后的标题、内容、图片和链接,或自行解析 HTML。

仅公开页面,无需登录

Crawling API 读取公开可见的页面,无需登录,因此你获得的是访客所见的未登录视图。

从任何地方访问 Glassdoor

横跨 30 个区域的地理定位和 1.4 亿住宅 IP,意味着无需管理代理即可获得稳定访问。

07 为什么选 Crawlbase

专为大规模抓取 Glassdoor 而生。

Crawling API 运行在同一网络之上,该网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Glassdoor 变化时也无需修补任何东西。

99%
平均请求成功率
140M
住宅 IP,另加 9800 万数据中心 IP
30
用于精准本地结果的地区
20/s
默认每秒请求数,可按需提高

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。

08 FAQ

Glassdoor 抓取常见问题。

带上你的令牌,将 Glassdoor URL 发送到 Crawlbase Crawling API。Crawlbase 会轮换住宅代理,用真实浏览器渲染页面,清除机器人检查,并返回完全渲染的 HTML。添加 scraper=generic-extractor 可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染的 HTML;添加 generic extractor(scraper=generic-extractor)即可以 JSON 形式接收标题、元数据、内容、图片和链接,或自行解析 HTML。
会。真实浏览器执行页面,因此动态加载的评价、评分明细和薪资数据都会被捕获,而不仅仅是初始 HTML。
Crawlbase 将每个请求通过横跨 30 个地区的轮换住宅 IP 发送,并自动清除机器人拦截墙和软登录提示。你无需管理代理或破解 CAPTCHA,Glassdoor 更改其设置时也无需维护任何东西。
不需要。Crawling API 仅读取公开可见的页面,无需登录,因此你收到的是未登录访客所见的内容。
任意公开 URL:公司评价、评分、薪资、面试报告和概览页。同一个 API 也适用于任何其他站点。
免费开始,含最多 10,000 次请求,无需信用卡。付费方案随用量扩展,同一个令牌可跨 Crawling API 和每一个 Crawlbase scraper 使用。

开始抓取 Glassdoor。
跳过登录和封锁。

免费起步,含最多 10,000 次请求。一个令牌,用于 Crawling API 和每一个 scraper。