异步爬取 API
爬虫库 Crawler 使用 Crawling API 作为避免最常见问题的基础 网络抓取,例如 IP 块、机器人检测和验证码。 保留 API 的所有功能以允许按需定制并满足您的数据收集需求。
更成功的回应
不再担心响应失败,开始通过数据关注业务增长。Crawlbase Crawler 使用智能推拉系统,即使是最难抓取的网站,成功率也能接近 100%。
客户端重试次数较少
您不再需要为呼叫重试和管理队列而烦恼。 只要继续推送您的请求,我们的系统就会在后台逻辑地管理所有内容,让您的网络爬虫实现最高效率。
数据到您的服务器
使用您的 webhook 端点接收来自爬虫的抓取数据。 我们的系统甚至会监控您的 webhook URL,以确保您始终尽可能一致地获得准确的数据。
99%
成功率100%
网络正常运行时间24/7
专家团队的支持
使用真实的爬取 网页浏览器
建立在 Crawling API
立即切换您的流量以使用我们的 PUSH/PULL 系统,这样您就可以在不丢失任何功能的情况下最大限度地提高抓取能力。
- 在之上异步工作 Crawling API
- 更成功的回应
- 客户端重试次数较少
- 使用自定义爬虫进行粒度监控
- 大公司进行大规模爬行
- Webhook 数据传输到您的服务器
迁移至 Crawlbase Crawler 只需几个简单的步骤
创建 Crawler
登录您的 Crawlbase 账户,转到您的 Crawler 仪表板,并创建自定义 Crawler 名称。
将页面 URL 推送至 Crawler
开始将 URL 推送到 Crawler 通过添加两个额外的参数 Crawling API 呼叫(&callback = true&crawler =您的Crawler姓名)。
从 Storage 或 Webhook 中提取数据
配置 Crawlbase 存储或创建您自己的 webhook 端点以开始将抓取的数据接收回您的服务器。
使用自定义爬虫进行粒度监控
通过帐户仪表板上的实时监控页面实时跟踪和监控您的抓取活动。您还可以利用 Crawler API 可快速检查统计数据并有效管理您的抓取。
根据您的业务预算和需求暂停和恢复您的抓取操作。
透明网络爬取的定价计算器
与竞争对手比较价格
平台 | 渲染 | 定价 | 服务质量 | 定价模式 |
---|---|---|---|---|
爬虫库 比竞争对手便宜 2.6 倍 | 常规页面请求 JavaScript 请求 | 4.9 4.0 | 现收现付制 现收现付制 | |
亮数据 | 标准域 优质域名 | 3.0 4.0 | 提交订阅 提交订阅 | |
氧实验室 | JS 渲染-微包 JS 渲染-高级套餐 | 3.0 2.0 | 提交订阅 提交订阅 | |
合特 | 提取的原始响应 - 第 1 层 提取的原始响应 - 第 1 层 提取渲染的响应 - 第 1 层 提取渲染的响应 - 第 5 层 | 1.0 2.0 4.0 3.0 | 现收现付、订阅 现收现付、订阅 现收现付、订阅 现收现付、订阅 | |
蜜蜂 | 无需 JavaScript 渲染即可旋转 隐秘 JavaScript 渲染 | 2.0 4.0 | 提交订阅 提交订阅 | |
爬虫API | 正常请求-JS 渲染 LinkedIn、Twitter - JS 渲染 | 2.0 3.0 | 提交订阅 提交订阅 |
CCPA
规格
《通用数据保护条例》(GDPR)
规格
全球用户保护合规
作为长期数据自由的倡导者,Crawlbase 完全致力于在全球范围内实施消费者保护标准。 我们现有的行动通过公平透明地收集用户数据反映了这一承诺,即用户可以控制他们的帐户和个人信息。
根据欧盟 (EU) 通用数据保护条例 (GDPR) 和加州消费者隐私法案 (CCPA) 的要求,我们已为参与本协议的所有用户概述了这些做法 隐私政策 部分。
立即开始抓取网页
免费尝试。 无需信用卡。 即时设置。
建立免费账户!