Scrapers / Facebook

Facebook 抓取器。
任意页面转为 JSON。

将任意 Facebook URL 转为结构化 JSON。页面、个人资料、群组、活动和话题标签。
内置住宅代理和反机器人处理。无需运行浏览器。

99% 成功率140M 住宅 IP30 个地区
Facebook URL结构化 JSONfacebook.com/CocaColaCrawlbase路由渲染提取页面详情主页小组活动话题标签facebook-pagefacebook-profilefacebook-groupfacebook-eventfacebook-hashtagfacebook.com · 机器人验证通过 · 200
实时抓取信息流 · Facebook1.24M req/min流式传输中
200facebook.com/TeslaNL86ms
200facebook.com/zuckIN55ms
200facebook.com/hashtag/aiFR154ms
200facebook.com/CocaColaUS94ms
200facebook.com/hashtag/aiIN113ms
404facebook.com/profile.php?id=10293NL144ms
301facebook.com/CocaColaES187ms
301facebook.com/groups/928374ES192ms
200facebook.com/events/556677US128ms
200facebook.com/hashtag/marketingAU86ms
200facebook.com/TeslaDE133ms
200facebook.com/TeslaCA63ms
200facebook.com/NikeES126ms
200facebook.com/NASAUS87ms
200facebook.com/CocaColaIN210ms
200facebook.com/hashtag/aiIN98ms
200facebook.com/groups/webdevCA77ms
200facebook.com/groups/photographyNL73ms
200facebook.com/NikeFR183ms
200facebook.com/watch/CA129ms
200facebook.com/NASAES74ms
200facebook.com/events/556677GB47ms
200facebook.com/MicrosoftJP216ms
200facebook.com/watch/FR193ms
200facebook.com/TeslaFR110ms
301facebook.com/events/556677DE191ms
200facebook.com/TeslaNL86ms
200facebook.com/zuckIN55ms
200facebook.com/hashtag/aiFR154ms
200facebook.com/CocaColaUS94ms
200facebook.com/hashtag/aiIN113ms
404facebook.com/profile.php?id=10293NL144ms
301facebook.com/CocaColaES187ms
301facebook.com/groups/928374ES192ms
200facebook.com/events/556677US128ms
200facebook.com/hashtag/marketingAU86ms
200facebook.com/TeslaDE133ms
200facebook.com/TeslaCA63ms
200facebook.com/NikeES126ms
200facebook.com/NASAUS87ms
200facebook.com/CocaColaIN210ms
200facebook.com/hashtag/aiIN98ms
200facebook.com/groups/webdevCA77ms
200facebook.com/groups/photographyNL73ms
200facebook.com/NikeFR183ms
200facebook.com/watch/CA129ms
200facebook.com/NASAES74ms
200facebook.com/events/556677GB47ms
200facebook.com/MicrosoftJP216ms
200facebook.com/watch/FR193ms
200facebook.com/TeslaFR110ms
301facebook.com/events/556677DE191ms
01 实时演示

输入任意 Facebook URL,输出结构化 JSON。

四个 Facebook 抓取器,实时输入。切换标签页,或悬停以暂停阅读。

就绪
按键 1-4 切换 · 点击暂停运行你自己的 URL
几分钟内运行你的第一个请求。最多 10,000 次免费请求,无需信用卡。免费开始
02 抓取器

Facebook 的每个部分,皆可解析。

五个托管的 Facebook 抓取器共享一个 API、一个令牌和同一个住宅代理网络。将任意一个指向公开 URL,即可接收类型化的 JSON,而非原始 HTML。

facebook-page

页面

将页面解析为标题、pageName、页面类型、点赞数和粉丝数、简介、营业时间、相关页面,以及近期的帖子、照片和视频

facebook-profile

个人资料

将公开个人资料读取为姓名、简介、好友数、简介详情和照片。

facebook-group

群组

提取群组的标题、类型(公开或私密)、成员数、描述和近期信息流。

facebook-event

活动

获取活动的名称、日期、地点、封面图、主办方,以及有多少人参加或感兴趣。

facebook-hashtag

话题标签

收集任意话题标签的公开帖子,用于社交聆听和趋势追踪。

一个令牌

五者共用同一个 API

通过更改一个参数切换抓取器。底层的代理、地理定位、渲染和反机器人处理保持一致。查看实时演示

03 输出

干净的字段,而非原始 HTML。

facebook-page 的一次调用会返回类型化的 JSON。以下是单个 Facebook 页面的数据结构。

{ "title": "Coca-Cola", "pageName": "CocaCola", "pageType": "Beverage company", "likesCount": "108M", "followersCount": "109M", "about": "The Coca-Cola Company...", "businessHours": "...", "posts": [ "..." ], "photos": [ "..." ], "videos": [ "..." ], "relatedPages": [ "..." ] }

身份

title · string  pageName · string  pageType · string

受众

likesCount · string  followersCount · string  followingCount · string

内容

posts · array  photos · array  videos · array

简介

about · string  businessHours · string

发现

relatedPages · array  coverImage · string

04 工作原理

一次调用,从 URL 到 JSON。

每个 Facebook 请求都经过同一条路径。你发送一个 URL,其间的一切由我们处理。

01

发送 URL

携带你的令牌和一个抓取器,传入任意公开的 Facebook 页面、个人资料、群组、活动或话题标签 URL。

02

轮换代理

选用能干净触达 Facebook 的住宅 IP 和地区,取自 30 个地区的 140M 个 IP。

03

渲染页面

真实浏览器加载页面,从而捕获动态加载的帖子、计数和媒体。

04

清除反机器人

Facebook 的登录墙和机器人检测会被自动处理。无需求解,Facebook 变更时也无需维护。

05

返回 JSON

页面被解析为类型化字段并以 JSON 返回,如果你更愿意自己解析,也可返回原始 HTML。

05 用例

团队用 Facebook 数据构建什么。

USE / 01品牌

品牌与竞争对手监测

追踪各品牌页面的点赞数、粉丝数和帖子,以对标触达和内容节奏。

USE / 02受众

受众与增长追踪

绘制粉丝数和成员数随时间的变化,以衡量增长和活动效果。

USE / 03聆听

社交聆听

提取话题标签信息流和页面帖子,以监测情绪、提及和新兴话题。

USE / 04社区

社区与群组研究

读取公开群组的规模、类型和活跃度,以发现并评估社区规模。

USE / 05活动

活动追踪

收集活动日期、地点和出席情况,以梳理营销活动和竞争对手活动。

USE / 06AI

训练数据与智能体

通过同一个 API,将干净的 Facebook JSON 输入模型、RAG 流水线和社交智能体。

06 须知

抓取 Facebook 时需要了解的要点。

仅限公开数据

抓取器读取公开可见的页面、个人资料、群组、活动和话题标签。没有登录,因此你获得的正是未登录访客所看到的内容。

选对抓取器

品牌和商业页面用 facebook-page,人物用 facebook-profile,社区用 facebook-group,活动用 facebook-event,话题信息流用 facebook-hashtag,彼此都只差一个参数。

互动数据一目了然

likesCount、followersCount、membersCount 以及参加或感兴趣的计数返回即可绘图,因此你能随时间追踪触达和增长。

帖子、照片和视频

facebook-page 返回近期的帖子、照片和视频数组,因此你无需逐一抓取即可监测页面正在发布什么。

07 为何选择 Crawlbase

为大规模抓取 Facebook 而构建。

Facebook 抓取器运行在同一个网络上,该网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Facebook 变更时也无需修补任何东西。

99%
平均请求成功率
140M
住宅 IP,另加 98M 数据中心 IP
30
用于精准本地结果的地区数
20/s
默认每秒请求数,可按需提升

一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。

08 FAQ

Facebook 抓取常见问题。

将 Facebook 页面 URL 携带你的令牌和 scraper=facebook-page 发送到 Crawlbase Crawling API。Crawlbase 会处理代理、渲染和反机器人检测,并返回包含标题、页面类型、点赞数、粉丝数、简介、帖子、照片和视频的干净 JSON。
五个托管抓取器覆盖 Facebook:facebook-page 用于页面,facebook-profile 用于个人资料,facebook-group 用于群组,facebook-event 用于活动,facebook-hashtag 用于话题标签信息流。
不需要。抓取器仅读取公开可见的数据,无需登录,因此你获得的正是未登录访客所看到的内容。
Crawlbase 将每个请求通过 30 个地区的轮换住宅 IP 路由,渲染 JavaScript,并自动清除机器人检测。你无需管理代理或求解 CAPTCHA,Facebook 更改其反机器人配置时也没有任何需要维护的东西。
可以。likesCount 和 followersCount 每次调用都以数字返回,因此你可以存储它们并绘制触达和增长随时间的变化。
是的。每个 Facebook 抓取器都返回解析过的、类型化的 JSON。如果你更愿意自己解析,也可以请求原始 HTML。
你可以用最多 10,000 次请求免费开始,无需信用卡。付费方案随用量扩展,同一个令牌适用于每个 Crawlbase 抓取器和 Crawling API。

开始抓取 Facebook。
跳过代理和登录。

免费开始,含最多 10,000 次请求。一个令牌适用于每个 Facebook 抓取器。