输入任意 Facebook URL,输出结构化 JSON。
四个 Facebook 抓取器,实时输入。切换标签页,或悬停以暂停阅读。
Facebook 的每个部分,皆可解析。
五个托管的 Facebook 抓取器共享一个 API、一个令牌和同一个住宅代理网络。将任意一个指向公开 URL,即可接收类型化的 JSON,而非原始 HTML。
页面
将页面解析为标题、pageName、页面类型、点赞数和粉丝数、简介、营业时间、相关页面,以及近期的帖子、照片和视频。
个人资料
将公开个人资料读取为姓名、简介、好友数、简介详情和照片。
群组
提取群组的标题、类型(公开或私密)、成员数、描述和近期信息流。
活动
获取活动的名称、日期、地点、封面图、主办方,以及有多少人参加或感兴趣。
话题标签
收集任意话题标签的公开帖子,用于社交聆听和趋势追踪。
干净的字段,而非原始 HTML。
对facebook-page 的一次调用会返回类型化的 JSON。以下是单个 Facebook 页面的数据结构。
身份
title · string pageName · string pageType · string
受众
likesCount · string followersCount · string followingCount · string
内容
posts · array photos · array videos · array
简介
about · string businessHours · string
发现
relatedPages · array coverImage · string
一次调用,从 URL 到 JSON。
每个 Facebook 请求都经过同一条路径。你发送一个 URL,其间的一切由我们处理。
发送 URL
携带你的令牌和一个抓取器,传入任意公开的 Facebook 页面、个人资料、群组、活动或话题标签 URL。
轮换代理
选用能干净触达 Facebook 的住宅 IP 和地区,取自 30 个地区的 140M 个 IP。
渲染页面
真实浏览器加载页面,从而捕获动态加载的帖子、计数和媒体。
清除反机器人
Facebook 的登录墙和机器人检测会被自动处理。无需求解,Facebook 变更时也无需维护。
返回 JSON
页面被解析为类型化字段并以 JSON 返回,如果你更愿意自己解析,也可返回原始 HTML。
团队用 Facebook 数据构建什么。
品牌与竞争对手监测
追踪各品牌页面的点赞数、粉丝数和帖子,以对标触达和内容节奏。
受众与增长追踪
绘制粉丝数和成员数随时间的变化,以衡量增长和活动效果。
社交聆听
提取话题标签信息流和页面帖子,以监测情绪、提及和新兴话题。
社区与群组研究
读取公开群组的规模、类型和活跃度,以发现并评估社区规模。
活动追踪
收集活动日期、地点和出席情况,以梳理营销活动和竞争对手活动。
训练数据与智能体
通过同一个 API,将干净的 Facebook JSON 输入模型、RAG 流水线和社交智能体。
抓取 Facebook 时需要了解的要点。
仅限公开数据
抓取器读取公开可见的页面、个人资料、群组、活动和话题标签。没有登录,因此你获得的正是未登录访客所看到的内容。
选对抓取器
品牌和商业页面用 facebook-page,人物用 facebook-profile,社区用 facebook-group,活动用 facebook-event,话题信息流用 facebook-hashtag,彼此都只差一个参数。
互动数据一目了然
likesCount、followersCount、membersCount 以及参加或感兴趣的计数返回即可绘图,因此你能随时间追踪触达和增长。
帖子、照片和视频
facebook-page 返回近期的帖子、照片和视频数组,因此你无需逐一抓取即可监测页面正在发布什么。
为大规模抓取 Facebook 而构建。
Facebook 抓取器运行在同一个网络上,该网络服务着 46,000+ 付费客户和 70,000+ 开发者。无需购买代理,无需运行浏览器,Facebook 变更时也无需修补任何东西。
一个令牌,面向 Python、Node 和 Ruby 的官方 SDK,底层是 99.99% 正常运行时间的网络。