Crawling API / Daum

Daum 抓取工具。
任意页面,完整渲染。

发送任意 Daum URL,即可获取完整渲染的 HTML,通过韩国本地住宅代理返回,内置反机器人处理。
使用通用提取器将其转换为 JSON。

99% 成功率1.4 亿住宅 IP30 个地区
Daum URLHTML or JSONwww.daum.net/search?q=weatherCrawlbase路由渲染提取渲染后的 HTML结构化 JSONcrawling-apigeneric-extractordaum.net · 速率限制已改道 · 200
实时抓取信息流 · Daum1.24M req/min正在流式传输
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91DE132ms
200www.daum.net/search?q=%EC%9C%A0%EA%B0%80GB60ms
200finance.daum.net/exchangesCA93ms
200www.daum.net/search?q=weatherCA73ms
200news.daum.net/economicCA219ms
200news.daum.net/v/20260626093015421US114ms
200sports.daum.net/schedule/kboAU96ms
200sports.daum.net/schedule/kboFR76ms
404sports.daum.net/schedule/kboIN138ms
200search.daum.net/search?q=%EB%82%A0%EC%94%A8GB92ms
301cafe.daum.net/bookloveUS132ms
200search.daum.net/search?q=%EB%82%A0%EC%94%A8GB215ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91US131ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91DE173ms
200finance.daum.net/exchangesAU65ms
200finance.daum.net/quote/A005930CA199ms
200www.daum.net/search?q=weatherCA132ms
200finance.daum.net/exchangesJP82ms
200news.daum.net/v/20260625174208910BR188ms
200news.daum.net/v/20260626093015421IN211ms
200news.daum.net/economicAU79ms
200news.daum.net/v/20260625174208910NL186ms
200finance.daum.net/quote/A005930ES110ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91ES135ms
200search.daum.net/search?w=img&q=hanokAU49ms
200cafe.daum.net/subdued20clubES55ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91DE132ms
200www.daum.net/search?q=%EC%9C%A0%EA%B0%80GB60ms
200finance.daum.net/exchangesCA93ms
200www.daum.net/search?q=weatherCA73ms
200news.daum.net/economicCA219ms
200news.daum.net/v/20260626093015421US114ms
200sports.daum.net/schedule/kboAU96ms
200sports.daum.net/schedule/kboFR76ms
404sports.daum.net/schedule/kboIN138ms
200search.daum.net/search?q=%EB%82%A0%EC%94%A8GB92ms
301cafe.daum.net/bookloveUS132ms
200search.daum.net/search?q=%EB%82%A0%EC%94%A8GB215ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91US131ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91DE173ms
200finance.daum.net/exchangesAU65ms
200finance.daum.net/quote/A005930CA199ms
200www.daum.net/search?q=weatherCA132ms
200finance.daum.net/exchangesJP82ms
200news.daum.net/v/20260625174208910BR188ms
200news.daum.net/v/20260626093015421IN211ms
200news.daum.net/economicAU79ms
200news.daum.net/v/20260625174208910NL186ms
200finance.daum.net/quote/A005930ES110ms
200www.daum.net/search?q=%EC%84%9C%EC%9A%B8+%EB%A7%9B%EC%A7%91ES135ms
200search.daum.net/search?w=img&q=hanokAU49ms
200cafe.daum.net/subdued20clubES55ms
01 实时演示

输入任意 Daum URL。输出 HTML 或 JSON。

Crawling API,实时输入。获取渲染后的 HTML,或切换到通用提取器以获取 JSON。悬停即可暂停并阅读。

ready
keys 1-2 switch · click to pauserun your own URL
Run your first request in minutes. Up to 10,000 free requests, no credit card.免费开始
02 能力

一个 API,应对 Daum 抛给你的一切。

Daum 是一个由 JavaScript 渲染的韩国门户,其新闻和搜索信息流动态加载,并按地理位置限定于韩国。Crawling API 在真实浏览器中渲染它,通过韩国本地住宅 IP 访问它,并交付给你干净的 HTML 或 JSON。

渲染

完整的 JavaScript 渲染

真实浏览器执行页面,因此动态加载的新闻标题、搜索结果和门户信息流都会被捕获,而不仅仅是初始 HTML。

代理

韩国本地住宅 IP

Daum 按地理位置限定于韩国,因此每个请求都会轮换一个韩国本地住宅 IP,让你像真实本地访客一样访问该门户。

反机器人

拦截由我们处理

CAPTCHA、机器人墙和速率限制都会被自动清除。无需解决任何问题,也无需维护。

格式

HTML 或 JSON

获取完整渲染的 HTML,或添加 scraper=generic-extractor以将标题、内容、图片和链接作为结构化 JSON 返回。

附加功能

截图和异步

同一次调用即可捕获整页截图,或通过 webhook 和云存储异步运行。

一个 token

一个 API,适用于每个网站

Crawling API 适用于任意 URL,因此同一个 token 涵盖 Daum 以及你抓取的其他一切。 查看实时演示.

03 输出

渲染后的 HTML,或干净的 JSON。

默认情况下你会获得渲染后的 HTML。添加 generic-extractor,同一页面便会以带类型的 JSON 返回。

{ "title": "Daum: news, search and mail", "favicon": "https://www.daum.net/favicon.ico", "meta": { "description": "Daum portal: news, search, mail and more.", "keywords": "..." }, "content": "Portal sections, news headlines, search results and links...", "canonical": "https://www.daum.net/", "images": [ "..." ], "og_images": [ "..." ], "links": [ "..." ] }

页面

title · string  canonical · string  favicon · string

元数据

meta.description · string  meta.keywords · string

内容

content · string

媒体

images · array  og_images · array

链接

links · array

04 工作原理

一次调用,从 URL 到数据。

每个 Daum 请求都经过同一条路径。你发送一个 URL,其间的一切由我们运营。

01

发送 URL

带上你的 token 传入任意公开的 Daum URL:主页、新闻文章、搜索结果页或咖啡社区。

02

轮换代理

一个韩国本地住宅 IP,可干净地访问 Daum,取自遍布 30 个地区的 1.4 亿个 IP。

03

渲染页面

真实浏览器加载页面,让新闻标题、搜索结果和门户信息流在捕获前完成渲染。

04

清除反机器人

Daum 的地理限制、机器人检查和速率限制都会被自动处理。无需解决任何问题,也无需维护。

05

返回 HTML 或 JSON

完整渲染的 HTML 会返回,或在你添加通用提取器时返回带类型的 JSON。

05 使用场景

各团队基于 Daum 数据构建什么。

USE / 01韩国

韩国市场研究

追踪门户、新闻和咖啡社区中的热门趋势,实时把握韩国市场。

USE / 02新闻

新闻监测

关注 Daum 新闻标题和搜索页面,在事件发生时追踪报道、覆盖面和舆情。

USE / 03本地化

本地化和质量保证

以韩国本地访客的身份渲染 Daum,验证本地化页面、区域内容和地理限定行为。

USE / 04搜索

门户和 SERP 数据

收集 Daum 搜索结果、板块和链接,以对标韩国市场的可见度和排名。

USE / 05金融

金融和体育信息流

抓取金融和体育页面,获取全天更新的价格、赛程和数据。

USE / 06覆盖范围

任意 URL,一个 API

抓取主页、新闻、搜索、咖啡社区和金融,以及你需要的任何其他网站。

06 注意事项

抓取 Daum 时需要了解的要点。

像真实浏览器一样渲染

Daum 是一个由 JavaScript 渲染的门户;Crawling API 运行真实浏览器,让新闻标题、搜索结果和门户信息流在捕获前完成加载。

韩国地理定向

Daum 按地理位置限定于韩国。Crawlbase 轮换韩国本地住宅 IP,让门户干净地加载,无需你购买或管理代理。

默认 HTML,按需 JSON

你会获得完整渲染的 HTML。添加 scraper=generic-extractor 以获取解析后的标题、内容、图片和链接,或自行解析 HTML。

仅限公开页面

Crawling API 读取公开可见的页面,无需登录,因此你获取的是韩国未登录访客所看到的内容。

07 为什么选择 Crawlbase

为大规模抓取 Daum 而打造。

Crawling API 运行在服务于 46,000+ 付费客户和 70,000+ 开发者的同一网络上。无需购买代理,无需运行浏览器,Daum 变更时也无需打补丁。

99%
平均请求成功率
140M
住宅 IP,另加 9800 万数据中心 IP
30
用于获取准确本地结果的地区
20/s
默认每秒请求数,可按需增加

一个 token,面向 Python、Node 和 Ruby 的官方 SDK,以及底层 99.99% 正常运行时间的网络。

08 FAQ

Daum 抓取常见问题。

带上你的 token 将 Daum URL 发送到 Crawlbase Crawling API。Crawlbase 轮换一个韩国本地住宅代理,在真实浏览器中渲染页面,清除机器人检查,并返回完整渲染的 HTML。添加 scraper=generic-extractor 即可改为获取结构化 JSON。
可以。默认情况下 Crawling API 返回渲染后的 HTML;添加通用提取器(scraper=generic-extractor)即可以 JSON 形式接收标题、元数据、内容、图片和链接,或自行解析 HTML。
会。真实浏览器执行页面,因此动态加载的新闻标题、搜索结果和门户信息流都会被捕获,而不仅仅是初始 HTML。
Daum 按地理位置限定于韩国,因此请求需要来自韩国本地 IP 才能干净地加载。Crawlbase 会为你进行韩国地理定向并轮换住宅 IP,让你像本地访客一样访问 Daum,无需购买或管理代理。
Crawlbase 通过轮换的住宅 IP 路由每个请求,并自动清除机器人检查。你无需管理代理或解决 CAPTCHA,Daum 变更其设置时也无需维护任何东西。
整个门户中的任意公开 URL:主页、新闻文章、搜索结果页、体育、金融和咖啡社区页面。同一个 API 同样适用于任何其他网站。
免费开始,含最多 10,000 次请求,无需信用卡。付费方案随用量扩展,同一个 token 通用于 Crawling API 和每个 Crawlbase 抓取工具。

开始抓取 Daum。
无需代理即可访问韩国。

免费起步,含最多 10,000 次请求。一个 token 通用于 Crawling API 和每个抓取工具。