# 回答
当你提出一个请求时 Crawlbase 请提交一个答案。
该 Antwort 是 JSON-Objekt 或 der HTML-Code der Seite、abhängig von der Option、die Sie mit dem 格式 参数(标准 ist html)。
# HTML 响应
Wenn Sie das HTML-Antwortformat ausgewählt haben (was die Standardeinstellung ist), erhalten Sie das HTML der Seite als Antwort。
明镜 答案参数 wird den Antwortheadern hinzugefügt。
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
'X-Domain-Complexity': standard
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# JSON 响应
我们可以使用 JSON-Antwortformat 来使用 JSON-Objekt,并进行分析。
Dieses Objekt enthält alle Informationen, die Sie benötigen。莱森·西伊 答案参数 请参阅所有信息。
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https://github.com/crawlbase?tab=repositories",
"domain_complexity": "standard",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# 头
Wie Sie in den obigen Beispielen gesehen haben, wird die Antwort, JSON 或 HTML zurückgegeben JSON 参数或 HTML 标头达米特·西尔法伦 (damit Sie erfahren) 是一名安弗拉吉 (Anfrage) 被动者。
# 网址
Die ursprüngliche URL,die in der Anfrage gesendet wurde oder die URL der Weiterleitung,die Crawlbase 格福尔格特。
# 原始状态
现状,我们(Crawlbase)在 Anfrage gesendeten URL 中爬行。
Es kann jeder gültige HTTP-Statuscode sein。
请注意 Crawlbase Es werden nur Anfragen berechnet,死 original_status
Erfolg (200, 201, 204)、permanente Weiterleitung (301)、temporäre Weiterleitung (302)、wenn die folgende Weiterleitung Inhalt zurückgegeben hat、nicht gefunden (410, 404)。文与文 pc_status
200. 其他 original_status
Für die erhaltenen Codes Falled keine Gebühren 和。
# 电脑状态
明镜 Crawlbase (PC) 状态代码可以被认为是状态代码本身并且是代码,是一个简单的代码。
Beispielsweise könnte eine 网站 original_status
200 mit einem Captcha,在 diesem Fall, pc_status
有 503 个。
Jeder Code,der nicht dem Standard entspricht,wie etwa 601, 999 usw.,wird intern vom Engineering-Team verwendet und nur angezeigt,um Ihnen bei der Fehlerbehebung zu helfen,wenn Sie sich an den Support wenden。
BITTE beachten SIE 案件 Crawlbase 一切都结束了 pc_status
代码(也是 anders als 200)wird nicht berechnet。
# X域复杂性
Der Komplexitätsgrad gibt an, wie schwierig das Crawlen oder Scrapen einer bestimmten Domäne ist, und spiegelt auch den damit verbundenen Ressourcenbedarf and die preise morewide:
standard
– 域,die leicht zu scrapen oder zu scrapen sind und nur minile Schutzmaßnahmen erfordern。 Diese Domains 位于 der Regel die niedrigste Preisstufe 中。moderate
– Domänen mit modem Anti-Bot-Schutz,die eine spezielle Behandlung erfordern。 Diese Domänen haben typescherweise eine mittlere Preisstufe 和 sind 资源强化 zu verarbeiten。complex
– Domänen mit erweiterten Schutzsystemen,die schwer zu scrapen oder zu scrapen sind。 Diese erfordern fortgeschrittene Techniken und spezialisierte Ressourcen,是在 der höchsten Preisstufe Widespiegelt 中。
Das Verständnis des Komplexitätsgrads verschiedener hilft Ihnen, Potenzielle Preise und technische Aspekte for Ihre Crawling-Aufgaben abzuschätzen. Spezifische Preisinformationen basierend auf Domänenkomplexitätsstufen finden Sie in Ihrem Abonnementplan oder kontaktieren Sie unser Vertriebsteam über die 联系页面.
# 身体
JSON verfügbar 中的 Dieser 参数 ist nur 格式, 在 html 中 format
Wird der Hauptteil der Antwort 自我存在。
页面内容 Crawlbase 作为代理爬行的来源,位于 Anfrage gesendeten URL 中。