# 回答
Wenn Sie eine Anfrage 和 Crawlbase stellen,然后 Sie eine Antwort。
该 Antwort 是 JSON 对象或 HTML 代码,是选项,是 [格式]/de/crawling-api/parameters/#format) 参数(标准是 html)。
# HTML 答案
Wenn Sie das HTML-Antwortformat ausgewählt haben (was die Standardeinstellung ist), erhalten Sie das HTML der Seite als Antwort。
死 答案参数 wird den Antwortheadern hinzugefügt。
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# JSON 答案
我们可以使用 JSON-Antwortformat 来使用 JSON-Objekt,并进行分析。
Dieses Objekt enthält alle Informationen, die Sie benötigen。莱森·西伊 答案参数 请参阅所有信息。
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# 头
Wie Sie in den obigen Beispielen gesehen haben, wird die Antwort, JSON 或 HTML zurückgegeben JSON 参数,或者 HTML 标头达米特·西尔法伦 (damit Sie erfahren) 是一名安弗拉吉 (Anfrage) 被动者。
# 网址
我们使用 URL,在 Anfrage 中使用,或者在 Weiterleitung 中使用 URL,在 Crawlbase 中使用。
# ursprünglicher_status
Die Statusantwort,die wir (Crawlbase) beim Crawlen der in der Anfrage gesendeten URL erhalten。
Es kann jeder gültige HTTP-Statuscode sein。
Bitte beachten Sie,dass Crawlbase nur Anfragen berechnet,die von original_status
Erfolg (200, 201, 204)、permanente Weiterleitung (301)、temporäre Weiterleitung (302)、wenn die folgende Weiterleitung Inhalt zurückgegeben hat、nicht gefunden (410, 404)。文与文 pc_status
200. 其他 original_status
Für die erhaltenen Codes Falled keine Gebühren 和。
# 电脑状态
Der Crawlbase (PC)-Statuscode 很明显,Statuscode 本身就是代码,它是一个简单的代码。
Beispielsweise könnte eine 网站 original_status
200 mit einem Captcha,在 diesem Fall, pc_status
有 503 个。
Jeder Code,der nicht dem Standard entspricht,wie etwa 601, 999 usw.,wird intern vom Engineering-Team verwendet und nur angezeigt,um Ihnen bei der Fehlerbehebung zu helfen,wenn Sie sich an den Support wenden。
BITTE beachten SIE dass Anfragen 和 Crawlbase,die erfolglos bleiben, pc_status
代码(也是 anders als 200)wird nicht berechnet。
# 身体
Dieser 参数 ist nur,采用 JSON verfügbar [格式]/de/crawling-api/parameters/#format),采用 html format
Wird der Hauptteil der Antwort 自我存在。
进入网站后,Crawlbase 会作为 Proxy-Crawlings 的代理爬行在 Anfrage gesendeten URL 中进行。