# Режимы секции мощности
При выполнении запроса Crawlbase вы получите ответ。
该文件的格式为 JSON 和 HTML-код страницы в зависимости от выбранного вами параметра。 格式 параметр (по умолчанию html)。
# HTML 响应
Если выбрали формат ответа HTML(который используется по умолчанию),в качестве ответа вы получите HTML-код страницы。
параметры ответа будут добавлены в заголовки ответа.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
'X-Domain-Complexity': standard
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# JSON 响应
Если выбрали формат ответа JSON,вы получите объект JSON,который можно проанализировать。
Этот объект содержит всю необходимую вам информацию. Читать параметры ответа за всю информацию。
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https://github.com/crawlbase?tab=repositories",
"domain_complexity": "standard",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# 头
Как вы видели в примерах выше, ответ, json или html, вернет параметры для json или заголовки для html, позволит вам узнать, что произошло с запросом。
# 网址
Исходный URL, который был отправлен в запросе, или URL перенаправления, который Crawlbase 跟着。
# 原始状态
Статус ответа, который мы (Crawlbase) получаем при сканировании URL-адреса, отправленного в запросе.
Это может быть любой действительный код статуса http.
请注意, Crawlbase только запросы на оплату, которые имеют original_status успех (200, 201, 204), постоянное перенаправление (301), временное перенаправление (302), если последующее перенаправление вернуло контент, не найдено (410, 404)。 И когда pc_status 200. Любое другое original_status Полученные коды не будут оплачены。
# 电脑状态
Crawlbase Код состояния (ПК) может быть любым кодом состояния, именно этот код в конечном итоге оказывается действительным。
Например, веб-сайт может возвращать original_status 第200章 不服输 pc_status 503 号。
Любой код、который не является стандартным、например 601、999 和 т。 д., используется внутри компании инженерной группой 和 предоставляется только для устранения неполадок при обращении в службу поддержки。
请注意 что запросы, сделанные Crawlbase что заканчивается неудачей pc_status код (так отличающийся от 200) не будет списан.
# X域复杂性
Уровень сложности показывает, насколько сложно сканировать или сканировать определенный домен, а также отражает соответствующие требования к ресурсам 和 ценам:
standard– Домены,которые легко сканировать или скрейпить,с минимальными мерами защиты。 Такие домены обычно имеют самую низкую ценовую категорию。moderate– Домены с умеренной защитой от ботов, требующие специализированной обработки. Такие домены обычно имеют промежуточный ценовой уровень 和 требуют больше ресурсов для обработки。complex– Домены с передовыми системами защиты, которые сложно сканировать или скрейпить. Для этого требуются передовые методы 和 специализированные ресурсы, что отражено в самом высоком ценовом yuровне。
Понимание уровня сложности различных доменов поможет вам оценить потенциальные цены 和 технические соображения для ваших задач сканирования。 Для получения конкретной информации о ценах на основе уровней сложности домена, пожалуйста, обратитеськ вашему плану подписки или свяжитесь с нашей командой по продажам через 联系.
# 身体
Этот параметр доступен только в формате json. 格式, html format будет являться текстом самого ответа。
Содержание страницы, которая Crawlbase найдено в результате сканирования прокси-сервером URL-адреса, отправленного в запросе.