# Crawler-蜜蜂

Um Crawler- Statistiken zu überwachen、Jobs zu verwalten、einen Crawler über die API zu bereinigen oder einen Crawler anzuhalten/fortzusetzen, folgen Sie bitte den nachstehenden Anweisungen:

注意: 在 JS- 中了解您Crawler在 allen API-Aufrufen 中,TCP-Token 和 JS-Token 之间。

# 统计API

Erhalten Sie eine Zusammenfassung Ihrer Crawler、 einschließlich Parallelität、 Warteschlangenstatus 和 Crawling-Verlauf (Aufschlüsselung nach Erfolg und Fehler):

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats'

Verlauf nach Datumsbereich 过滤器:

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats?history_from=yyyy-mm-dd&history_to=yyyy-mm-dd'

# 准备 API

给予最佳评价 Crawler zu löschen, stellen Sie diese POST-Anfrage mit dem Crawler-名称和令牌(JS/TCP):

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/purge'

注意: 很快将发生 所有页面 从 Crawler.

# 查找职位的 API

一份来自工作 Crawler 就这样,发送 Sie diese POST-Anfrage mit der Anfrage-RID,dem Crawler-名称和令牌(JS/TCP):

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/delete_job?rid=RID'

# API“工作查找”

Umeine Anfrage per RID in der Warteschlange Ihres Crawlers zu finden, verwenden Sie die folgende GET-Anfrage (JS/TCP):

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/find_by_rid/RID'

蚂蚁金服:

  • 当战争爆发时:
{
  "status": "QUEUED",
  "request_info": {
    "rid": "YOUR_RID",
    "url": "YOUR_URL",
    "retry": 3,
    "created_at": 1600494969.189415
  }
}
  • 当 NICHT_IN DER QUEUED 时: Ob die Anfrage bereits gcrawlt wurde oder sich nicht in der Warteschlange befindet。
{
  "status": "NOT_QUEUED",
  "request_info": {
    "rid": "YOUR_RID"
  }
}

# API 调用

到一个 Crawler anzuhalten, verwenden Sie diese POST-Anfrage mit dem Crawler-名称和令牌(JS/TCP):

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/pause'

# 强化 API

到一个 Crawler fortzusetzen, stellen Sie diese POST-Anfrage mit dem Crawler-名称和令牌(JS/TCP):

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/unpause'