Быстрый старт
Узнайте, как использовать API веб-скрапинга и обхода AnyCrawl для извлечения данных, готовых для LLM, с любого сайта
Введение
Создан для LLM. Многопоточный высокопроизводительный краулер и скрапер, готовый к работе «из коробки». С дружественным к разработчикам OpenAPI он отдаёт чистые структурированные данные, оптимизированные для LLM.
У AnyCrawl есть следующие возможности:
Высокая производительность
Высокая производительность, многопоточность.
Полностью открытый исходный код
Открытый исходный код, доступен на GitHub.
Удобно для LLM
Чистые структурированные данные для LLM.
OpenAPI
Совместимость с OpenAPI.
Соглашения API
Именование параметров
API AnyCrawl следует единым соглашениям об именовании:
-
Параметры запроса: в основном
snake_case- Типичные примеры:
webhook_url,event_types,cron_expression,max_retries - Примечание: у отдельных полей конечных точек используются существующие имена в camelCase (например,
timeRangeв Search).
- Типичные примеры:
-
Поля ответа: формат
snake_case- Примеры:
task_id,webhook_id,next_execution_at,task_type,cron_expression,is_active
- Примеры:
Для тел запросов ориентируйтесь на таблицу параметров конечной точки и OpenAPI как на источник истины.
Формат ответа
Все ответы API имеют стандартную структуру:
{
"success": true,
"data": { ... },
"message": "Optional message"
}success: булево значение — успешен ли запросdata: полезная нагрузка ответа (объект или массив)message: необязательное человекочитаемое сообщение
Ответы об ошибках
Ответы об ошибках содержат подробности:
{
"success": false,
"error": "Error type",
"message": "Human-readable error message",
"details": { ... }
}Распространённые HTTP-коды:
200— успех400— неверный запрос (ошибки валидации)401— не авторизован (неверный API-ключ)402— требуется оплата (недостаточно кредитов)404— не найдено429— слишком много запросов (превышен лимит)500— внутренняя ошибка сервера