O AnyCrawl oferece roteamento flexível de proxy com base em padrões de URL. Você pode configurar proxies diferentes para sites ou endpoints de API distintos.
O AnyCrawl suporta quatro modos de proxy que podem ser informados nas requisições da API:
Modo
Descrição
auto
Decide automaticamente entre o proxy base e o stealth. Começa pelo base quando disponível; se o base estiver indisponível ou houver novas tentativas/falhas, faz upgrade ou fallback para stealth.
base
Usa o proxy configurado em ANYCRAWL_PROXY_URL (padrão)
stealth
Usa o proxy configurado em ANYCRAWL_PROXY_STEALTH_URL (normalmente residencial ou premium)
URL personalizada
Uma string de URL de proxy completa (por exemplo, http://user:pass@proxy:8080), retornada como custom nas respostas
Para casos em que todas as requisições usam o mesmo proxy, defina a variável de ambiente ANYCRAWL_PROXY_URL:
# Proxy únicoexport ANYCRAWL_PROXY_URL=http://username:password@proxy.example.com:8080# Vários proxies (modo em camadas)export ANYCRAWL_PROXY_URL=http://proxy1:8080,http://proxy2:8080,http://proxy3:8080
Quando vários proxies são informados (separados por vírgula), o AnyCrawl usa uma estratégia de proxy em camadas:
Todas as requisições começam pelo primeiro proxy (camada 0)
Se um proxy falhar para um domínio, o AnyCrawl troca automaticamente para a próxima camada nesse domínio
Isso oferece failover inteligente e uso otimizado de proxy
É a forma mais simples quando você não precisa de roteamento por URL.
Para roteamento por URL, crie um arquivo JSON (por exemplo, proxy-config.json) e defina ANYCRAWL_PROXY_CONFIG com o caminho:
ANYCRAWL_PROXY_CONFIG=/path/to/proxy-config.json
Observação: se ANYCRAWL_PROXY_URL e ANYCRAWL_PROXY_CONFIG estiverem definidos, as regras do arquivo têm precedência e ANYCRAWL_PROXY_URL funciona como fallback para URLs que não casam com nenhuma regra.
Using proxy from request userData: http://custom-proxy:8080Found proxy for URL https://example.com: http://proxy.example.com:8080 By matching a rule.Proxy matched by domain pattern: *.gov.au → http://proxy.example.com:8080Using tiered proxy: http://default-proxy:8080
# Proxy padrão para uso geralexport ANYCRAWL_PROXY_URL=http://default-proxy:8080# Roteamento por URL para sites específicosexport ANYCRAWL_PROXY_CONFIG=/path/to/proxy-config.json