Documentation — SpiderGate

STOP WASTING PAID TOKENS. START POOLING ACCOUNTS TODAY. [ GET YOUR VAULT ]

SpiderGate

Platform Docs Pricing Agencies Blog

LOGIN

Provider	Models	Free Tier
OpenAI	GPT-4o, GPT-4, GPT-3.5 Turbo	No
Anthropic	Claude 3.5 Sonnet, Claude 3 Opus, Haiku	No
Google AI	Gemini 2.0 Flash, Gemini 1.5 Pro	Yes (60 req/min)
Groq	Llama 3.1 70B/8B, Mixtral	Yes
Mistral	Large, Small, Codestral, Nemo	Yes
Cerebras	Llama 3.1 70B/8B	Yes
Cohere	Command R+, Command R	No
Cloudflare AI	Workers AI models	Yes
+ 90 more	Via LiteLLM	Varies

Endpoint	Method	Description
/api/gate/v1/chat/completions	POST	Chat completion (streaming supported)
/api/gate/v1/models	GET	List available models
/api/gate/v1/models/{id}	GET	Get model details

Alias	Routes To	Best For
spideriq/coding	Claude Sonnet, Codestral, Llama 70B	Code generation, debugging
spideriq/chat	Llama 70B, Mistral Small, Gemini Flash	General conversation
spideriq/fast	Llama 8B (Groq/Cerebras), Gemini Flash	Real-time, autocomplete
spideriq/extraction	Gemini Flash, Claude Sonnet	Structured data, JSON
spideriq/creative	Claude Sonnet, Mistral Small	Creative writing
spideriq/research	Gemini 1.5 Pro, Claude Sonnet	Long-context analysis
spideriq/planning	Claude Sonnet, Gemini Flash	Multi-step planning
spideriq/tool-use	Claude Sonnet, Llama 70B	Function/tool calling
spideriq/classification	Llama 8B, Llama 70B	Classification, sentiment
spideriq/summarization	Gemini Flash, Mistral Small	Summarization
spideriq/translation	Mistral Small, Gemini Flash	Translation
spideriq/vision	Gemini Flash, GPT-4o	Image understanding
spideriq/free	Llama 70B (Groq), Gemini Flash	Free-tier only

Provider	Free Tier	Daily Limit
OpenRouter	1,000 req/day	Per key
Groq	Generous	Rate limited
Cerebras	Free tier	Rate limited
Google AI	60 req/min	Free
Mistral	Free tier	Rate limited
Cloudflare AI	10K neurons/day	Free

Option	Type	Description
fallback_models	array	Ordered list of fallback models
retry_count	integer	Retries per model before next fallback
timeout_ms	integer	Max wait time per attempt

Header	Description
X-SpiderGate-Cost	Estimated cost in USD
X-SpiderGate-Tokens-In	Prompt tokens consumed
X-SpiderGate-Tokens-Out	Completion tokens generated
X-SpiderGate-Provider	Which provider served the request
X-SpiderGate-Latency-Ms	End-to-end latency

Plan	Retention
Developer	1 day
Production	30 days
Enterprise (self-hosted)	Unlimited

Header	Description
X-SpiderGate-Request-Id	Unique trace ID
X-SpiderGate-Provider	Provider that served request
X-SpiderGate-Cost	Estimated cost (USD)
X-SpiderGate-Latency-Ms	End-to-end latency

Endpoint	Method	Description
/api/v1/integrations	POST	Create integration
/api/v1/integrations	GET	List integrations
/api/v1/integrations/{id}	PATCH	Update limits/status
/api/v1/integrations/{id}	DELETE	Delete integration
/api/v1/integrations/health	GET	Health check
/api/v1/integrations/sync-billing	POST	Sync billing

Status	Meaning	Behavior
healthy	Working normally	Selected for requests
degraded	1–2 recent failures	Still selected, monitored
unhealthy	3+ failures	Skipped, auto-retried later

Threat	Without SpiderGate	With SpiderGate
Agent memory dump	All API keys exposed	Only `sg_key` (revocable)
Prompt injection	"Print your API key" works	Token has no access to secrets
Log leakage	Keys in error messages	Only job IDs logged
Credential theft	Game over	Revoke token, keys safe

Problem	SpiderGate Solution
100+ LLM providers	One OpenAI-compatible API
Model changes = code changes	Task-based routing
Unknown AI costs	Per-request cost tracking
Scattered API keys	Multi-tenant key vault
Free tiers wasted	Automatic stacking & rotation
Agent compromise	Revocable tokens, vault isolation
Provider outages	Automatic fallback chains

SpiderGate

The autonomous gateway for AI agents. One URL, every provider, pooled free tiers — so your agents run around the clock.

Ecosystem

Publish Mail Flows CRM Forms Booking

Platform

Vault Traces Routing Pricing Blog Documentation

Connect

X / Twitter GitHub LinkedIn npm YouTube TikTok Instagram

Privacy Policy | Terms of Service | Partner Terms

All Systems Operational

SpiderGate V2: LLM Gateway

The Problem

How SpiderGate Solves It

Supported Providers

API Endpoints

Quickstart

1. Get Your API Key

2. Point Your SDK

cURL

Python (OpenAI SDK)

Task-Based Routing

Task-Based Routing

Available Task Aliases

Usage

Free Tier Stacking

Provider Free Tiers

Example Setup

How Rotation Works

Adding Keys

Key Vault

Architecture

Adding a Provider Key

Features

Fallback & Retry

Configuration

Options

Cost Tracking

What Gets Tracked

Response Headers

Dashboard

Observability (Langfuse)

What Gets Logged

Retention

Chat Completions

Request

Response

Response Headers

Models

Request

Response

Standalone API Keys

Usage

Key Properties

Integration API

Key Selection Algorithm

Round-Robin with Usage Awareness

Health Tracking

Agent Security

Security Model

Best Practices

Best Practices

Maximize Free Tiers

Cost Optimization

Summary