AI API Gateway

统一 AI 入口 · 自动路由 / 指定路由 · 用量统计

Worker 地址

https://ai-api-gateway.hb67egcim4.workers.dev

鉴权 Header:X-Gateway-TokenREQUIRE_GATEWAY_TOKEN=false 时可省略)· 归因:X-Caller-Worker

三云接入矩阵

GET /v1/capabilities/v1/models/v1/providers/status 动态渲染,与线上一致。

加载中…

同源 AI 网关(独立部署)

ai-api-gateway 之外,YouTube pipeline 还独立部署了一组面向场景的网关。它们各自有 worker 和文档,不通过本网关路由。

网关定位主要 endpointsProvider / 模型
vertex-gateway
workers.dev
YouTube pipeline 统一 AI 入口。内部 4 个 BYPASS_VERTEX_* 开关决定走 DeepSeek+Workers AI 还是 Vertex,业务零感知 /chat /translate /analyze /summarize /vision /tts /tts-to-r2 /diarize-translate 开关 ON: 转发 DeepSeek + Workers AI
开关 OFF: Vertex (gemini-2.5-flash-lite / 3.1-tts / 2.5-pro)
openapi-deepseek-gateway
workers.dev
OpenAI 兼容文本网关。封装 api-proxy.chxyka.ccwu.cc 的 DeepSeek v4 Pro,自动剥离 reasoning_content /chat /chat/stream /translate /analyze /summarize deepseek-v4-pro
默认 max_tokens=8192(reasoning 模型必须给大)
cf-ai-gateway
workers.dev
Cloudflare Workers AI 封装,主用作 vertex-gateway 的 fallback 通道 /vision /tts /tts-to-r2 /whisper @cf/llava-hf/llava-1.5-7b-hf (vision)
@cf/myshell-ai/melotts (TTS)
@cf/openai/whisper-large-v3-turbo (STT)

架构详情 + 4 开关与一键回滚操作: workers-docs.hb67egcim4.workers.dev/architecture · 全 worker 索引: cloudflare-api-docs.pages.dev

路由模式

options.routing说明
auto / cost_optimal按 config/routes.json 顺序尝试,跳过额度用尽/不健康后端
explicit必须同时指定 options.provider + options.model
free_only仅用免费额度后端(CF m2m100、Azure F0 等)
quality_first优先 Vertex Pro 等高质量模型
vertex_only / azure_only / cf_only锁定单一云厂商

能力一览

capability路径状态
加载中…

自动路由示例

curl -X POST "$WORKER/v1/translate" \
  -H "Content-Type: application/json" \
  -H "X-Caller-Worker: youtube-translate" \
  -d '{
    "input": {
      "segments": [{"start":0,"end":1,"text":"Hello"}],
      "target_lang": "zh"
    },
    "options": { "routing": "cost_optimal" }
  }'

指定路由示例

curl -X POST "$WORKER/v1/vision.ocr" \
  -H "Content-Type: application/json" \
  -d '{
    "input": { "image_base64": "...", "mime": "image/png" },
    "options": {
      "routing": "explicit",
      "provider": "vertex",
      "model": "gemini-3.1-flash-lite-preview"
    }
  }'

模型与能力一键测试 (cURL)

请选择需要测试的模型或能力,点击下方复制并在终端内直接粘贴执行:

今日用量

Cloudflare 额度以 Dashboard GraphQL 官方 Neurons 为准;下方「网关估算」仅作 D1 记账参考。

加载中…

新增 AI 能力

详见仓库文档:

配置三件套:config/models.json · config/routes.json · src/capabilities/

业务 Worker 接入:在 wrangler.toml 添加 [[services]] binding = "AI_GATEWAY" service = "ai-api-gateway",经 Service Binding 调用 /v1/{capability}