翻译
对比各家 LLM 在大规模多语翻译中的表现,按语种质量与规模化月度成本横向评估。
你的用量
默认假设月请求量1,000,000
平均输入 token200
平均输出 token200
本场景的详细指南目前仅有英文版(中文翻译进行中)。上方的推荐链路与定价已完全本地化。
查看英文版 →推荐路由
按最佳性价比排序PRIMARY
Gemini 2.5 Flash
Google · quality 78 · 320 tok/s
Monthly cost$560
Vs baseline−75%
P50 latency0.3s
FALLBACK
Qwen 3 Max
Alibaba · quality 84 · 130 tok/s
Monthly cost$800
Vs baseline−64%
P50 latency0.9s
Baseline = GPT-5 at the same usage = $2.3K/mo.
路由模拟器
二阶段预览拖动滑块在 Gemini 2.5 Flash(主)和 Qwen 3 Max(兜底)之间分配流量。无需写一行 gateway 代码,月度账单变化实时呈现。
主路由: Gemini 2.5 Flash兜底: Qwen 3 Max
70% Gemini30% Qwen
混合月度成本$632按上文假设的用量
对比 GPT-5−72%$2.3K → $632
二阶段会把这套路由变成真实的 OpenAI 兼容端点——一个 key,一份账单,自动 failover。留个邮箱,上线时通知你。
邮件后端到位前仅存在本机,无追踪,一键移除。
通过 API 使用此路由
第二阶段预览 · 网关尚未上线第二阶段预览 · 网关尚未上线该接口目前不存在。网关计划在第二阶段上线——下面只是规划中的接口形态预览,不是可用的 API。上线时会通过 newsletter 通知订阅者。
查看计划中的 API 调用形态
$ curl https://api.aipricly.com/v1/chat/completions \
-H "Authorization: Bearer $AIPC_KEY" \
-H "Content-Type: application/json" \
-d '{
"scenario": "translation",
"messages": [{"role": "user", "content": "..."}]
}'