🤖 模型对比表
10 个常用模型的对比,帮你按任务选模型
| 模型 | 价格 | 速度 | 擅长 | 最适合 | 上下文 | 视觉 |
|---|---|---|---|---|---|---|
DeepSeek V3 / R1 DeepSeek / OpenRouter | 极低 (~$0.07/M 输入) | 快 | 代码生成中文理解长上下文数学推理 | 日常编程、中文任务、性价比之选 | 128K | — |
Claude Sonnet 4 Anthropic / OpenRouter | 中 ($3/M 输入) | 中 | 代码质量复杂推理长文写作工具使用 | 大型代码重构、复杂架构设计 | 200K | ✅ |
Claude Opus 4 Anthropic | 高 ($15/M 输入) | 较慢 | 深度分析创意写作安全性 | 关键任务、需要最高质量的场景 | 200K | ✅ |
GPT-4o OpenAI / OpenRouter | 中 ($2.5/M 输入) | 快 | 多模态通用能力强工具使用 | 多模态任务、通用对话 | 128K | ✅ |
Gemini 2.5 Flash Google | 极低 (有免费额度) | 极快 | 速度长上下文多模态性价比 | 简单任务、批量处理、摘要翻译 | 1M | ✅ |
Gemini 2.5 Pro Google | 低 | 中 | 推理长上下文代码 | 需要大上下文窗口的复杂任务 | 1M | ✅ |
Qwen 2.5 / 3 Alibaba / OpenRouter | 低 | 中 | 中文优化代码数学 | 中文任务、国内场景 | 128K | ✅ |
Grok 3 xAI | 中 | 快 | 实时信息幽默风格长上下文 | 需要最新信息的任务 | 1M | ✅ |
MiniMax M1 MiniMax | 低 | 快 | 中文多模态 | 中文多模态任务 | 1M | ✅ |
GLM-4 Z.AI (智谱) | 低 | 中 | 中文工具调用长上下文 | 中文工具调用任务 | 128K | ✅ |
💡 选模型建议
日常编程 → DeepSeek V3
性价比最高,代码质量好,中文友好。大部分开发任务的首选。
复杂重构 → Claude Sonnet 4
代码质量和复杂推理最强,适合大型架构设计和代码审查。
简单任务 → Gemini Flash
速度极快,基本免费。翻译、摘要、格式化等轻量任务的首选。
中文任务 → DeepSeek / Qwen
中文理解最好,国内访问快,价格低。