🤖 模型对比表

10 个常用模型的对比，帮你按任务选模型

模型	价格	速度	擅长	最适合	上下文	视觉
DeepSeek V3 / R1 DeepSeek / OpenRouter	极低 (~$0.07/M 输入)	快	代码生成中文理解长上下文数学推理	日常编程、中文任务、性价比之选	128K	—
Claude Sonnet 4 Anthropic / OpenRouter	中 ($3/M 输入)	中	代码质量复杂推理长文写作工具使用	大型代码重构、复杂架构设计	200K	✅
Claude Opus 4 Anthropic	高 ($15/M 输入)	较慢	深度分析创意写作安全性	关键任务、需要最高质量的场景	200K	✅
GPT-4o OpenAI / OpenRouter	中 ($2.5/M 输入)	快	多模态通用能力强工具使用	多模态任务、通用对话	128K	✅
Gemini 2.5 Flash Google	极低 (有免费额度)	极快	速度长上下文多模态性价比	简单任务、批量处理、摘要翻译	1M	✅
Gemini 2.5 Pro Google	低	中	推理长上下文代码	需要大上下文窗口的复杂任务	1M	✅
Qwen 2.5 / 3 Alibaba / OpenRouter	低	中	中文优化代码数学	中文任务、国内场景	128K	✅
Grok 3 xAI	中	快	实时信息幽默风格长上下文	需要最新信息的任务	1M	✅
MiniMax M1 MiniMax	低	快	中文多模态	中文多模态任务	1M	✅
GLM-4 Z.AI (智谱)	低	中	中文工具调用长上下文	中文工具调用任务	128K	✅

💡 选模型建议

日常编程 → DeepSeek V3

性价比最高，代码质量好，中文友好。大部分开发任务的首选。

复杂重构 → Claude Sonnet 4

代码质量和复杂推理最强，适合大型架构设计和代码审查。

简单任务 → Gemini Flash

速度极快，基本免费。翻译、摘要、格式化等轻量任务的首选。

中文任务 → DeepSeek / Qwen

中文理解最好，国内访问快，价格低。