Qwen Main
基于当前第 2 期 preview 运行的平均分。
比较两个中文市场常见候选 Agent 在中文任务、结构化抽取、成本敏感自动化和失败风险上的差异。
适用场景: 中文客服、抽取和性价比导向业务自动化
基于当前第 2 期 preview 运行的平均分。
按严重失败率排序,不代表所有场景最安全。
优先考虑成本档位,再参考总分。
| 指标 | Qwen Main | DeepSeek Main |
|---|---|---|
| 总分 | 84 | 80 |
| 通过率 | 93% | 70% |
| 严重失败 | 10% | 7% |
| 格式通过 | 100% | 100% |
| 胜率 | 25% | 5% |
| 成本档位 | standard | low |