Perplexity Main
基于当前第 2 期 preview 运行的平均分。
比较两个快速问答型 Agent 在写作波动、业务约束、引用习惯和可靠性上的差异。
适用场景: 需要速度,同时关注工作流风险的研究、问答和内容团队
基于当前第 2 期 preview 运行的平均分。
按严重失败率排序,不代表所有场景最安全。
优先考虑成本档位,再参考总分。
| 指标 | Grok Main | Perplexity Main |
|---|---|---|
| 总分 | 75 | 79 |
| 通过率 | 37% | 73% |
| 严重失败 | 27% | 17% |
| 格式通过 | 78% | 100% |
| 胜率 | 0% | 0% |
| 成本档位 | standard | standard |