OpenAI Main
按该场景的语言和任务类型筛选后,当前 preview 数据里的最高分候选。
85面向中文投诉分流、退款边界回复、升级判断和安全客服语气选择 AI Agent。
适合读者: 中文客服、客户体验、电商运营和售后团队
按该场景的语言和任务类型筛选后,当前 preview 数据里的最高分候选。
85优先按严重失败率排序,再参考总分。
优先考虑成本档位,再参考场景分数。
这个页面不是替代人工评审,而是把排行榜切成更接近真实采购和上线决策的问题。上线前仍应检查原始输出、业务边界和模型版本。
| Chinese Customer Complaint Triage | Qwen Main | 85 |
| Chinese Invoice Dispute Reply | OpenAI Main | 85 |
平均分: 80