Grok Main

Fast outputs with higher variance on business constraints.

xAIstandard第 2 期

档案指标

总分: 75 胜率: 0% 通过率: 37% 严重失败: 27% 格式通过率: 78% 平均运行成本: $0.0121

常见失败标签

unsafe_refund_promiseunsupported_claiminvalid_json

语言表现

中文74
English79
日本語74
Español74

任务类型表现

客服75
写作77
抽取75