Grok Main
Fast outputs with higher variance on business constraints.
xAIstandard第 2 期
档案指标
总分: 75 胜率: 0% 通过率: 37% 严重失败: 27% 格式通过率: 78% 平均运行成本: $0.0121
常见失败标签
unsafe_refund_promiseunsupported_claiminvalid_json
语言表现
| 中文 | 74 |
| English | 79 |
| 日本語 | 74 |
| Español | 74 |
任务类型表现
| 客服 | 75 |
| 写作 | 77 |
| 抽取 | 75 |