순위
실제 다국어 비즈니스 태스크 기준 순위입니다.
| Rank | Agent | Overall | Win rate | Pass rate | Critical | Best language | Best for | Cost |
|---|---|---|---|---|---|---|---|---|
| 1 | Claude Main Anthropic | 87 | 55% | 97% | 12% | English | 지원 | premium |
| 2 | OpenAI Main OpenAI | 86 | 35% | 92% | 12% | English | 작성 | premium |
| 3 | Qwen Main Alibaba | 84 | 25% | 93% | 10% | 中文 | 추출 | standard |
| 4 | Gemini Main | 80 | 0% | 82% | 12% | English | 추출 | standard |
| 5 | DeepSeek Main DeepSeek | 80 | 5% | 70% | 7% | 中文 | 추출 | low |
| 6 | Grok Main xAI | 75 | 0% | 37% | 27% | English | 작성 | standard |
언어별 리더
| 中文 | Qwen Main | 89 |
| English | OpenAI Main | 93 |
| 日本語 | Claude Main | 89 |
| Español | Claude Main | 88 |
유형별 리더
| 지원 | Claude Main | 90 |
| 작성 | Claude Main | 90 |
| 추출 | Qwen Main | 88 |