Agent 对比

Llama vs Mistral

比较开源权重和欧洲通用 Agent 在成本控制、抽取可靠性和业务安全上的表现。

适用场景: 评估开放或标准成本部署路径的团队

综合胜者

Mistral Main

基于当前第 2 期 preview 运行的平均分。

风险更低

Mistral Main

按严重失败率排序,不代表所有场景最安全。

性价比候选

Llama Main

优先考虑成本档位,再参考总分。

指标Llama MainMistral Main
总分7981
通过率75%85%
严重失败7%2%
格式通过100%100%
胜率0%10%
成本档位lowstandard

Llama Main

Open-weight benchmark profile with strong cost control and mixed business safety.

79
unsupported_claimliteral_translationweak_cta

Mistral Main

European generalist profile with concise writing and reliable structured outputs.

81
too_verboseliteral_translationtone_deaf_retention