多语言支持

Claude 在多种语言的任务中表现出色,相对于英语保持了强大的跨语言性能。


概述

Claude 展示了强大的多语言能力,特别是在跨语言的零样本任务中表现尤为突出。模型在广泛使用的语言和资源较少的语言之间保持了一致的相对性能,使其成为多语言应用的可靠选择。

请注意,Claude 在许多未在下面进行基准测试的语言中也有能力。请考虑测试与您特定用例相关的任何语言。

性能数据

以下是 Claude 模型在不同语言上的零样本思维链评估分数,以相对于英语性能(100%)的百分比显示:

语言Claude Opus 4.11Claude Opus 4(已弃用)1Claude Sonnet 4.51Claude Sonnet 4(已弃用)1Claude Haiku 4.51
英语(基准,固定为 100%)100%100%100%100%100%
西班牙语98.1%98.0%98.2%97.5%96.4%
葡萄牙语(巴西)97.8%97.3%97.8%97.2%96.1%
意大利语97.7%97.5%97.9%97.3%96.0%
法语97.9%97.7%97.5%97.1%95.7%
印尼语97.3%97.2%97.3%96.2%94.2%
德语97.7%97.1%97.0%94.7%94.3%
阿拉伯语97.1%96.9%97.2%96.1%92.5%
中文(简体)97.1%96.7%96.9%95.9%94.2%
韩语96.6%96.4%96.7%95.9%93.3%
日语96.9%96.2%96.8%95.6%93.5%
印地语96.8%96.7%96.7%95.8%92.4%
孟加拉语95.7%95.2%95.4%94.4%90.4%
斯瓦希里语89.8%89.5%91.1%87.1%78.3%
约鲁巴语80.3%78.9%79.7%76.4%52.7%

1 使用扩展思考

Note

这些指标基于 MMLU(大规模多任务语言理解)英语测试集,由专业人工翻译人员翻译成 14 种其他语言,如 OpenAI 的 simple-evals 仓库中所记录。在此评估中使用人工翻译确保了高质量的翻译,这对于数字资源较少的语言尤为重要。


最佳实践

处理多语言内容时:

  1. 提供清晰的语言上下文: 虽然 Claude 可以自动检测目标语言,但显式声明所需的输入/输出语言可以提高可靠性。为了增强流畅性,您可以提示 Claude 使用"像母语者一样的地道表达"。
  2. 使用原生文字: 以原生文字提交文本,而不是音译,以获得最佳结果
  3. 考虑文化背景: 有效的沟通通常需要超越纯翻译的文化和区域意识

另请遵循通用的提示工程指南以更好地提高 Claude 的性能。


语言支持注意事项

  • Claude 处理大多数使用标准 Unicode 字符的世界语言的输入并生成输出
  • 性能因语言而异,在广泛使用的语言中能力特别强
  • 即使在数字资源较少的语言中,Claude 也保持了有意义的能力