多语言支持

Claude 在多种语言的任务中表现出色，相对于英语保持了强大的跨语言性能。

概述

Claude 展示了强大的多语言能力，特别是在跨语言的零样本任务中表现尤为突出。模型在广泛使用的语言和资源较少的语言之间保持了一致的相对性能，使其成为多语言应用的可靠选择。

请注意，Claude 在许多未在下面进行基准测试的语言中也有能力。请考虑测试与您特定用例相关的任何语言。

以下是 Claude 模型在不同语言上的零样本思维链评估分数，以相对于英语性能（100%）的百分比显示：

语言	Claude Opus 4.1¹	Claude Opus 4（已弃用）¹	Claude Sonnet 4.5¹	Claude Sonnet 4（已弃用）¹	Claude Haiku 4.5¹
英语（基准，固定为 100%）	100%	100%	100%	100%	100%
西班牙语	98.1%	98.0%	98.2%	97.5%	96.4%
葡萄牙语（巴西）	97.8%	97.3%	97.8%	97.2%	96.1%
意大利语	97.7%	97.5%	97.9%	97.3%	96.0%
法语	97.9%	97.7%	97.5%	97.1%	95.7%
印尼语	97.3%	97.2%	97.3%	96.2%	94.2%
德语	97.7%	97.1%	97.0%	94.7%	94.3%
阿拉伯语	97.1%	96.9%	97.2%	96.1%	92.5%
中文（简体）	97.1%	96.7%	96.9%	95.9%	94.2%
韩语	96.6%	96.4%	96.7%	95.9%	93.3%
日语	96.9%	96.2%	96.8%	95.6%	93.5%
印地语	96.8%	96.7%	96.7%	95.8%	92.4%
孟加拉语	95.7%	95.2%	95.4%	94.4%	90.4%
斯瓦希里语	89.8%	89.5%	91.1%	87.1%	78.3%
约鲁巴语	80.3%	78.9%	79.7%	76.4%	52.7%

Note

这些指标基于 MMLU（大规模多任务语言理解）英语测试集，由专业人工翻译人员翻译成 14 种其他语言，如 OpenAI 的 simple-evals 仓库中所记录。在此评估中使用人工翻译确保了高质量的翻译，这对于数字资源较少的语言尤为重要。

处理多语言内容时：

提供清晰的语言上下文： 虽然 Claude 可以自动检测目标语言，但显式声明所需的输入/输出语言可以提高可靠性。为了增强流畅性，您可以提示 Claude 使用"像母语者一样的地道表达"。
使用原生文字： 以原生文字提交文本，而不是音译，以获得最佳结果
考虑文化背景： 有效的沟通通常需要超越纯翻译的文化和区域意识

另请遵循通用的提示工程指南以更好地提高 Claude 的性能。

掌握提示制作的艺术，充分发挥 Claude 的潜力。