什么是机器翻译?它如何加速市场进入?
什么是机器翻译? 这是一个好问题,因为这项技术自 1949 年就已经存在。 机器翻译,即通过计算机软件将文本从源语言自动翻译成另一种语言,与几十年前相比有很大不同,而且还在迅速发展。
如果您在想到机器翻译时仍想到 21 世纪初的 Babelfish,那么您可能会对当今技术的准确性、便捷性和快速性感到惊讶。 机器翻译现在可以快速可靠地帮助企业进军新的全球市场。
这不再是一个是否应该使用机器翻译的问题,而是一个何时、如何使用的问题。 但首先,让我们回答“什么是机器翻译?”这个问题。 并消除一些关于它的常见误解。
什么是机器翻译?
简而言之,机器翻译是人工智能 (AI)、机器学习和算法自动将文本或语音从一种语言翻译成另一种语言的过程——无需人工语言学家的参与。 在此过程中,原始文本或语言称为源语言,而要翻译成的语言称为目标语言。
不同类型的机器翻译方法
机器翻译有多种不同的方法,每种方法的工作原理略有不同。
基于规则的机器翻译
通过基于规则的机器翻译 (RBMT),AI 系统使用语言规则和双语词典来翻译文本。 语言规则告诉人工智能如何将单词或短语从源语言翻译成目标语言以保留其含义。
RBMT 需要人工翻译创建和维护语法和语言规则,以及执行大量的人工编辑。 如今,由于需要人工参与且翻译质量较低,RBMT 并不十分普遍。
统计机器翻译
统计机器翻译 (SMT) 比 RBMT 需要更少的人工输入,它使用机器学习算法来完成翻译。 SMT 分析大量现有的人工翻译以识别模式。 然后,这些模式允许系统开发统计模型来预测如何翻译文本。
SMT 是对 RBMT 的改进,但仍然存在准确性问题。
基于句法的机器翻译
基于语法的机器翻译 (SBMT) 是 SMT 的一种,它依靠语法规则和句子结构来翻译文本。 通过分析例句及其对应的翻译或语言对,SBMT 可以将语法规则纳入其构建的统计翻译模型中。
这种方法使 SBMT 能够更准确地翻译复杂文本,但它需要大量的示例单词和短语进行训练。
神经机器翻译
神经机器翻译(NMT) 学习如何使用一种称为神经网络的机器学习方法来翻译语言。 神经网络的工作原理与人脑类似,通过多个相互连接的节点传递数据。 该系统允许 NMT 处理大型数据集,因为每个节点都负责解码源语言并编码目标语言。
由于 NMT 翻译整个句子而不是单个单词或短语,因此其翻译听起来更自然。 由于许多人认为它是最准确的机器翻译方法,包括 Smartling 在内的大多数语言翻译技术都依赖于 NMT。
混合机器翻译
混合机器翻译 (HMT) 使用两种或多种机器翻译方法来改善您从单一翻译解决方案中看到的结果。 通常,HMT 结合了 RBMT 和 SMT 模型,但也可以使用 NMT 模型。
例如,HMT 可能使用 SMT 来识别和翻译模式,使用 RBMT 来翻译某些语言细微差别,并使用 NMT 来创建更准确、更自然的翻译。
什么是计算机辅助翻译工具?
计算机辅助翻译 (CAT) 工具与机器翻译工具一起使用,可自动执行编辑和管理翻译等任务。 为此,用户将文本输入CAT 工具,然后该工具将文本分成段落、句子或短语段。 然后,该工具将这些片段保存在机器翻译软件可以访问的数据库中。
由于 CAT 软件加快了翻译过程,许多企业使用这些工具来自动化他们的翻译和本地化项目。
机器翻译的 3 个主要优点
Smartling Translate 可让您在几秒钟内快速创建品牌定制的翻译。 (来源: Smartling
本地化用户体验比以往任何时候都重要——CSA 研究发现, 76% 的消费者更喜欢用自己的语言购物。 值得庆幸的是,机器翻译具有多种优势,使其成为试图进入新市场的企业的理想选择:
- 提高速度:机器翻译软件(如 Smartling 的 NMT Hub 或Smartling Translate )通过自动执行翻译过程中涉及的手动任务来提高效率。 机器翻译每天最多可翻译 7,000 个单词,而人工翻译平均每天可翻译 2,000 至 3,000 个单词。
- 成本更低:虽然人工翻译的翻译费用通常在每字 0.15 美元到 0.30 美元之间,但机器语言翻译的成本要低得多——约为每字 0.0012 美元到 0.0050 美元。
- 便利性:现在有许多机器翻译服务,包括 DeepL、Google Translate、Amazon Translate 和 Smartling。 这些服务使得使用机器翻译进行个人项目,甚至多语言业务本地化项目变得更加方便。
机器翻译的优势在于可以帮助企业利用本地化内容更快地进入新市场。
机器翻译的历史
机器翻译的历史始于1949年,当时它出现在沃伦·韦弗的《翻译备忘录》中。 不久之后,第二次世界大战引发了对更快的军事文件翻译的需求,因此像 Yehoshua Bar-Hillel 这样的研究人员于 1951 年开始尝试机器翻译。
然而,将机器翻译付诸实践却很困难。 第一个模型,如乔治城 IBM 实验,依赖于一套语言规则。 除了对专业翻译人员和规则的依赖之外,20 世纪 50 年代的机器翻译系统需要的数据处理能力和存储空间超出了当前技术所能提供的范围。
20 世纪 60 和 70 年代,机器翻译继续发展,出现了 SYSTRAN 和 METEO。 然而,由于这些系统仍然使用基于规则的翻译,研究人员继续努力开发一种可以与人类翻译竞争的工具。
20 世纪 90 年代,由于大量语言训练数据集的出现,SMT 开始兴起。 SBMT 系统也越来越受欢迎,这两种新的机器翻译方法都提高了翻译的准确性和质量。
20 世纪 90 年代末到 21 世纪初,随着互联网的出现,Babelfish 和 Google Translate 等软件让更多人可以使用机器翻译。 2016 年,谷歌推出了 NMT ,微软和亚马逊紧随其后。 现代机器翻译的质量现在甚至更接近人工翻译。
Smartling 创始人兼首席执行官杰克·韦尔德 (Jack Welde) 表示:“[神经机器翻译] 正在逐渐消除人类翻译和机器翻译之间的界限。” “它为机器和人类之间的生产闭环创造了更多机会,包括使人类更有效率的机器工具和使机器更准确的人类输入。”
你可知道? 机器翻译背后的理论创造了自然语言处理领域。
3 个关于机器翻译的误解
尽管机器翻译已存在半个多世纪,但误解仍然普遍存在。 让我们澄清一些常见的机器翻译误区。
误解一:机器翻译将取代人工翻译
事实:在这个过程中,总是需要人工翻译来增加机器翻译无法达到的文化相关性和细微差别。
当然,在某些情况下,机器翻译可能会减轻人工翻译的部分工作。 但是,网页、移动应用程序甚至企业营销资料等更高可见性、更详细和更复杂的内容需要人工后期编辑以确保准确性和相关性。 此外,如果您的目标语言不太常见,机器翻译可能会因缺乏该语言的训练数据而产生不准确的翻译。
机器翻译可能也难以翻译行业特定内容——特别是在没有专门的数据集和模型的情况下。 这就是具有专业或学术经验的人类语言学家大放异彩的地方。 他们可以编辑机器翻译结果,以确保翻译的文本清晰准确。
或者,您可以寻找像 Smartling 这样的机器翻译服务,它可以让您使用词汇表和翻译记忆库来训练自定义机器翻译引擎,以减少错误并维护品牌标准。
误解二:所有机器翻译软件的翻译质量都一样
事实:质量取决于机器翻译引擎和所涉及的语言。
您可能会惊讶地发现,机器翻译技术的准确性不仅取决于您使用的引擎,还取决于您的目标语言。
例如, PCMag 测试了不同机器翻译引擎在翻译多种语言时的准确性,发现 ChatGPT 对翻译波兰语最准确,但 Google Translate 对翻译他加禄语最好。 随着更新的推出和引擎在新的数据集上进行训练,哪个机器翻译引擎最好这一问题的答案仍在不断变化。 Smartling 的 NMT Hub 从多个引擎中进行选择,以提高翻译质量。(来源: Smartling )
Smartling 的NMT Hub可确保您始终获得最准确的翻译,方法是自动将您的内容路由到根据您的项目提供最佳结果的机器翻译引擎。 NMT Hub 在 Amazon Translate、Watson Language Translator、GPT 和 PROMT 等模型之间进行选择,从而将翻译质量提高 350%。
误解三:机器翻译过程不需要任何人工干预
事实:上下文验证需要事后编辑。
即使是 NMT 在涉及上下文时也是有误差的,因此需要人工编辑来确保刚翻译的内容中仍然保留预期的含义。
除此之外,机器翻译的工作方式可能会产生有偏差的结果。 这在很大程度上是由于性别和文化偏见,以及训练数据中的其他偏见。 例如,由于数据中男性形象和语音的大量存在,机器翻译系统倾向于将性别词语翻译成相应的男性版本。
对于口语翻译来说,这是一个更大的问题。 《斯坦福社会创新评论》指出,谷歌的语音识别软件识别男性声音的准确率比识别女性声音的准确率高出 13% 。 如果声音属于有色人种女性或带有口音的用户,准确度的差异会进一步扩大。
人工输入对于减少和消除偏见是必要的,而机器翻译技术则需要尽可能地访问多样化、无偏见的数据集。
找到正确的翻译组合
机器翻译质量还达不到专业翻译的水平。 对于某些类型的内容尤其如此,例如必须具有准确性的法律合同或需要创造力在少量空间内传达信息的广告。
以下是何时应该使用机器翻译与人工翻译,以及何时应该同时使用两者。
机器翻译
随着 NMT 等技术的最新进展,机器翻译现已成为以下项目的理想选择:
- 支持票和消息
- 用户评论
- 内容丰富的用户手册
- 内部文件
- 知识库和帮助指南
- 网站页脚
人工翻译
在翻译以下类型的内容时,您需要一双人眼:
- 网站主页和登录页面
- 博客文章
- 新闻稿
- 广告
- 电子邮件营销活动
加快全球扩张:阅读我们的指南,了解如何使用翻译管理系统翻译您的网站或移动应用程序。
人工智能与人工翻译
正在处理技术文档或内容? 值得使用机器翻译软件来创建初始翻译,然后让人工翻译人员检查以下内容的结果是:
- 商业合同*
- 专利
- 条款和条件
- 营销材料*
- SEO内容
- 产品标题和描述
使用 Smartling 强大的机器翻译来提供有影响力的体验
自 1949 年诞生以来,机器翻译已经取得了长足的进步。 企业现在可以依靠 Smartling Translate 和 NMT Hub 等工具在更短的时间内以人工翻译成本的一小部分提供高质量的本地化内容。
对于需要更多细节和行业专业知识的项目,Smartling 还提供人工智能人工翻译。 这种方法可让您同时获得两全其美的效果——快速获得机器翻译结果,然后进行人工审核,以获得最佳准确性和相关性。
使用 Smartling 的NMT Hub在几分钟内翻译数十亿个单词,或者观看我们五分钟的演示,了解我们的翻译服务可以为您做些什么。