什么是机器翻译?它如何加速市场进入?

什么是机器翻译? 这是一个好问题,因为这项技术自 1949 年就已经存在。 机器翻译,即通过计算机软件将文本从源语言自动翻译成另一种语言,与几十年前相比有很大不同,而且还在迅速发展。

如果您在想到机器翻译时仍想到 21 世纪初的 Babelfish,那么您可能会对当今技术的准确性、便捷性和快速性感到惊讶。 机器翻译现在可以快速可靠地帮助企业进军新的全球市场。

It’s no longer a question of whether you should use machine translation but of when and how. But first, let’s answer the question “What is machine translation?” and dispel some common myths about it.

什么是机器翻译?

Put simply, machine translation is a process where artificial intelligence (AI), machine learning, and algorithms automatically translate text or speech from one language to another—without a human linguist. During this process, the original text or language is called the source language, and the language you’re translating into is called the target language.

不同类型的机器翻译方法

机器翻译有多种不同的方法,每种方法的工作原理略有不同。

基于规则的机器翻译

通过基于规则的机器翻译 (RBMT),AI 系统使用语言规则和双语词典来翻译文本。 语言规则告诉人工智能如何将单词或短语从源语言翻译成目标语言以保留其含义。

RBMT 需要人工翻译创建和维护语法和语言规则,以及执行大量的人工编辑。 如今,由于需要人工参与且翻译质量较低,RBMT 并不十分普遍。

统计机器翻译

统计机器翻译 (SMT) 比 RBMT 需要更少的人工输入,它使用机器学习算法来完成翻译。 SMT 分析大量现有的人工翻译以识别模式。 然后,这些模式允许系统开发统计模型来预测如何翻译文本。

SMT 是对 RBMT 的改进,但仍然存在准确性问题。

基于句法的机器翻译

基于语法的机器翻译 (SBMT) 是 SMT 的一种,它依靠语法规则和句子结构来翻译文本。 通过分析例句及其对应的翻译或语言对,SBMT 可以将语法规则纳入其构建的统计翻译模型中。

这种方法使 SBMT 能够更准确地翻译复杂文本,但它需要大量的示例单词和短语进行训练。

神经机器翻译

神经机器翻译(NMT) 学习如何使用一种称为神经网络的机器学习方法来翻译语言。 神经网络的工作原理与人脑类似,通过多个相互连接的节点传递数据。 该系统允许 NMT 处理大型数据集,因为每个节点都负责解码源语言并编码目标语言。

由于 NMT 翻译整个句子而不是单个单词或短语,因此其翻译听起来更自然。 由于许多人认为它是最准确的机器翻译方法,包括 Smartling 在内的大多数语言翻译技术都依赖于 NMT。

混合机器翻译

混合机器翻译 (HMT) 使用两种或多种机器翻译方法来改善您从单一翻译解决方案中看到的结果。 通常,HMT 结合了 RBMT 和 SMT 模型,但也可以使用 NMT 模型。

例如,HMT 可能使用 SMT 来识别和翻译模式,使用 RBMT 来翻译某些语言细微差别,并使用 NMT 来创建更准确、更自然的翻译。

什么是计算机辅助翻译工具?

计算机辅助翻译 (CAT) 工具与机器翻译工具一起使用,可自动执行编辑和管理翻译等任务。 为此,用户将文本输入CAT 工具,然后该工具将文本分成段落、句子或短语段。 然后,该工具将这些片段保存在机器翻译软件可以访问的数据库中。

由于 CAT 软件加快了翻译过程,许多企业使用这些工具来自动化他们的翻译和本地化项目。

机器翻译的 3 个主要优点

Smartling 翻译英雄形象
Smartling Translate 可让您在几秒钟内快速创建品牌定制的翻译。 (来源: Smartling

本地化用户体验比以往任何时候都重要——CSA 研究发现, 76% 的消费者更喜欢用自己的语言购物。 值得庆幸的是,机器翻译具有多种优势,使其成为试图进入新市场的企业的理想选择:

  1. 提高速度:机器翻译软件(如 Smartling 的 NMT Hub 或Smartling Translate )通过自动执行翻译过程中涉及的手动任务来提高效率。 机器翻译每天最多可翻译 7,000 个单词,而人工翻译平均每天可翻译 2,000 至 3,000 个单词。
  2. Lower costs: While translation rates typically land between $0.15 and $0.30 per word for a human translator, machine language translation costs much less—around $0.0012 to $0.0050 per word.
  3. 便利性:现在有许多机器翻译服务,包括 DeepL、Google Translate、Amazon Translate 和 Smartling。 这些服务使得使用机器翻译进行个人项目,甚至多语言业务本地化项目变得更加方便。

机器翻译的优势在于可以帮助企业利用本地化内容更快地进入新市场。

机器翻译的历史

Machine translation’s history started in 1949 when it appeared in Warren Weaver’s Memorandum on Translation. Not long after, World War II prompted a need for faster military document translation, so researchers like Yehoshua Bar-Hillel began experimenting with machine translation in 1951.

然而,将机器翻译付诸实践却很困难。 第一个模型,如乔治城 IBM 实验,依赖于一套语言规则。 除了对专业翻译人员和规则的依赖之外,20 世纪 50 年代的机器翻译系统需要的数据处理能力和存储空间超出了当前技术所能提供的范围。

20 世纪 60 和 70 年代,机器翻译继续发展,出现了 SYSTRAN 和 METEO。 然而,由于这些系统仍然使用基于规则的翻译,研究人员继续努力开发一种可以与人类翻译竞争的工具。

20 世纪 90 年代,由于大量语言训练数据集的出现,SMT 开始兴起。 SBMT 系统也越来越受欢迎,这两种新的机器翻译方法都提高了翻译的准确性和质量。

20 世纪 90 年代末到 21 世纪初,随着互联网的出现,Babelfish 和 Google Translate 等软件让更多人可以使用机器翻译。 2016 年,谷歌推出了 NMT ,微软和亚马逊紧随其后。 现代机器翻译的质量现在甚至更接近人工翻译。

"[Neural machine translation] is gradually eliminating the demarcation between human and machine translation,” says Jack Welde, founder and CEO of Smartling. “It is creating more opportunities for a productive closed loop between machine and human, including machine-enabled tools that make the human more productive and human inputs that make the machine more accurate going forward.”

你可知道? 机器翻译背后的理论创造了自然语言处理领域。

3 个关于机器翻译的误解

尽管机器翻译已存在半个多世纪,但误解仍然普遍存在。 让我们澄清一些常见的机器翻译误区。

误解一:机器翻译将取代人工翻译

事实:在这个过程中,总是需要人工翻译来增加机器翻译无法达到的文化相关性和细微差别。

当然,在某些情况下,机器翻译可能会减轻人工翻译的部分工作。 但是,网页、移动应用程序甚至企业营销资料等更高可见性、更详细和更复杂的内容需要人工后期编辑以确保准确性和相关性。 此外,如果您的目标语言不太常见,机器翻译可能会因缺乏该语言的训练数据而产生不准确的翻译。

机器翻译可能也难以翻译行业特定内容——特别是在没有专门的数据集和模型的情况下。 这就是具有专业或学术经验的人类语言学家大放异彩的地方。 他们可以编辑机器翻译结果,以确保翻译的文本清晰准确。

或者,您可以寻找像 Smartling 这样的机器翻译服务,它可以让您使用词汇表和翻译记忆库来训练自定义机器翻译引擎,以减少错误并维护品牌标准。

误解二:所有机器翻译软件的翻译质量都一样

事实:质量取决于机器翻译引擎和所涉及的语言。

您可能会惊讶地发现,机器翻译技术的准确性不仅取决于您使用的引擎,还取决于您的目标语言。

For example, PCMag tested the accuracy of different machine translation engines when translating multiple languages and found that ChatGPT was the most accurate for translating Polish, but Google Translate was the best for translating Tagalog. The answer to which machine translation engine is best still continues to change as updates roll out and engines train on new data sets. 更新的 MT 图表Smartling’s NMT Hub selects from multiple engines to improve translation quality. (Source: Smartling)

Smartling 的NMT Hub可确保您始终获得最准确的翻译,方法是自动将您的内容路由到根据您的项目提供最佳结果的机器翻译引擎。 NMT Hub 在 Amazon Translate、Watson Language Translator、GPT 和 PROMT 等模型之间进行选择,从而将翻译质量提高 350%。

误解三:机器翻译过程不需要任何人工干预

事实:上下文验证需要事后编辑。

即使是 NMT 在涉及上下文时也是有误差的,因此需要人工编辑来确保刚翻译的内容中仍然保留预期的含义。

除此之外,机器翻译的工作方式可能会产生有偏差的结果。 这在很大程度上是由于性别和文化偏见,以及训练数据中的其他偏见。 例如,由于数据中男性形象和语音的大量存在,机器翻译系统倾向于将性别词语翻译成相应的男性版本。

对于口语翻译来说,这是一个更大的问题。 《斯坦福社会创新评论》指出,谷歌的语音识别软件识别男性声音的准确率比识别女性声音的准确率高出 13% 。 如果声音属于有色人种女性或带有口音的用户,准确度的差异会进一步扩大。

人工输入对于减少和消除偏见是必要的,而机器翻译技术则需要尽可能地访问多样化、无偏见的数据集。

找到正确的翻译组合

机器翻译质量还达不到专业翻译的水平。 对于某些类型的内容尤其如此,例如必须具有准确性的法律合同或需要创造力在少量空间内传达信息的广告。

Here’s when to use machine translation versus human translation—as well as when you should use both.

机器翻译

随着 NMT 等技术的最新进展,机器翻译现已成为以下项目的理想选择:

  • 支持票和消息
  • 用户评论
  • 内容丰富的用户手册
  • 内部文件
  • 知识库和帮助指南
  • 网站页脚

人工翻译

在翻译以下类型的内容时,您需要一双人眼:

  • 网站主页和登录页面
  • 博客文章
  • 新闻稿
  • 广告
  • 电子邮件营销活动

Speed up global expansion: Read our guide to learn how to translate your website or mobile app with a translation management system.

人工智能与人工翻译

正在处理技术文档或内容? 值得使用机器翻译软件来创建初始翻译,然后让人工翻译人员检查以下内容的结果是:

  • 商业合同*
  • 专利
  • 条款和条件
  • 营销材料*
  • SEO内容
  • 产品标题和描述

使用 Smartling 强大的机器翻译来提供有影响力的体验

自 1949 年诞生以来,机器翻译已经取得了长足的进步。 企业现在可以依靠 Smartling Translate 和 NMT Hub 等工具在更短的时间内以人工翻译成本的一小部分提供高质量的本地化内容。

对于需要更多细节和行业专业知识的项目,Smartling 还提供人工智能人工翻译。 这种方法可让您同时获得两全其美的效果——快速获得机器翻译结果,然后进行人工审核,以获得最佳准确性和相关性。

使用 Smartling 的NMT Hub在几分钟内翻译数十亿个单词,或者观看我们五分钟的演示,了解我们的翻译服务可以为您做些什么。

立即体验更智能的翻译

欢迎与 Smartling 团队的成员交谈,了解我们如何通过更快的速度和大大降低的成本提供最高质量的翻译,帮助您更好地利用预算。
Cta-Card-Side-Image