机器翻译 (MT) 因被认为质量低下而备受诟病(有时其结果还很可笑)——但自 1949 年首次构思以来,这项技术已经取得了长足的进步,这一点令人感到惊讶。 最近,我们发现了 TAUS 关于 MT 历史的综合时间表,读起来非常精彩。 但如果你没有时间阅读 63 年来的机器翻译进展,这里有一个简要概述:
1949–65 年:机器翻译研究开始
“机器翻译”这一新领域出现在沃伦·韦弗 (Warren Weaver) 的《翻译备忘录》(1949 年) 中,该领域的第一位研究者 Yehosha Bar-Hillel 在麻省理工学院 (MIT) 开始了他的研究 (1951 年)。 乔治城大学机器翻译研究小组紧随其后 (1951 年),并于 1954 年公开演示了其系统。 MT 被吹捧为帮助美国监视俄罗斯的解决方案。 它也是计算机最早的非数值应用之一。 机器翻译研究项目在日本和俄罗斯兴起(1955 年),第一次机器翻译会议在伦敦举行(1956 年)。 随着美国机器翻译和计算语言学协会的成立(1962 年)和美国国家科学院成立委员会(ALPAC)研究机器翻译(1964 年),研究人员不断加入该领域。
1966–95 年:MT 开始工作
ALPAC 的报告指出机器翻译无法与人工翻译质量相媲美,并建议应停止对机器翻译研究的资助。 但研究仍在继续。 机器翻译也已投入使用:法国纺织学院将摘要翻译成法语、英语、德语和西班牙语(1970 年);杨百翰大学启动了一个通过自动翻译翻译摩门教文本的项目(1971 年);施乐公司使用 Systran 翻译技术手册(1978 年)。 各种机器翻译公司相继成立,其中包括 Trados(1984 年),它是第一家开发和销售翻译记忆技术的公司(1989 年)。 第一个针对俄语/英语/德语-乌克兰语的商业机器翻译系统在哈尔科夫国立大学 (1991) 开发。
1996–2012 年:MT 登陆网络
网络上的机器翻译始于 Systran,它提供免费的短文本翻译(1996 年),随后是 AltaVista Babelfish,它每天可处理 500,000 个请求(1997 年)。 弗朗茨·约瑟夫·奥赫(Franz-Josef Och,后来的 Google 翻译开发主管)赢得 DARPA 的快速机器翻译竞赛(2003 年)。 其间的更多创新包括 MOSES、开源统计机器翻译引擎(2007 年)、针对日本手机的文本/短信翻译服务(2008 年)以及内置英语、日语和中文语音到语音翻译功能的手机(2009 年)。 最近,谷歌宣布谷歌翻译一天内翻译的文本量大致相当于 100 万本书(2012 年)。
呼!内容太多了,我们还没有涵盖机器翻译历史的 90%! 所有关于机器翻译的负面言论似乎都忘记了它是一项令人难以置信的先进技术。 它的质量低于人工翻译,但这并不意味着它没有很好的实际用途——比如翻译 5 年前的旧新闻稿。
2013年至今
近年来,机器翻译技术取得了重大进展,谷歌对神经机器翻译的研究预示着该行业的前景乐观。 显然,机器翻译正在逐渐不再是翻译机构的高速、难以维持的质量选择,而是为翻译低可见度内容提供一种合理的替代方案。 在短短几年内,一大批机器翻译供应商应运而生,他们承诺以专业语言学家的成本的一小部分提供可接受的质量。 质量竞争优势的争夺已全面展开,机器翻译提供商开始采取差异化的方法来“提升”其系统能够产生的质量。 当今的提供商通常分为三类:
混合人机翻译解决方案(例如:Unbabel)领域自适应机器翻译(例如:Lilt、IBM)神经机器翻译(例如:Google、Microsoft、SDL、Yandex)在 Smartling,我们坚信机器翻译正在迅速成为有效全球化战略的重要组成部分。 尽管以低成本尽快制作内容仍然会对质量产生不利影响,但机器翻译为许多翻译机构提供了优势,使其能够实现翻译成果的最高目标,即成本、质量和上市时间的平衡。
要了解有关Smartling神经机器翻译中心的更多信息,请参阅此链接。