近两年来,生成式人工智能一直是人们关注的焦点。 现在,各行业和各职能部门的高管都在要求他们的团队找到方法来利用它来降低成本或提高效率。 但问题是,人工智能真的能胜任翻译工作吗?
在过去的 18 个月里,Smartling 一直致力于研发,寻找答案。 具体来说,我们想知道人工智能是否可以帮助我们提供世界上质量、成本、速度和体验最好的翻译解决方案。
答案是什么? 答案是肯定的!人工智能正在发挥作用,而且正在大规模发挥作用。 但并非每个申请都能成功。
目前人工智能在翻译领域发挥什么作用?
当大型语言模型 (LLM) 首次问世时,公司开始测试它们作为机器翻译的直接替代品。 然而,尽管这种用例具有潜力,但仍有一些问题需要解决才能确保一致的性能。
我们的研发团队评估了多语言的多个法学硕士和机器翻译以及质量指标(即 BLEU、MQM、TER 等)。 该实验表明,使用 LLM 进行所有语言的翻译,自动质量评估指标表明机器翻译引擎在翻译质量上仍然优于 LLM。 最重要的是,与使用法学硕士学位相比,机器翻译是一种更为经济实惠的翻译方法。
虽然法学硕士 (LLM) 还不是翻译的最佳选择,但我们的团队开始看到它们在机器翻译输出的自动后期编辑和评估方面大放异彩。 事实证明,人工智能非但不能取代机器翻译,反而是机器翻译的有力补充。
具体来说,以下内容被证明是人工智能的强大应用:
- 模糊匹配修复
- 术语插入
- 编辑工作量估算
- 礼节
- Gender de-biasing
有了这些知识,我们开始为客户开发和部署新的人工智能解决方案。 一切始于人工智能人工翻译,这是一种翻译解决方案,它将 Smartling 的专业语言学家和人工智能技术结合在一起,以一半的成本和两倍的速度提供高质量的翻译。
然后,客户开始询问我们是否可以将我们的 AI 功能与第三方语言服务提供商一起使用。 所以我们答应了。
人工智能翻译工具包简介
Smartling 的 AI 翻译工具包提供了一套 AI 翻译功能,旨在显著降低翻译成本并提高语言学家的表现,同时不牺牲质量。 我们正在将我们的 AI 技术提供给所有人,这些技术已经为我们的 AIHT 客户提供了令人难以置信的输出,其中包括:
- AI 模糊匹配修复:将翻译记忆库的利用率提高多达 35 个百分点,从而大幅节省成本并提高质量。
- AI 词汇表术语插入:将词汇表术语无缝嵌入到内容中,保证上下文和语法的准确性。
- 编辑工作量估算:根据预期工作量对翻译进行分组,以达到人为质量。 洞察力可用于我们的工作流自动化,将字符串分配给特定的语言学家或完全绕过人工审核。
让我们深入了解每一个功能以及支持它们的研究。
深入探究:AI 模糊匹配修复
如今,利用翻译记忆库已成为一种标准做法。 然而,AI Fuzzy Match Repair 通过使用 LLM 来修复和平滑通常不会用于节省的字符串,从而将传统方法更进一步。
例如,在下图中您可以看到源文本和翻译记忆库匹配仅相差一个单词。 使用常规翻译记忆库,通常必须将源文本完全重新翻译。 但是,通过模糊匹配修复,LLM 能够识别差异并提供修复后的翻译。 建议的翻译现在可以享受模糊匹配折扣,从而使客户能够更好地利用他们的 TM,并减少语言学家的工作量。
虽然只是概念而已,但这听起来是一个非常酷的功能 - 我们的研发团队希望确保它能够发挥作用。 更重要的是,他们希望确保它以成本、质量或速度改进的形式提供真正的价值。
为此,他们将相同的内容翻译了两次——一次启用了 AI 模糊匹配修复,一次关闭了该功能。 他们根据输出翻译和最终人工翻译的HTER对这两种情况进行了评估。 我们想看看模糊匹配修复后有多少字符串不需要人工干预。
研究发现,人工智能模糊匹配修复可将翻译记忆匹配率提高多达 35 个百分点,并且在不同语言中表现相当一致。 这意味着客户可以利用翻译记忆库来存储更多的内容,从而大幅节省成本并提高一致性。
深入探究:AI 术语表插入
翻译中的另一个标准做法是插入词汇表术语。 传统方法是简单地用词汇表中的相关术语来替换源文本和目标文本中的术语。 然而,当这些词汇表术语与整个句子的数字计数、词形变化或其他语法元素不一致时,这往往会引发新的流畅性问题。
通过 AI 词汇表术语插入,LLM 用于“平滑”词汇表术语的插入,确保上下文和语法的准确性。 例如,在下图中,您可以看到词汇表术语“publicación”的传统应用在整个字符串中引入了一个语法错误,其中相关形容词现在具有不正确的词形变化(primer 与 primera)。 在法学硕士的帮助下,插入适当的形容词形式并消除错误。
根据我们的研究,法学硕士 (LLM) 对形态正确的词汇表插入数量有巨大影响。 在对俄语和西班牙语内容进行测试时,AI 词汇表术语插入功能分别将正确插入的数量增加了 25% 和 17.5%。 这些内容不再需要人工去修复。
深入探究:编辑工作量估算
我们的编辑工作量估算技术根据预期工作量对翻译进行分组,以达到人工质量。 所有字符串均通过我们的专有提示发送到 LLM,LLM 将根据以下内容评估字符串:
- 语法正确性
- 流利度
- 语义连贯性
- 词汇准确性
- 质量检查
- 风格指南(每个客户独有)
这些分组(级别 1、级别 2 和级别 3)可用于动态工作流自动化,以根据预期工作量来处理字符串。 例如,公司可以将需要大量编辑的字符串分配给更有经验的语言学家,或者完全绕过几乎不需要编辑的字符串的人工审核。 客户还可以使用我们的编辑工作量估算折扣来为高绩效刺痛创建折扣等级。
这有可能为公司节省大量时间和成本,特别是那些大量使用人工翻译工作流程的公司。 它还让团队更深入地了解他们的翻译过程。
彻底改变您的翻译策略
我们已经看到人工智能正在努力扩大影响力、提高词汇表术语插入的准确性、应用形式等等。 然而,需要花费大量的时间和研究来确定人工智能能够发挥最大作用并带来丰厚投资回报的地方。 这时就需要像 Smartling 这样的合作伙伴的帮助,这样您就不必独自完成所有工作。
我们战略的一个关键组成部分是对研发的投资,以确保我们能够提供业内最全面的 LanguageAI ™解决方案。 我们在生成式人工智能方面的工作拥有多项专利,仅在过去一年中,我们的工程团队就在 3,300 个生产版本中提供了超过 70 个主要功能或增强功能。
这才是真正确保人工智能解决方案提供世界上最佳质量、成本、速度和体验所需要的。
详细了解我们的最新研究以及我们在全球就绪会议上下一步的探索内容:研究揭秘- 现在按需提供。