IM (中国电竞) 官方网站

人工智能翻译mRASP:可翻译32种语言
栏目:最新动态 发布时间:2024-04-30
 IM电竞网站IM电竞网站时代下海量信息的捕获无疑具有重要作用,事实上,人们对于机器翻译的需求也与日俱增。除了专业的出版水平的翻译,机器翻译还包括以了解信息或

  IM电竞网站IM电竞网站时代下海量信息的捕获无疑具有重要作用,事实上,人们对于机器翻译的需求也与日俱增。除了专业的出版水平的翻译,机器翻译还包括以了解信息或以交流信息为目的的机器翻译。

  多语言翻译是机器翻译需要面临的一大技术现实。其中,一个理想的模型是一个统一的具备多种语言能力的模型,在遇到新的语言时,临时少量学习即可达到很流利的语言水平。

  EMNLP 2020最新的多语言翻译新范式 multilingual Random AlignedSubstitution Pre-training (mRASP)就成功实现了这一理想模型:mRASP通过预训练技术再在具体语种上微调即可达到领先的翻译效果,其在 32 个语种上预训练出的统一模型在 47 个翻译测试集上取得了全面显著地提升。

  不同于以往的翻译模式,mRASP树立了翻译的预训练和微调的成功路径。mRASP中的关键思想就是一种新的随机对齐子串技术,它使具有相似意义的单词和短语更接近多种语言的表现空间。研究人员预先训练了32种语言,对联合的mrap模型建立公共数据集。模型就是这样对下游语言对进行微调以获得专门的机器翻译模型。

人工智能翻译mRASP:可翻译32种语言(图1)

  研究人员在不同环境下对42个翻译方向进行了广泛的实验,包括跨文化的异国语言等。实验结果表明,与传统的mRASP相比,mRASP对训练目标具有显著的性能改进。这也是其第一次验证多个低资源语言对可以用来证明丰富的资源机器翻译,甚至可以提高关于训练前语料库中从未出现过的外来语的翻译质量。

  一是打破了资源场景的限制,不论平行双语资源高低都能有所提升。在资源丰富的语言,比如标准英法翻译任务上已经有 4000 万平行语句训练情况下,使用 mRASP 依然能获得显著提升,达到了 44.3 的 BLEU 值。

  二是打破了语种数量的限制。任何语言的翻译,无论是孟加拉语到古吉拉特语还是印地语到菲利宾语,只要是地球上的语言,mRASP 都可以直接拿来微调,并且效果可期。

  三是资源消耗低。相比于上百张卡的“军备竞赛”预训练玩法,mRASP 更平民,仅需要 8 卡训练一周就可以得到。

  随着计算机运算能力的提升和多语言信息资源的爆发式增长,机器翻译技术日益精进,未来还将为普通用户提供更加实时便捷的翻译服务。

  成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式

  的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在

  处理(Natural Language Processing,NLP)是

  了。然而,在涉及到一些重要的领域,例如法律、药学甚至是文学等相关领域,机器

  在科学研究、数据分析、机器学习等领域具有着广泛的应用。另一类是面向普通用户的AI

  (Artificial Intelligence, AI)是指基于计算机的理论和技术,采用模拟

  的能力。它是计算机科学中最吸引人的研究领域之一,目前已经引发了广泛的讨论。这也引发了有关

  推荐等。 AI的发展历程可追溯到二十世纪中叶,但直至近年来人们才开始真正关注和重视这一领域。当今,

  研究进展 /

  大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一

  威胁;谷歌前CEO施密特认为AI和机器学习对人类有很大益处。 每个国家对核武器的运用有两面性,

  鸿蒙开发接口Ability框架:【@ohos.application.Ability (Ability)】

  Dependency Combobulator检测和防止依赖混淆的开源框架

  HUAWEI Computer Graphics Kit华为图形计算服务

  飞凌嵌入式ElfBoard ELF 1板卡-在ELF 1开发环境中使用QT Creator进行远程调试