(1.延安大学西安创新学院,陕西 西安 710100;2.延安大学,陕西 延安 716000)
摘要:在语言翻译方面,人工翻译的速度比较慢,越来越不能适应当前社会发展的快速需求。因此,需要有新技术代替人工翻译,以开发AI为基础,实现快速、准确、高效的机器翻译。针对传统机器自动翻译系统在翻译过程中准确率较低的问题,为了提高机器自动翻译的速度和准确性,该文提出基于设计的机器自动翻译系统设计。通过客户端结构设计和人工智能处理器设计,完成系统的硬件设计;依托句子相似度的计算和消除句子歧义,完成系统的软件设计,从而实现机器自动翻译系统的设计。测试结果表明,基于人工智能技术的机器自动翻译系统,相比于基于文本库的机器自动翻译系统,在句子翻译速度和准确率方面都有所提高。
如今即使手工翻译可以完整地将原文表达出来,但是随着文献资源的增多,人工翻译的速度变得越来越慢。机器自动翻译是加快文本翻译的重要手段,机器自动翻译分为基于文本库和基于翻译规则,基于文本库的机器自动翻译需要大量的文本资源来构建文本信息资源库,而且文本资源在组成资源库时经常出现文本数据密集和稀疏的问题,在翻译少见词汇时缺乏精准度[1];基于翻译规则的机器自动翻译可以将文本内容清楚地描述出来,但是规则库的构建存在一定难度,翻译时很难达到较好的翻译成果[2]。基于上述两种翻译系统存在的问题,本文将人工智能技术应用到机器自动翻译系统设计中。机器自动翻译的主要目的就是消除歧义语句,针对一个词语,在不用的语境下会被翻译成不同的意思,因此在人工智能技术的基础上,让机器在不同的语境条件下,自动找到该词语的真正对应的意思是机器翻译亟需解决的关键问题。机器自动翻译系统的文本翻译质量虽然还没有达到人工翻译的程度,但是如今已经在社会上的各个邻域都得到了广泛的应用[3]。机器自动翻译系统作为人工翻译的补充和修正,在一定条件下可以提高翻译人员的工作效率,并提高了翻译的准确度,早已经成为翻译人员的得力助手。现如今,各个民族和国家之间的文化交流比较频繁,语言上的不通已经成为阻碍民族与民族之间、国家与国家之间沟通的障碍[4],为了促进文化知识的沟通和交流,在人工智能技术的基础上,设计机器自动翻译系统对国家和民族的发展有着积极作用。
客户端结构设计可以让用户通过上传图片来获取翻译内容,省去了用户打字的时间,提高了翻译的速度和准确率。用户可以选择通过手机拍照软件,来捕获需要翻译的文字内容,以图片的形式将翻译内容上传到云端服务器[5];还可以直接从本机图库中选择提前拍摄好的文字图片,再将图片上传到云端服务器,并在翻译系统的设置选项中,完成摄像头的对焦和闪光设置,在用户需求的情况下,还要设置需要识别的语言。然后将选择好的图片利用HTTP协议上传到系统云端服务器,并由部署在云端服务器上的OCR软件,将图片识别成可以进行编辑的文本内容[6]。通过调用Google翻译来执行翻译工作,最终将识别出来的源语言文本内容翻译出目标语言文本内容,并将目标语言文本内容返回给客户端。用户可以对客户端接收的源语言文本内容以及目标语言文本内容进行相应的编辑操作,或者对文本内容中感兴趣的部分在互联网上搜索[7]。客户端工作流程示意图如图1所示。

结合客户端的需求分析和工作流程,可以将客户端的功能分为图片保存、拍照、图片编辑、在线搜索、设置语言类型、翻译文本保存等。客户端的功能结构见图2。

以缩短用户获取目标翻译本文的时间、提高翻译准确性为目的,对采集到的文本内容进行简单处理,并向服务器发送翻译请求,将采集到的图片信息传输给服务器,完成客户端的结构设计。
在服务端的所有组件中,人工智能处理属于计算密集型的处理器,也是整个系统应用性能的瓶颈。因此,需要多台人工智能处理器并行处理用户的服务请求,人工智能处理器的数量是根据用户请求的数量确定的,处理器数量越多,翻译的速度就越快。人工智能技术作用于包含待识别文本信息的数字图像,预处理数字图像后,利用文本信息的定位、分割和提取算法,将待识别的文本信息提取出来[8],通过模式识别算法完成提取文本信息形态特征的分析,最后得到目标文本信息的标准编码,将结果输出[9]。人工智能处理流程如图 3所示。

人工智能处理器的功能实现是基于Tesseract⁃OCR2.3,它是一个在实验室内开发的人工智能引擎,谷歌对Tesseract⁃OCR2.3进行了优化,使得它已经成为人工智能领域中精度最高的开源引擎,可以支持中文,使用命令行方式调用[10]。人工智能处理器的结构如图4所示。

基于用户需求分析,设计客户端的工作流程,结合客户端的需求分析,完成客户端的结构设计;利用人工智能技术确定人工智能处理流程,通过人工智能处理的实现,完成人工智能处理器的结构设计,从而实现系统的硬件设计。
句子相似度算法先根据词性特性对相似的句子进行粗选,然后进一步精细选择,再计算句子的相似度。该方法虽然考虑句子中每一个词的词频特征,也对词语赋予了不同的权值,但是缺乏词语黏着性,造成长句子或者词频低的句子相似度的计算偏差大[11],反而降低了系统的翻译速度。计算句子相似度时先利用倒排索引文件获取句子的编号,利用编号得到将要计算的句子内容[12]。相似度计算流程如图5所示。

根据句子相似度计算流程,将已经选择好的n个句子相似度计算结果上传到相似句子组合模块中[13],句子相似度计算公式为:

式中:Words(A)表示输入句子A的单词集合;Wordsi(A)表示单词集合中的第i个元素;Len ( )表示字符串长度;SimWord(A,B)表示词形相似度。词形相似度计算可以提高句子翻译的质量。
句子歧义的消除可以提高机器自动翻译的准确性,实现机器自动翻译。一方面是由词性引起的歧义,同一个单词可能会具有不同的词性,也使得翻译出来的意思不同[14];另一方面是由于同一个单词在不同的语境中,翻译出来的意思也是不同的。针对消除由词性引起的句子歧义,先分清单词的词性,本文利用上文计算的相似度对单词进行词性标注,根据标注后的词性确定该单词在句子中的实际含义,消除了歧义,完成整句翻译[15]。针对语境不同引起的句子歧义,需要利用本体来消除歧义,首先遍历所要翻译的句子,将每一个单词在领域词典中查找,如果可以在词典中查找到,就可以认为该词在特殊词义领域内,可以赋予其特定的含义,这样就完成了歧义消除,实现机器自动翻译。综上所述,依托客户端的结构设计和人工智能处理器设计,完成了系统的硬件设计;基于句子相似度的计算和歧义的消除,完成了系统的软件设计,从而实现了机器自动翻译系统的设计。
3仿线 测试方法及步骤分析为了验证基于人工智能技术的机器自动翻译系统的有效性,本文对常见的英文句型进行了测试。系统在测试时从句子资源库中随机抽取了50个句子进行翻译测试。测试的步骤如下:1)选择待翻译句子,如:Foxen is a famous winery.
3)消除歧义。在本体词典中,Foxen 和 winery 都会出现,而单词 Foxen是单词 winery的一个个体,因此完全可以认为两个单词都存在于词语资源库中。


6)选择句子翻译模板。通过分析句子语法树得出,待翻译句子是由“名词+动词+名词”组成,而在动词方面选择的是系动词,构成了“主系表”结构,语序与英文一致,因此可以直接翻译。

从实验结果中可以得出,相同时间内,基于文本库的机器自动翻译系统在翻译句子时,只能翻译出两个英语单词,且在翻译准确率方面,也会出现翻译不完全的现象;而基于人工智能技术的机器自动翻译系统在翻译句子时,可以将整个句子完整地翻译出来,不会丢下任何一个简单或复杂的单词,且在翻译准确率方面,可以将整个句子准确地翻译出来。因此可以得出基于人工智能技术的机器自动翻译系统,相比于基于文本库的机器自动翻译系统具有较快的翻译速度和较高的准确度。

本文提出基于人工智能技术的机器自动翻译系统设计。依托机器自动翻译系统的硬件设计和软件设计,实现了本文的研究。结果表明,基于人工智能技术的机器自动翻译系统,相比于基于文本库的机器自动翻译系统在句子翻译速度和准确率方面都有所提高。希望本文的研究可以为基于人工智能技术的机器自动翻译系统设计提供理论依据。
[2] 邢蕾 .英汉机器翻译中译文自动生成系统设计[J].现代电子技术,2018,41(24):86⁃89.
[4] 郑锦龙,林国铭,孙永 . 穿戴式手语识别翻译系统[J]. 通讯世界,2017(7):238⁃239.
[10] 徐英卓,贾欢 .基于树结构的本体概念相似度计算方法[J].计算机系统应用,2017,26(3):275⁃279.
[14] 熊明明,刘艳超,郭剑毅,等 . 基于最大熵模型的越南语交叉歧义消解[J].中文信息学报,2017,31(4):63⁃69.

投入到了更高层次的智慧创造之中,减少了人力在工作中的投入,提高了工作效率,提高了成品率。近两年,
呈现日新月异的变化,我们的生活也随之发生巨大改变。2018年,博鳌论坛上出现的
医生”能做什么呢? ——缓解医疗人力资源紧张。在上海市第九人民医院放射科,每天仅肺部检查就达150件次。该医院引入肺癌影像
逐渐成为科技领域最热门的概念,被科技界,企业界和媒体广泛关注。作为一个学术领域,
是在1956年夏季,以麦卡赛、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家在一起聚会,共同研究和探讨用
带来了新的机会和紧迫性,预计在2021年将会有更大的发展。疫情显然已经成为一种催化剂,从产品创新到消费者偏好
和深度学习,成为这一革命的一个组成部分。IM电竞网站一旦你完成了它的来龙去脉,成功就在眼前拥抱你!
(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的
的方式保存起来,当需要的时候在一定的授权下能够很快的调回使用,同时增加一些辅助诊断管理功能。如今,随着
芯片也向来备受关注。近几年,谷歌、苹果、微软、Facebook、英特尔、高通、英伟达、AMD、IM电竞网站阿里巴...
,而是使用人类推理作为提供更好服务或创造更好产品的指南。但是这有什么作用呢?我们来看看目前的方法。ML:解析,学习,确定或预测的算法作为
。在十年左右的时间里,当计算能力和算法开发达到可以显着影响结果的地步时,我们将见证第一个真正的
的应用,或许能帮助蓝色星球的科学家们摆脱无穷无尽实验的痛苦,加速重大科学理论的发现,将人类文明提升到新的台阶。——题记
如今已经走进不少工厂和流水线,其帮助不少企业提升了产品制造效率,而使用
来为产品质量把关也成为一个必然趋势。近日,日本IT大厂 NEC 推出了一个“视觉检测(AI Visual
的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在。 对于销售型
在少数的企业身上,强者恒强、弱者淘汰的局面已经形成。此外,截然不同的是,上至***机构下至平民百姓,对当下的
项目不再盲目追捧,而是提出异议和担忧。9月20日,知乎用户质疑科大讯飞
应用的现状和发展态势讲起,对深度学习与软件框架等相关基础知识进行了介绍。第2章从总体上介绍移动终端AI
与应用开发》有一段时间了,由于时间有限,加上工作原因,目前只看到第3章,前几章主要介绍
学习算法的时代。由于应用环境的差别衍生出不同的学习算法:线性回归,分类与回归树
```▌活动背景随着包括谷歌、脸书、微软、亚马逊以及百度在内的巨头相继入局,
产业发展的标准体系进而提出近期急需研制的基础和关键标准项目。目录:下载链接:`
在很多特定问题(如围棋、《星际争霸》游戏、医疗诊断等)的解决上甚至超过了人类的水平。这也引起了
进展及产品演示。参加此次活动,您将了解 MathWorks 产品的最新
化(EDA)领域是近年来的热门话题。本次直播将从数据、算法、应用场景等方面讨论
养老建设,为企业和群众提供优质、高效、便捷的公共服务。5.提升信息安全管理能力。推动
领域,也是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,数学、心理学,甚至哲学。
垂直领域得到广泛应用。根据2020年的一项估计,37% 的组织已经在使用这种或那种形式的
产品的需求。而对于从中小企业到预算受限的大型企业来说,通过云计算来采用
制造的龙头企业(东莞市瑞风至有限公司),公司从2004年成立,2010年接触
,所以从长期来看,这些电影里面80%的内容,是会成为现实的;但是短期来说,不管是
,通过对大量数据的分析,来识别和评估各个业务环节的表现,从而对效能进行评估和监测。此外,我们还可
持续获得突破性进展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等以应用为导向的新特征。加强新一代
随着Google、Microsoft和Facebook等巨头的大力投入,深度学习正在超越
的工作效率不但相比人类医生有了急速的提升,更是在病理诊断中表现的尤为突出。通过
已步入全方位商业化阶段, 并对传统行业各参与方产生不同程度的影响, 改变了各行业的生态。这种变革主要体现在三个层次。第一层是企业变革:
,因为它只能做一件特定的事情。狭义AI是构建AGI的第一步吗?许多对AGI感到困惑的人认为目前研发人员应该正在用同样的
信息获取(简称爬虫) 与数据分析1、发起请求3、解析内容4、保存数据二、Requests库介绍2.1基本介绍
学习,并通过这些学习提高预测准确性。它可以在许多领域应用,如大规模数据分析、自然语言处理、图
应用已经逐渐渗透到我们的生活中,大大方便了人们的生活和工作。从互联网搜索引擎到
应用专业的学习,我们应该学些什么呢? 首先,我们需要学习AI算法。AI算法是我们实现