|
|
|
|
移动端

分音塔CTO张明:深耕旅游行业,运用AI技术解决跨语言沟通问题

近日,分音塔CTO张明接受了51CTO的专访,他1999年于新加坡创新科技就职时期,便开始接触机器翻译,所以在这方面有着很多深入独到的见解。

作者:王雪燕来源:51CTO|2018-03-22 08:51

开发者盛宴来袭!7月28日51CTO首届开发者大赛决赛带来技术创新分享

【51CTO.com原创稿件】二十世纪三十年代初,法国科学家G.B.阿尔楚尼提出用机器来进行翻译想法。时至今日,诸多里程碑事件印证了机器翻译的可行性和实用性,前景的广阔毋庸置疑。为了更好地利用机器翻译解决跨语言沟通的问题,谷歌、百度等国内外巨头相继成立相关团队,当然也小而美的初创公司深耕细分行业,集中精力主攻某一场景,如分音塔。

近日,分音塔CTO张明接受了51CTO的专访,他1999年于新加坡创新科技就职时期,便开始接触机器翻译,所以在这方面有着很多深入独到的见解。

张明·分音塔CTO

机器翻译三大阶段:规则、统计算法(SMT)、深度学习(NMT) 

张明表示,机器翻译也和众多技术发展的路线雷同,从技术角度来看,主要可以分为三大阶段:规则、统计算法、深度学习:

规则

第一阶段,是基于规则的方式。规则是由语言学家利用他们对知识、语言的理解进行定制,再由计算机领域专家来实现规则。

这样的方式弊端很明显,主要是因为规则不可穷举,那么就没办法保证覆盖到用户输入的所有内容。当用户输入的内容,与规则相匹配,翻译效果会非常好,反之亦然。

SMT

第二阶段,是基于统计算法的方式。随翻译领域数据的增长,开始对大量的语料资料用统计方法进行建模,逐渐摆脱对语言规则的依赖。

基于统计算法的方式实际上还是有语言学的原理在其中,整个翻译过程是如何实现的,人的认知可以进行理解和诠释。

NMT

第三阶段,是基于深度学习的方式。目前,深度学习是一个黑盒应用,虽然按照不同模型进行翻译,最终的翻译效果会提升很多,对于实现过程如何,以目前人的认知,还不能够进行诠释。

运用AI细分技术 站在用户的角度迭代产品

当问及为会选择在2016年成立分音塔,张明表示,随数据、NMT模型的发展,2015年前后,NMT超越SMT,整个翻译效果提升非常大。2016年基本上编程NMT统一天下,SMT被淘汰,谷歌神经机器翻译(GNMT)也在这期间问世。机器翻译的整体效果能够在某个场景领域下达到一个用户的基本期望值,相关产品有了落地的可能。

利用AI技术解决跨语言沟通问题

上文所说的机器翻译是纯翻译的设定,是文本到文本,中文到日文、中文到英文。但分音塔要做的事情是利用AI技术解决跨语言沟通问题,翻译只是沟通过程中的一环节。

张明介绍,第一代准儿翻译机的落地场景就是把某个人的语音翻译成对话者能听懂的语音。这看似简单的逻辑背后,涉及到语音识别、机器翻译、语音合成等AI细分技术,每个技术都需要具体不同系的技术点进行处理。

当问及这些AI细分技术目前哪个处于短板,张明说,无论是技术角度、还是用户的市场需求来说,永远没有够用的情况。就目前来看,还没有出现能够全部覆盖所有的领域的通用平台,这也是分音塔为什么只选择深耕旅游行业的原因。只有把这些AI细分技术运用到旅游行业具体场景进行优化,尽量解决语音识别口语化顺滑、吞音等问题,避免由于识别错误导致翻译错误逐级被放大、或信息丢失等问题,提高翻译机的整体理解率。

站在用户的角度迭代产品

采访过程中,张明重点强到分音塔不是一个纯技术的公司,而是做产品、服务的公司,如何能够给用户提供更好的服务、更好体验,才是公司的核心。

准儿翻译机最初没有设计屏幕,目的是小巧便携。之后为应对沟通缺失问题,增设了屏幕设计,但是在显示方面又略显不足。当前我们正在使用的这一代,是触摸式LED液晶屏,在沟通过程中起到很好的辅助作用。这几次产品的迭代,都源于用户的真实反馈。

紧接着,分音塔会在离线方面做更多探究,因为在旅游场景中,很多地方是WIFI,乃至未来的5G覆盖不到的。

根据实际需求 对后端服务器进行调整优化

当问及在服务用户过程中,是否对架构进行调整,张明坦言,在后端服务器部署方面初期确实没有考虑周全。

在旅游行业,用户使用翻译机一般不会牵扯到高并发的问题,因为出售的所有翻译机不可能同一时间被使用。所以在设计后端服务器时候并没有过多考虑,只是满足了当时在功能上的正常需求。

但在实际过程中,高并发问题虽然不会出现,但由于使用翻译机的用户会分布在不同国家,不同地区,传统宽带就表现的有些吃力。只能去寻找合适的节点进行部署,尽可能保证用户在不同国家的访问速度不会受到影响。

这里值得注意的是,在实际部署过程中,要结合重点客户分布、使用分布地的情况,以及中国人出现最多的几个国家,如日本、泰国、东南亚地区等。

采访最后,张明表示,分音塔未来依然深扎旅游行业,核心还是围绕吃住行,游娱购这六个方面。分音塔是一个初创公司,可能没有大公司的资源丰富,没有大公司的品牌影响力,但是有的是更多的专注,所有的团队全部集中在旅游领域,真正从用户需求、市场需求出发,致力为他们提供更好的产品与服务。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

【责任编辑:wangxueyan TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

入侵的艺术

黑客也有优劣之分。很显然对他们的奖励之一是利用黑客手段非法入侵我们公司的安全站点或个人系统。另一种奖励可能是他们的黑客行为构成了黑...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊