透视科大讯飞“同传造假”:机器翻译之困 技术鸿沟未跨越
2018-10-01 21:45:22
来源:中国经营报
作者:唐金燕 李甜 文章类型:转载
近日,人工智能语音领域领军企业科大讯飞(002230.SZ)被曝出“同传造假”,科大讯飞官方回应这是由于与同传译员沟通不足造成的误会。
据悉,引发此次事件是在2018创新与新兴产业发展国际会议上,该会议曾以“机器翻译”作为宣传,科大讯飞官方最近解释称这种方式是“人机耦合”,并承认机器翻译仍难以代替人工。
物联网资深专家杨剑勇对《中国经营报》记者表示,科大讯飞提出人机耦合背后,是智能(机器)翻译技术相对语音识别技术难度更大。
近年来,随着AI的热度递增,机器翻译也呈现出爆发之势。但根据本报记者了解,实际行业现状是目前机器翻译仍难以达到接近人类对话的效果,尽管不同企业开始竞相研发机器翻译新品,但如何令翻译更准确是AI领域待解的一大难题。
技术鸿沟未跨越
曾在脸书担任软件实习工程师的王赟,目前在知乎上有6万关注人次,是语音领域方面的专业答主。王赟告诉记者,“语音识别”是指把声音转换成文字的过程,不包括后续的理解、翻译等。而“同传”(同声传译)指的是在(识别)一个人说话的同时翻译成另一种(语言)。
业内普遍认为AI同传比语音识别更难,只有先识别才能进行翻译。据了解,搜狗机器同传技术系统需要将语音预处理、语音识别、文本预处理、机器翻译、语音合成五项技术模块进行结合。
中国传媒大学研究大数据与人工智能方向的教授沈浩认为,目前机器翻译这方面的技术已经成熟,水平强于(英语)六级,但易受处于近场或远场、有无噪音等因素影响。
沈浩对本报记者举例:“如果是日常生活用语,以及标准的一些话语,都没有问题,但涉及到诗、歌、抒情散文等,翻译结果容易出现问题。”
北京市速记协会理事长唐可为认为同传翻译和速录都要求精准,速录员和同传翻译在速录和翻译过程中要求精简记录,进行语义理解后更接近讲话者的记录,而目前的同传翻译并不能做到结合上下文完整表达句子意思。
“很多时候,机器速录、机器翻译后还需要人为进行实时修改,甚至更考验速录员和同传翻译,还更耗费时间。”唐可为表示。
搜狗语言交互技术中心技术总监陈伟表示,同传场景对语音识别的要求很高,错一个字对于源语言的理解基本不受影响,但若将同传后的文字翻译成另一种语言,可能整句都是错的。
科大讯飞方面则对本报记者表示,目前机器翻译已经取得非常大的进步,能够帮助人们在一些场景中处理语言交流的问题,但距离会议同传以及高水平翻译所讲究的“信、达、雅”(翻译中常要求的忠实原文、通顺畅达、译文优美三大原则)还存在很大的差距。
尽管有深度学习技术在语音、翻译等领域的快速突破以及大数据的红利,但是相比于训练有素的人工而言,机器实际上缺乏语音识别的稳定性、机器翻译的稳定性、对语言理解和再创造的能力。
此外,机器同传要与人工同传媲美,就要聪明而灵活地结合前后内容进行“创作”。陈伟表示,人工同传是对译文二次创造,因此译文往往流利度高,而机器对于口语化、命名实体和多义词较多等情况下翻译效果不够好,目前(利用机器进行)同传翻译仍基于当前单句进行翻译,上文的历史信息无法较好使用,以及在语言的理解和再创造的能力方面,目前机器无法基于原文进行引申和扩展,确保翻译效果的流畅性。
仍具备实际性价值
继前两年微软、百度、腾讯、科大讯飞、谷歌等纷纷推出翻译软件、发布翻译机器后,本报记者梳理发现,今年市面上仅公开发布的产品就有近十款,包括搜狗推出的搜狗旅行翻译宝、搜狗速记翻译笔、搜狗录音翻译笔记、搜狗翻译宝pro。华为、360手机、OPPO在推出新机时以机器翻译为卖点,甚至业内一家手机品牌糖果手机直接打出了“翻译手机”的概念,而猎豹移动也推出了一款小豹AI翻译棒。
“翻译机不是高高在上的黑科技,而是通过场景落地,解决用户在特定场景中需求的真正有用的技术。”猎豹移动CEO傅盛在推出小豹AI翻译棒时称。
易观互动娱乐组群高级分析师殷实告诉本报记者,从商业或者专业会议的角度来看,翻译机还未能代替人工翻译在正式场合运用,更多是扮演一个辅助工具角色。“今年来,翻译技术火爆的原因主要在于它对翻译精度要求不高场合下有很高的使用价值。”
殷实认为,目前,翻译机在市场上主要用于在类似出行、旅游等对翻译精度要求相对低一些的行业,为游客解决在国外语言不通的问题,甚至在一定程度上推动了旅游业的发展。
据易观千帆的数据,旅游APP的月活跃用户量一年内增长了近30%,国外游的热度也一直没有减退。殷实认为,不能因为机器翻译当下存在问题就否认它存在的价值。
陈伟表示,对比人工同传和机器同传的能力,机器相较于人的优势是:机器基于海量数据能针对某个领域进行快速学习,机器同传能够忠实原文,一般不会遗漏译文,可长时间记忆,机器能够实现快速、高并发的部署,同时支持多场会议的同传,很大程度缓解人工同传资源不足的问题,降低同传成本。
尽管机器翻译的发展未完全尽如人意,但是陈伟认为机器翻译目前满足部分使用需求的价值已经显现。近些年,各种规模的国际交流越来越多,从行业大会到闭门小会,甚至到课堂培训,均存在同传的需求,而目前虽然有不错的大量(人工)同传从业者,但事实上还仍满足不了国际交流的需求。
沈浩认为,目前机器学习算法的趋势慢慢接近人工同传的可靠性,人们应该注重事物未来的发展趋势。
准确度壁垒待破
本报记者注意到,市场也不乏有众多声音称某某产品语音识别准确率、翻译准确率能达到多少。就语音识别准确率而言,各家公司自有其说法。
搜狗、百度和科大讯飞三家公司2016年11 月各自宣布其中文语音识别准确率达到了 97%。搜狗称其语音翻译的准确率可以达到90%。今年6月,央广网科技报道称,目前讯飞输入法的语音识别准确率提升到98%。近日,科大讯飞方面对本报表示,其机器翻译已经达到大学六级水平,2019年将达到英语专业八级水平。
王赟告诉本报记者,行业内一般采用“词错误率”进行测评,这个标准主要是看测试所用的“数据集”的难度,不同的数据集难度不同,所以单看一个词错误率的数字,并不能判断系统性能的好坏。如果要对技术进行测评,必须指明在哪个数据集上取得了这样的词错误率。王赟举例表示,在一个叫 Switchboard 的数据集上,目前微软和 IBM 都做到了百分之五点几的词错误率,已是行业领先。
王赟告诉记者,用标准数据集来测试也有局限性,一些标准数据集里没有考虑到噪音环境,另外,有团队可能专注于“刷榜”,把标准数据集上的词错误率刷到很低,但一换成别的数据,就会“现出原形”。
“这也是为什么有些时候一个宣传得很牛的产品到了实际中就各种不好用。毕竟实际环境是千变万化的,如果训练时没有覆盖到这么广的实际场景,在实际中就容易出问题。”王赟向本报记者解释道。
陈伟告诉本报记者,“现在很多翻译机的产品,特别是低价的翻译机更多是从第三方公司获取,这种情况下很难做二次的优化和开发。”
“根据我们在同传产品得到的经验,它并不是简单的‘语音识别+翻译’,出现‘1+1>2’的能力,往往(现实是)远远小于2,所以我们要把单点能力做好,同时产生‘1+1=2’甚至远大于2的效果。这件事情是目前搜狗同传和搜狗翻译宝具有的技术壁垒。”陈伟说。
沈浩认为各主要玩家的语音识别准确率已经差别不大,厂商们均掌握着技术原理,只是看哪家能够不断地去训练,对结果进行提升,如准确率从95%提升至96%,但实际上达到95%的准确率时,就可以将其现实化和商业化。“所以判断他们哪一款产品优秀,我也只能谈他们的界面、开源甚至使用成本等其他方面。”沈浩表示。
沈浩表示,从国内外对比上,谷歌能够实现全球多种语言之间的互译,而国内企业,例如科大讯飞主要是汉语以及方言的识别,或解决主流使用语言的翻译。
陈伟表示,搜狗正在横向扩展多语种的机器翻译技术,实现跨语音交流,“在这个技术上面临的很大问题是,如果我们没有足够的数据怎么办?在没有足够数据时,我们会考虑要不要面向于低资源(一门语言的数据很少,不足够训练语音识别或机器翻译系统的资源),或者是做没有数据、单向的翻译语料,或者是文本语料,做两个语种之间的翻译。”陈伟表示,“这两项技术是目前我们着重做的。”
相关阅读
-
内存市场暖意回归!SK海力士迎业绩暴涨:Q1营收增速创14年新高
当地时间周四,全球第二大内存芯片制造商SK海力士发布了强劲的第一财季财报。SK海力士预计,随着人工智能相关需求的激增,内存芯片市场将全...
-
促进AI芯片“降本增效” 英伟达出手收购两家初创企业
英伟达又出手了!继去年投资30多家创企后,近期该公司又投资了两家人工智能初创企业Run:ai与Deci。当地时间4月24日,英伟达宣布,已经同Run...
-
Meta一季度净利翻番 AI投资推高全年支出引发担忧
社交媒体巨头Meta发布了稳健的一季度财报,但再次提升的AI(人工智能)资本支出和低于预期的下季度营收指引令投资者感到担忧,导致公司股价...
-
软银将斥资近10亿美元布局算力基建 目标开发万亿参数大模型
据媒体报道,日本软银集团将在今明两年投资1500亿日元(约合9.6亿美元),为其计算设施提供开发“世界级”生成式人工智能所需的数字运算能...
-
AI促进营收增益这么强劲?!可口可乐豪掷11亿美元购买微软AI云服务
通过去年推出“AI可乐”初尝人工智能的“甜头”后,全球软饮料龙头可口可乐周二宣布,公司与微软达成一项为期5年的战略合作伙伴关系,通过...
-
能识别抑制α-突触核蛋白聚集的小分子 AI将帕金森病药物设计提速十倍
英国剑桥大学研究人员使用人工智能(AI)技术大幅加快了帕金森病治疗方法的开发。他们设计并使用了一种基于AI的策略,来识别阻止α-突触核...
-
AMD重磅发布新一代AI PC芯片欲在这一领域取得领先地位
美国超威半导体公司(AMD)发力人工智能(AI)电脑领域,正在用新一批芯片抢夺英伟达的蛋糕,试图在与英伟达和英特尔的竞争中取得领先地位...
-
视频编辑或迎来变革!Adobe开辟新路径:探索与OpenAI合作
视频编辑领域或迎来一次重大变革——影视行业人手必备的视频编辑软件Adobe Premiere Pro(简称Pr)正迎来突破性的人工智能(AI)创新。美...
免责声明:本网所发所有文章,包括本网原创、编译及转发的第三方稿件及评论,均不构成任何投资建议,交易操作或投资决定请询问专业人士。
热门点击
本周本月
-
- 【4.22】今日财经时讯及重要市场资讯
-
- 【4.23】今日财经时讯及重要市场资讯
-
- 【4.24】今日财经时讯及重要市场资讯
-
- 通胀高于预期澳储行或不急于加息 澳指周三平收Perpetual回落
-
- 中东局势缓和澳指周一上扬 黄金股回调South32劲升
-
- 澳州首富吉娜·莱因哈特:中国在能源、经济、国防和教育政策方面比澳大利亚做的更好
-
- 澳指周二攀升科技板块领涨 金价下跌金矿商股价回落
-
- 天齐锂业一季度预亏36亿元-43亿 深交所要求提供一季度亏损大幅增加原因说明
-
- 澳大利亚即将出台的预算案关注重点是什么?国库部长吉姆·查默斯(Jim Chalmers)媒体见面会释放信息
-
- 本周前瞻4月22日-28日:美国GDP,通胀数据以及日本央行会议
-
- 中国官宣后 澳籍华人可以免签入境中国30天
-
- 美国正考虑对中国金融机构和其他实体实施制裁?外交部回应
-
- 中东局势缓和澳指周一上扬 黄金股回调South32劲升
-
- 利率高企按揭成本上升 澳洲置业者的机会急剧减少
-
- 澳洲一季度CPI上升1.0% 高于市场预期