透视科大讯飞“同传造假”:机器翻译之困 技术鸿沟未跨越
2018-10-01 21:45:22
来源:中国经营报
作者:唐金燕 李甜 文章类型:转载

近日,人工智能语音领域领军企业科大讯飞(002230.SZ)被曝出“同传造假”,科大讯飞官方回应这是由于与同传译员沟通不足造成的误会。
据悉,引发此次事件是在2018创新与新兴产业发展国际会议上,该会议曾以“机器翻译”作为宣传,科大讯飞官方最近解释称这种方式是“人机耦合”,并承认机器翻译仍难以代替人工。
物联网资深专家杨剑勇对《中国经营报》记者表示,科大讯飞提出人机耦合背后,是智能(机器)翻译技术相对语音识别技术难度更大。

近年来,随着AI的热度递增,机器翻译也呈现出爆发之势。但根据本报记者了解,实际行业现状是目前机器翻译仍难以达到接近人类对话的效果,尽管不同企业开始竞相研发机器翻译新品,但如何令翻译更准确是AI领域待解的一大难题。
技术鸿沟未跨越
曾在脸书担任软件实习工程师的王赟,目前在知乎上有6万关注人次,是语音领域方面的专业答主。王赟告诉记者,“语音识别”是指把声音转换成文字的过程,不包括后续的理解、翻译等。而“同传”(同声传译)指的是在(识别)一个人说话的同时翻译成另一种(语言)。
业内普遍认为AI同传比语音识别更难,只有先识别才能进行翻译。据了解,搜狗机器同传技术系统需要将语音预处理、语音识别、文本预处理、机器翻译、语音合成五项技术模块进行结合。
中国传媒大学研究大数据与人工智能方向的教授沈浩认为,目前机器翻译这方面的技术已经成熟,水平强于(英语)六级,但易受处于近场或远场、有无噪音等因素影响。
沈浩对本报记者举例:“如果是日常生活用语,以及标准的一些话语,都没有问题,但涉及到诗、歌、抒情散文等,翻译结果容易出现问题。”
北京市速记协会理事长唐可为认为同传翻译和速录都要求精准,速录员和同传翻译在速录和翻译过程中要求精简记录,进行语义理解后更接近讲话者的记录,而目前的同传翻译并不能做到结合上下文完整表达句子意思。
“很多时候,机器速录、机器翻译后还需要人为进行实时修改,甚至更考验速录员和同传翻译,还更耗费时间。”唐可为表示。
搜狗语言交互技术中心技术总监陈伟表示,同传场景对语音识别的要求很高,错一个字对于源语言的理解基本不受影响,但若将同传后的文字翻译成另一种语言,可能整句都是错的。
科大讯飞方面则对本报记者表示,目前机器翻译已经取得非常大的进步,能够帮助人们在一些场景中处理语言交流的问题,但距离会议同传以及高水平翻译所讲究的“信、达、雅”(翻译中常要求的忠实原文、通顺畅达、译文优美三大原则)还存在很大的差距。
尽管有深度学习技术在语音、翻译等领域的快速突破以及大数据的红利,但是相比于训练有素的人工而言,机器实际上缺乏语音识别的稳定性、机器翻译的稳定性、对语言理解和再创造的能力。
此外,机器同传要与人工同传媲美,就要聪明而灵活地结合前后内容进行“创作”。陈伟表示,人工同传是对译文二次创造,因此译文往往流利度高,而机器对于口语化、命名实体和多义词较多等情况下翻译效果不够好,目前(利用机器进行)同传翻译仍基于当前单句进行翻译,上文的历史信息无法较好使用,以及在语言的理解和再创造的能力方面,目前机器无法基于原文进行引申和扩展,确保翻译效果的流畅性。
仍具备实际性价值
继前两年微软、百度、腾讯、科大讯飞、谷歌等纷纷推出翻译软件、发布翻译机器后,本报记者梳理发现,今年市面上仅公开发布的产品就有近十款,包括搜狗推出的搜狗旅行翻译宝、搜狗速记翻译笔、搜狗录音翻译笔记、搜狗翻译宝pro。华为、360手机、OPPO在推出新机时以机器翻译为卖点,甚至业内一家手机品牌糖果手机直接打出了“翻译手机”的概念,而猎豹移动也推出了一款小豹AI翻译棒。
“翻译机不是高高在上的黑科技,而是通过场景落地,解决用户在特定场景中需求的真正有用的技术。”猎豹移动CEO傅盛在推出小豹AI翻译棒时称。
易观互动娱乐组群高级分析师殷实告诉本报记者,从商业或者专业会议的角度来看,翻译机还未能代替人工翻译在正式场合运用,更多是扮演一个辅助工具角色。“今年来,翻译技术火爆的原因主要在于它对翻译精度要求不高场合下有很高的使用价值。”
殷实认为,目前,翻译机在市场上主要用于在类似出行、旅游等对翻译精度要求相对低一些的行业,为游客解决在国外语言不通的问题,甚至在一定程度上推动了旅游业的发展。
据易观千帆的数据,旅游APP的月活跃用户量一年内增长了近30%,国外游的热度也一直没有减退。殷实认为,不能因为机器翻译当下存在问题就否认它存在的价值。
陈伟表示,对比人工同传和机器同传的能力,机器相较于人的优势是:机器基于海量数据能针对某个领域进行快速学习,机器同传能够忠实原文,一般不会遗漏译文,可长时间记忆,机器能够实现快速、高并发的部署,同时支持多场会议的同传,很大程度缓解人工同传资源不足的问题,降低同传成本。
尽管机器翻译的发展未完全尽如人意,但是陈伟认为机器翻译目前满足部分使用需求的价值已经显现。近些年,各种规模的国际交流越来越多,从行业大会到闭门小会,甚至到课堂培训,均存在同传的需求,而目前虽然有不错的大量(人工)同传从业者,但事实上还仍满足不了国际交流的需求。
沈浩认为,目前机器学习算法的趋势慢慢接近人工同传的可靠性,人们应该注重事物未来的发展趋势。
准确度壁垒待破
本报记者注意到,市场也不乏有众多声音称某某产品语音识别准确率、翻译准确率能达到多少。就语音识别准确率而言,各家公司自有其说法。
搜狗、百度和科大讯飞三家公司2016年11 月各自宣布其中文语音识别准确率达到了 97%。搜狗称其语音翻译的准确率可以达到90%。今年6月,央广网科技报道称,目前讯飞输入法的语音识别准确率提升到98%。近日,科大讯飞方面对本报表示,其机器翻译已经达到大学六级水平,2019年将达到英语专业八级水平。
王赟告诉本报记者,行业内一般采用“词错误率”进行测评,这个标准主要是看测试所用的“数据集”的难度,不同的数据集难度不同,所以单看一个词错误率的数字,并不能判断系统性能的好坏。如果要对技术进行测评,必须指明在哪个数据集上取得了这样的词错误率。王赟举例表示,在一个叫 Switchboard 的数据集上,目前微软和 IBM 都做到了百分之五点几的词错误率,已是行业领先。
王赟告诉记者,用标准数据集来测试也有局限性,一些标准数据集里没有考虑到噪音环境,另外,有团队可能专注于“刷榜”,把标准数据集上的词错误率刷到很低,但一换成别的数据,就会“现出原形”。
“这也是为什么有些时候一个宣传得很牛的产品到了实际中就各种不好用。毕竟实际环境是千变万化的,如果训练时没有覆盖到这么广的实际场景,在实际中就容易出问题。”王赟向本报记者解释道。
陈伟告诉本报记者,“现在很多翻译机的产品,特别是低价的翻译机更多是从第三方公司获取,这种情况下很难做二次的优化和开发。”
“根据我们在同传产品得到的经验,它并不是简单的‘语音识别+翻译’,出现‘1+1>2’的能力,往往(现实是)远远小于2,所以我们要把单点能力做好,同时产生‘1+1=2’甚至远大于2的效果。这件事情是目前搜狗同传和搜狗翻译宝具有的技术壁垒。”陈伟说。
沈浩认为各主要玩家的语音识别准确率已经差别不大,厂商们均掌握着技术原理,只是看哪家能够不断地去训练,对结果进行提升,如准确率从95%提升至96%,但实际上达到95%的准确率时,就可以将其现实化和商业化。“所以判断他们哪一款产品优秀,我也只能谈他们的界面、开源甚至使用成本等其他方面。”沈浩表示。
沈浩表示,从国内外对比上,谷歌能够实现全球多种语言之间的互译,而国内企业,例如科大讯飞主要是汉语以及方言的识别,或解决主流使用语言的翻译。
陈伟表示,搜狗正在横向扩展多语种的机器翻译技术,实现跨语音交流,“在这个技术上面临的很大问题是,如果我们没有足够的数据怎么办?在没有足够数据时,我们会考虑要不要面向于低资源(一门语言的数据很少,不足够训练语音识别或机器翻译系统的资源),或者是做没有数据、单向的翻译语料,或者是文本语料,做两个语种之间的翻译。”陈伟表示,“这两项技术是目前我们着重做的。”
相关阅读
-
甲骨文启动新一轮大规模裁员,AI数据中心投入持续加码
甲骨文公司周二已通知员工进行新一轮裁员,规模达数千人,同时将持续投入巨资建设用于人工智能(AI)开发的数据中心。
-
知名科技爆料人:苹果正在测试可同时处理多项命令的Siri功能
折腾两年后,苹果Siri终于即将变成所谓“人工智能助理”该有的样子。据知名苹果消息爆料人马克·古尔曼的最新消息,苹果公司正在测试一项新功能,允许Siri在回应单次查询时同时处理多个请求。

-
人工智能威胁撼动澳大利亚250位最富有者榜单 科技富豪跌落神坛 传统富豪荣耀回归
由《澳大利亚人报》推出的2026澳洲250位最富有者榜单揭晓。从前十排名来看,几位曾经的科技巨头财富大减,传统行业富豪荣耀回归。

-
【3.20】今日财经时讯及重要市场资讯
由《澳大利亚人报》推出的2026澳洲250位最富有者榜单揭晓。从前十排名来看,几位曾经的科技巨头财富大减,传统行业富豪荣耀回归。

-
“Atlassian别无选择” 20分钟视频+1600封解聘邮件 Cannon-Brookes宣布大规模裁员 30%来自澳洲
孵化于澳洲,在美上市,且市值仍高达190亿美元的软件巨头Atlassian成为最新一家屈服于人工智能革命的科技巨头。

-
【3.10】今日财经时讯及重要市场资讯
澳洲联邦银行(CBA)一直在与新州警察局、澳证券投资委员会(ASIC)以及金融犯罪监督机构澳交易报告和分析中心(AUSTRAC)合作,对近期发现的多起贷款欺诈案展开调查。

-
新一波AI模型或导致四分之一工作自动化 引发劳动力市场“人工智能末日”
新一波人工智能模型将使多达四分之一的工作自动化,已引发关于广泛和永久性失业的担忧,并可能导致一段时期内的劳动力市场严重混乱。
-
AI扩张拖累现金流 据称甲骨文拟裁员数千人缓解资金压力
最新消息显示,美国甲骨文公司正计划裁减数千个工作岗位,以应对大规模人工智能(AI)数据中心扩张计划所带来的资金紧张问题。
免责声明:本网站信息仅供一般参考,不构成投资或财务建议。虽力求准确与完整,但不保证信息的准确性、完整性或时效性。投资有风险,决策前请咨询专业独立顾问。使用本网站即视为接受本免责声明。
热门点击
本周本月
-
- 【异动股】8个月内资源量翻倍 扩展钻探持续见矿 Minerals 260 (ASX:MI6)西澳Bullabulling大规模黄金开发项目雏形渐显 预可研年中揭晓
-
- 澳媒:澳大利亚四大产业将从全球石油危机中获利
-
- 【异动股】Weebit Nano (ASX:WBT)完成8000万澳元全额包销机构配售 巩固半导体存储技术行业领先地位
-
- 【异动股】年内涨逾170%!重型运输脱碳先锋Janus Electric (ASX:JNS)高管团队全面迭新 发力公司管治加速商业部署
-
- 2025年四季度澳洲家庭总财富增长2.5% 房价上涨为主要驱动力
-
- 【3.31】今日财经时讯及重要市场资讯
-
- 【4.1】今日财经时讯及重要市场资讯
-
- 【3.30】今日财经时讯及重要市场资讯
-
- 【异动股】稀土勘探证延期被拒引发股价暴跌 “美国战略”遭逢重大挑战 与盛和资源割袍断义之后Energy Transition Minerals (ASX:ETM)又将走向何方?
-
- St Barbara Ltd (ASX:SBM) 与灵宝黄金合资交易满足全部先决条件 预计将获5亿澳元售股收益
-
- 【4.2】今日财经时讯及重要市场资讯
-
- 大型投行建议客户增持澳洲矿业、工业和小盘股 防范伊朗战争持续风险
-
- 全球资源格局重塑下的亚洲力量:Resourcing Tomorrow Hong Kong 2026即将启幕
-
- 【异动股】美国FDA豁免批准 潜在市场急剧扩围 十倍股Lumos Diagnostics (ASX:LDX)行至商业化拐点 缘何股价暴跌?
-
- 澳储行取消信用卡附加费引强烈反响 银行将掀卡费上涨潮削减飞行积分优惠

