被Diss造假,科大讯飞说从未提出过“AI同传”概念
随着各大公司都在推AI同传,同传从业者似乎都面临着饭碗不保。
AI同传真的能取代人类同传?
9月21日,众多媒体报道,科大讯飞AI同传被指造假。
事件起因是,9月20日,一位ID为Bell Wang的用户在知乎发文“科大讯飞,你的AI同传操(qi)作(zha)能更风骚一点吗”,狠狠Diss了科大讯飞 AI同传,指出科大讯飞在现场和直播展示的AI同传其实用的是人类同传翻译结果。这件事情随即引发了微博上不少同传从业者的讨论和众多媒体报道。
科大讯飞董秘江涛对记者回应称,“讯飞从没讲过AI同传的概念,始终强调是人机耦合的模式。”
随后,科大讯飞官方也给出了解释:
科大讯飞的意思是他们提供的是语音识别技术,并不是AI同传,也并没有提出AI同传的概念。但是在这次事件中,科大讯飞的做法确实引起了误解,事件还存在多处争议,例如科大讯飞是否有意混淆AI同传与人工同传,科大讯飞的人机耦合具体如何操作?
我们先来回顾下Bell Wang描述的事情经过。
9月20日早上,Bell Wang来到上海国际会议中心,支持2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会的现场同传工作。
大会的第一位嘉宾是日本教授,由Bell Wang的同事进行英文转中文的同声传译。大会现场有三块屏幕,中间是发言人的演讲PPT,左右两边分别以中文和英文的方式呈现演讲字幕,两边屏幕都有 “讯飞听见” 的logo。
(图片来自知乎用户Bell Wang)
Bell Wang发现英文字幕跟日本教授的说话内容有很大出入,“可以说是胡话连篇了”,也就是说“讯飞听见”难以听懂日本教授酸爽的英语。
但是呢,另一边的中文字幕却是相当连贯,显然不是机器翻译的。他也给出了实锤:
(图片来自知乎用户Bell Wang)
上图这句话里有“就是”这样的连词,这是同传人员顺句驱动时用于联系语句用的。还有就是讯飞听见将“Davos Forum”听成 “Devils Forum”的时候,中文翻译却正确地显示成“达沃斯论坛”。
按照正常流程,讯飞听见是先识别英文,然后翻译成中文,如果英文的识别错了,如何能翻译正确呢?
Bell Wang认为,“讯飞听见”Logo会让人误以为中文字幕也是来自“讯飞听见”,不过他也意识到,讯飞并没有直接说中文字幕是自家AI翻译的。所以他在文章也说他当时能脑补出科大讯飞被戳穿后的辩词:“我们这次使用的产品是讯飞听见,识别同传的翻译打在屏幕上方便听众,并无意冒充AI同传,对恶意造谣者,我们保留诉诸法律的权力”。
Bell Wang说自己当时的心态是觉得恶心,但是也只能忍了。
真正让Bell Wang起心要Diss科大讯飞是大会直播。知领直播介绍称“国际高端会议听不懂,知领更懂你!本次知领直播引入科大讯飞智能语音技术,实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报,带给你不一样的试听体验!”
Bell Wang用手机录了一段直播视频,直播里是一位说中文的教授,然后讯飞AI说出的是英文。视频中,教授在说:“讲者说可以挖掘数据,放入图表”,但是讯飞却说的是“put it in charge”,如果是讯飞将中文翻译成英文,绝不可能出现这样的情况。实际情况是讯飞识别了同传人员的翻译“put in chart”,误听成了“put in charge”。
也就是说,讯飞不是在做AI同传,而是识别了同传人员的语音翻译然后念了出来。Bell Wang声称自己事先并不知道讯飞会用语音识别将同传转化为文字,同时也不知道直播会用AI识别同传人声翻译再播报出来,是没有征得同意就冒名使用翻译成果。
最后Bell Wang说道 “也许有一天AI真的能做到理解自然语言,也许有一天我们这个职业会失业,但绝不是现在;真正突破性的技术也不可能由一个没有操守的公司研发出来。技术是无罪的,但以技术为名吸引资本的目的会不会导致虚假包装和营销呢?呵呵呵呵。”
以上是雷锋网编辑根据Bell Wang在知乎的发文进行的事件还原。
结合科大讯飞的回应,雷锋网认为有不少关键点值得讨论。
首先,科大讯飞是不是在造假?
IEID大会上,科大讯飞用“讯飞听见”识别了演讲嘉宾的发言,将语音转化为文字呈现在了屏幕上,同时也将同传人员的语音翻译转化为字幕呈现在另一块屏幕上,这次大会上讯飞没有用到自家的AI翻译,但是却没有表明翻译是来自于同传人员,会让人误导全程是“AI同传”。同传人员翻译的成果明显好于AI,则会进一步误导大家“AI同传”已经达到与真人翻译一样好的效果。
大会现场,语音识别转文字有很好的优势,因为很多时候要听英文,又要听同传耳机中的中文翻译会干扰人的注意力。那么,直播为何不用同传的原声呢?科大讯飞的解释是,避免收听不畅。
科大讯飞先识别了同传人员的语音翻译结果,然后再用AI将翻译结果语音播报出来。可是,AI语音播报时却出现了多次错误,这是不是有点多此一举?
科大讯飞全程没有用到AI翻译,但是知领直播却介绍说:“引入科大讯飞智能语音技术,实现了国际高端会议的中英文频道切换、智能翻译和自动语音播报,带给你不一样的试听体验!”
其次,人机耦合模式到底是啥?
讯飞从没讲过AI同传的概念,始终强调是人机耦合的模式。
从科大讯飞的说明中我们可以看出科大讯飞的人机耦合和AI同传确实不是一回事,“在十位嘉宾演讲中,除了三位是由人工同传的语音转写探索人机耦合模式,其余的全部是机器全自动转写。并且,为了让观众看得清楚,机器全自动转的都采用中英文同屏显示,人工同传转写的都只显示一个语种”。
可以看到,大会上两个屏幕分别显示中文和英文,没有同屏显示。但是这样微弱的区分,谁能清楚掌握?更合适的方式或许是直接表明此次大会的同传由人工提供吧。
况且,这次大会是纯人工,也没用到所谓的人机耦合。除非,科大讯飞所谓的人机耦合就是讯飞听见”将同传人员的翻译结果转成文字吗?这样的话,机器并没有做任何与同传、翻译相关的事情。
最后, AI同传目前究竟什么水平?
其实,AI同传因为能力不济在大会上出洋相的例子很多。
今年4月,博鳌亚洲论坛有4场分论坛应用了腾讯AI同传,结果,腾讯AI同传现了单词乱码、连续出现同一个单词的卡机状况。
最囧的是,腾讯AI同传将“一带一路”变着花样翻译成了好几种不同的说法。
此外,到目前为止,支持的会议最多的搜狗AI同传,在大会上有时常出现各种错误。目前AI语音转写的准确率只有90%左右,转写过后再翻译的话,准确率自然更低。
所以,科大讯飞董事长刘庆峰多次表示,AI目前的翻译水平还达不到同传的要求。也一直强调AI不可能取代同传从业人员,未来会是人机耦合。
AI同传水平不济,但是大家却已经没有耐心等待其完全成熟。在雷锋网 (公众号:雷锋网) 看来,不断试错能促进发展,但是直面弱点才能有所成长吧。
。