AI不会同传,但终究会讯飞

文丨不凡商业记者张含纸包不住火。很显然,在人工智能领域摸爬滚打19年的科大讯飞是熟知这一点的。在被指AI同传造假的时候,科大讯飞的回应显得很镇定:从未说过AI同传,没有侵犯知识产权,人机耦合才是未来发展之道。“否认三连”之后,不管人机耦合的说法是否被大众所接受,科大讯飞至少摘掉了“造假”的帽子,讨论的焦点转向AI同传的相关技术。在本次“造假”风波中,主要涉及到三种技术:语音识别、机器翻译和AI同传,第一个是科大讯飞这些年行走江湖的法宝,第二个是百度、谷歌、有道等机器翻译相关公司的战场,最后则是整个业界的终极目标。但问题是,语音识别≠AI同传≠AI语音翻译,脱掉“造假”帽子的科大讯飞再也不能掩去语音识别与AI同传之间的鸿沟。传说中的AI同传每个少年都有一个武侠梦,练成一身武艺,行走江湖,去追求武学的最高境界。在翻译界,同传被公认为从事翻译的最高境界。同传,指的是译员在不打断讲话者演讲的情况下,不停的将演讲内容传达给听众。一般来说,同传译员要在演讲者开始讲话两到三秒钟后开口翻译,在演讲者讲话结束两到三秒钟后结束翻译,翻译的准确率要求在80%以上,超时也会被判定为严重工作失误。正因为如此,AI同传一向被认为是人工智能领域最具有挑战性的课题之一,要实现高质量的同传,需要两种技术同时在线:语音识别和机器翻译。语音识别是科大讯飞最喜欢讲的故事。年,在中科大的人机语音实验室干了8年后,26岁的刘庆峰带着实验室的师兄弟共同成立了科大讯飞的前身——硅谷天音,手里揣着的只有共同筹集的万元和8年间积攒的语音合成技术。后来,硅谷天音获得了由美菱集团和安徽省信托投资公司共同投资的0万人民币,“硅谷天音”更名为“科大讯飞”。刘庆峰拿着这笔钱开始进行资源整合,与擅长其它语音处理技术的研究机构共同成立联合实验室——各研究机构不需要改变原有研究领域,由科大讯飞负责产业整合,将语音技术实体落地,并以股权的形式共享利益。从此,语音处理成为科大讯飞的核心技术,语音识别也成为外界认知科大讯飞的标签之一。语音识别,简单来说就是将声音转换成波形文件,对声音进行分帧,再从每一帧中提取包含内容信息的声学特征。提取特征后将特征组成因素(类似于音标),再结合各种语音数据、语音模型,形成一个有足够多节点的网络。识别语音的时候,只需要找到与声音最匹配的路径就好。现在,安静环境、发音标准情况下的语音识别已经完全可以实用,效果并不比输入法自动联想差。但嘈杂环境、带口音、不连贯、重复等情况下的语音依旧是个老大难的问题,各研究院在研究,科大讯飞也在探索。但问题是,语音识别的结果直接决定了机器翻译的准确度。评价机器翻译内容的好坏,国际上通常会有一些方法,除了人工评测,还有多种自动评测的方法。但不论具体评测方式如何,有一点需要知道:机器翻译的正确率并没有一个绝对值。不管是谷歌、微软,还是百度、金山,目前国际上通行的做法是以“翻译错误降低率”来衡量自身技术的成熟度,而不是以具体准确率。避谈具体的准确率,何谈追求信达雅。“目前,科大讯飞的机器翻译已经达到大学六级水平,年将达到英语专业八级水平,可以满足日常交流,但还无法代替同传。”科大讯飞在回应“造假”的声明中承认,在现阶段还无法实现AI同传,机器翻译只能达到简单交流的水平,人机耦合才是未来发展之道。什么是人机耦合?“人机耦合”这个词一出,瞬间吸引了不少火力,大众开始

转载请注明:http://www.abuoumao.com/hyfz/6209.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: 冀ICP备19029570号-7