AI不会同传,但终究会讯飞

文丨不凡商业记者张含纸包不住火。很显然，在人工智能领域摸爬滚打19年的科大讯飞是熟知这一点的。在被指AI同传造假的时候，科大讯飞的回应显得很镇定：从未说过AI同传，没有侵犯知识产权，人机耦合才是未来发展之道。“否认三连”之后，不管人机耦合的说法是否被大众所接受，科大讯飞至少摘掉了“造假”的帽子，讨论的焦点转向AI同传的相关技术。在本次“造假”风波中，主要涉及到三种技术：语音识别、机器翻译和AI同传，第一个是科大讯飞这些年行走江湖的法宝，第二个是百度、谷歌、有道等机器翻译相关公司的战场，最后则是整个业界的终极目标。但问题是，语音识别≠AI同传≠AI语音翻译，脱掉“造假”帽子的科大讯飞再也不能掩去语音识别与AI同传之间的鸿沟。传说中的AI同传每个少年都有一个武侠梦，练成一身武艺，行走江湖，去追求武学的最高境界。在翻译界，同传被公认为从事翻译的最高境界。同传，指的是译员在不打断讲话者演讲的情况下，不停的将演讲内容传达给听众。一般来说，同传译员要在演讲者开始讲话两到三秒钟后开口翻译，在演讲者讲话结束两到三秒钟后结束翻译，翻译的准确率要求在80%以上，超时也会被判定为严重工作失误。正因为如此，AI同传一向被认为是人工智能领域最具有挑战性的课题之一，要实现高质量的同传，需要两种技术同时在线：语音识别和机器翻译。语音识别是科大讯飞最喜欢讲的故事。年，在中科大的人机语音实验室干了8年后，26岁的刘庆峰带着实验室的师兄弟共同成立了科大讯飞的前身——硅谷天音，手里揣着的只有共同筹集的万元和8年间积攒的语音合成技术。后来，硅谷天音获得了由美菱集团和安徽省信托投资公司共同投资的0万人民币，“硅谷天音”更名为“科大讯飞”。刘庆峰拿着这笔钱开始进行资源整合，与擅长其它语音处理技术的研究机构共同成立联合实验室——各研究机构不需要改变原有研究领域，由科大讯飞负责产业整合，将语音技术实体落地，并以股权的形式共享利益。从此，语音处理成为科大讯飞的核心技术，语音识别也成为外界认知科大讯飞的标签之一。语音识别，简单来说就是将声音转换成波形文件，对声音进行分帧，再从每一帧中提取包含内容信息的声学特征。提取特征后将特征组成因素（类似于音标），再结合各种语音数据、语音模型，形成一个有足够多节点的网络。识别语音的时候，只需要找到与声音最匹配的路径就好。现在，安静环境、发音标准情况下的语音识别已经完全可以实用，效果并不比输入法自动联想差。但嘈杂环境、带口音、不连贯、重复等情况下的语音依旧是个老大难的问题，各研究院在研究，科大讯飞也在探索。但问题是，语音识别的结果直接决定了机器翻译的准确度。评价机器翻译内容的好坏，国际上通常会有一些方法，除了人工评测，还有多种自动评测的方法。但不论具体评测方式如何，有一点需要知道：机器翻译的正确率并没有一个绝对值。不管是谷歌、微软，还是百度、金山，目前国际上通行的做法是以“翻译错误降低率”来衡量自身技术的成熟度，而不是以具体准确率。避谈具体的准确率，何谈追求信达雅。“目前，科大讯飞的机器翻译已经达到大学六级水平，年将达到英语专业八级水平，可以满足日常交流，但还无法代替同传。”科大讯飞在回应“造假”的声明中承认，在现阶段还无法实现AI同传，机器翻译只能达到简单交流的水平，人机耦合才是未来发展之道。什么是人机耦合？“人机耦合”这个词一出，瞬间吸引了不少火力，大众开始

转载请注明：http://www.abuoumao.com/hyfz/6209.html

上一篇文章：日本艺妓的脸为啥这么白

下一篇文章：重庆银行01963截至2023年底累