今天,知识产权信息珠珠给大家分享带来的《科大讯飞重新定义人机语音交互标准》,如果您对科大讯飞重新定义人机语音交互标准感兴趣,请往下看。
(图为科大讯飞2015年度发布会现场冯飞摄)
日前,科大讯飞2015年年度发布会在北京举行。科大讯飞在此次发布会定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括3个方面:远场识别、全双工、多轮交互。
发布会上,科大讯飞董事长刘庆峰发布了基于全新语音交互技术的人机交互界面--AIUI,以及录音宝、录音笔、讯飞听见网、智学网、E听说等ToC产品,并对“讯飞超脑”2.0版本的近期科研成果进行了介绍和现场演示。科大讯飞高级副总裁、研究院院长胡郁详细讲解了人工智能的科技起源、历史沿革与未来展望,以及科大讯飞产品的技术实现路径。
从1998年成功研发出可实用的中文语音交互系统开始,到2014年发布“讯飞超脑”的这17年间,科大讯飞取得了让行业和科技界瞩目的一系列科研成就与产业化成果。科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军、JWSLT机器翻译评测冠军,以及其产品在国内替代人工进行英语口语测试与普通话级别考试,在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进,并在这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。
在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器可以在不久的将来在高考中折桂。
而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品--AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括3个方面:远场识别、全双工、多轮交互。
据悉,AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务等。在发布现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,敢于接受现场数千参会者和数千万观看视频直播观众的检验。
除上述产品之外,科大讯飞还在大会上发布了实用性很强的ToC产品--录音宝、录音笔与讯飞听见网。据刘庆峰介绍,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。
刘庆峰表示,录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、叮咚智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的ToC产品线第一阵营,而科大讯飞还将继续在ToC业务领域,推出受市场欢迎的高科技产品。(冯飞)
(编辑:高云翔)
好了,关于“科大”科大讯飞重新定义人机语音交互标准的内容就介绍到这。