当前,随着智能语音技术日益成熟,越来越多的互联网巨头、传统终端制造厂商以及初创公司进军智能语音领域,新产品、新技术不断涌现,智能语音产业进入快速发展阶段。本报告重点对智能语音产业生态、产业发展前景、行业痛点等进行了全面梳理,并结合我市智能语音产业发展提出有关建议。

智能语音产业概述

智能语音产业结构分为三层,上游基础层包括芯片、模组、传感器以及云计算服务和大数据平台等;

中游技术层主要提供语音识别、语音合成、深度/机器学习、人机交互等技术研究和服务;

下游应用包括智能手机、智能家居、智能汽车、可穿戴设备、虚拟助力、家庭机器人等B2C应用,以及金融、教育、医疗、安防等B2B应用。

全面梳理智能语音产业生态及产业发展前景

图1智能语音产业架构

智能语音产业概述

(一)谷歌

谷歌一直致力于语音交互市场,2011年已收购语音通信技术公司SayNow、语音合成技术PhoneticArts等技术公司,2014年收购了SRTechGroup的多项语音识别相关的专利。2016年,谷歌开放了语音识别API,即谷歌语音搜索和语音输入的支持技术,包括80多种语言,适用于各种实时语音识别与翻译应用。2017年,谷歌发布了用于语音交互的ActionsonGoogle平台,可支持所有GoogleAssistant所支持的平台,并在功能方面允许用户通过语音完成交易。

谷歌作为全球知名互联网巨头,依托已有的产品基础,将语音交互技术融入到搜索、地图、智能家居、机器人等产品中,构建一个新的应用平台。目前,谷歌语音助手已接入全球智能手机、汽车与智能家庭设备等产品达5亿台以上,进入了80多个国家与地区。根据Capvision统计数据显示,谷歌占据全球智能语音市场28.4%的份额,位居全球第二。

(二)科大讯飞

科大讯飞是从事智能语音技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级重点软件企业和创新型企业,拥有语音及语言信息处理国家工程实验室、国家级企业技术中心、国家博士后科研工作站等荣誉称号。科大讯飞是我国智能语音与人工智能产业的龙头企业之一,在语音合成、语音识别、口语评测、自然语言处理等多项技术拥有国际领先的成果,其产品占据中文语音识别服务市场70%的份额,在专业领域的应用更是占到80%的市场份额。

在业务布局方面,科大讯飞持续推进“平台+赛道”的人工智能战略,推出了国内首个以智能语音和人机交互为核心的人工智能开放平台,为移动互联网、智能硬件的广大创业开发者和海量用户提供人工智能开发与服务能力,围绕人工智能开放平台积极构建产业生态。在“赛道”上,把握垂直入口或行业的刚需,在教育、政法、智能汽车等领域实现了规模应用。2018年,科大讯飞实现营业收入79.17亿元,同比增长45.41%,净利润达5.42亿元。

(三)思必驰

思必驰是国内拥有全套语音类知识产权的公司,在语音识别、语义理解、声纹识别、对话管理、音频分析等方面均有深厚技术积累,是国际上极少数拥有自主产权、中英文综合语音技术的公司之一。2017年9月,思必驰对外发布了DUI语音交互开放平台,把语音相关技术整合成AIOS人机对话操作系统,作为安卓系统之上的一层标准接口,提供给硬件合作伙伴。同时针对不同场景,AIOS分成了不同版本,针对车载、家居、机器人等产品做垂直领域下的对话式交互。

在产业生态构建上,思必驰主要依托自身语音交互技术优势,面向车载、家居、机器人等垂直领域,为互联网企业、智能硬件企业提供语音交互技术解决方案。其中,在车载方向,思必驰在车载后装市场占有率已达到行业第一,并逐步向前装市场延伸,与一汽、长城、大众、海马、小鹏汽车等十余个车厂企业建立合作关系;在智能家居方向,思必驰的技术被应用于猫精灵X1/M1、腾讯听听、小米小爱同学、联想智能音箱等多款知名产品,在音箱市场占有率行业第一;在家用机器人、儿童故事机等领域,思必驰已与浙江大华、步步高等企业建立合作关系。同时,思必驰通过DUI开放平台,面向开发者提供完整的智能对话交互方案,支持快速自定义开发,打造开放的生态圈。

(四)声智科技

声智科技成立于2016年5月,是全球领先的远场智能交互系统提供商之一,主要面向智能家居、智能汽车、智能会议、智能安防、智能金融、智能教育、智能医疗、智能法院、智能交通和机器人等行业领域,为客户提供麦克风阵列芯片与模组以及智能网关/机顶盒、智能电视、智能车机、智能手机、智能玩具等技术解决方案。

在产业生态构建方面,声智科技主要依托自身远场交互技术,为互联网企业、智能硬件等客户提供应用解决方案,同时发布了AZERO远程智能交互平台,连接相关智能终端产品,为终端客户提供更多的功能服务。目前声智科技已与小米、百度、阿里、华为、腾讯、中国移动、联想、创维、金蝶、浪潮、国美等龙头企业建立合作关系,小易精灵带屏智能音箱、百度小度智能音箱、华为AI音箱、联想MINI智能音箱、国美智能音箱GOMEPOD等产品均使用了声智科技远场语音交互方案。

智能语音产业发展前景

(一)市场需求助力产业拓展

5G通信技术高速率、大带宽、低时延、高可靠、海量连接的特性加速了“万物互联”时代发展,有效激发了智能语音进入更多应用场景,为语音识别与语义识别提供更大的数据量和更有利的数据环境,从而横向衍生出更丰富的功能和产品。智能语音应用在智能手机、平板电脑等移动智能终端的普及,移动互联网用户中使用智能语音的数量正大幅增长。在金融、电信、教育、医疗、轨道交通等垂直领域,智能语音技术和产品的应用正快速发展,实现从辅助技术手段向关键应用的发展。智能语音产业规模持续快速增长,预测2019年国内智能语音市场规模破2000亿元大关。

(二)政策利好推动行业发展

我国利好政策持续推动智能语音行业的发展。早在2017年11月5日,科技部召开《新一轮人工智能发展规划》暨重大科技项目启动会,会上宣布了首批四家国家新一代人工智能开放创新平台名单,明确依托科大讯飞建设智能语音国家新一代人工智能开放创新平台。2018年3月5日,国务院总理李克强在十三届全国人大一次会议政府工作报告时表示,要加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进“互联网+”,“人工智能”再次被写入政府工作报告。随着人工智能上升到国家战略地位,智能语音作为其基础,未来发展也将受益。

(三)智能家居场景带来机遇

2018年全球智能家居市场出货量约为6.56亿台,其中,中国市场累计出货近1.5亿台,同比增长36.7%。智能音箱等单品的爆发、语音交互的普及以及智能平台的崛起,将促使消费者购买更多的智能家居设备,智能家居产品和服务可用性也会明显增加,全球智能家居市场将持续快速增长。在人工智能快速发展的环境下,语音已经成为智能家居产品的重要环节。2018年,中国智能家居设备市场语音助手搭载率达到28.6%,同比增长177.6%。

(四)科技巨头纷纷开展布局

在语音生态方面,百度宣布语音识别技术及能力全面开放。腾讯、搜狗语音开放平台相继上线。在语音技术应用方面,各大厂商对家居、车载、可穿戴等环节的关注明显升温。智能家居领域,百度发布了Baiduihome,阿里联合智能家电厂商推出天猫魔盒,搜狗联手魅族发布了魅族电视盒子。智能车载领域,百度分别推出了手机智能互联产品Carlife、私有云服务平台MyCar和智能行车助手CoDriver。阿里云和上汽合作推出车载操作系统,腾讯发布了路宝App+路宝盒子,可与腾讯云连接,以实现车辆诊断、油耗分析、车友社交等功能。搜狗则和四维图新合作,推出飞歌导航。可穿戴领域,百度采取扶持外部产品,内置百度服务,形成开放生态思路,分别推出inside智能硬件平台、基于健康云的Dulife智能健康平台等应用,以吸引硬件厂商加入。

智能语音行业发展痛点

(一)人才欠缺,创新成效低

智能语音和人工智能技术产业化趋势愈发明显,国内外知名IT企业纷纷加大对智能语音业务的投入,不仅加剧了语音技术的国际竞争,也增大了语音技术人才需求缺口。在风险投资的追捧下,人工智能领域高端人才离职创业数量增多,近年来微软、百度、阿里、腾讯、IBM、英特尔中国等都出现了研究院院长等核心人才离职创业的现象。同时由于国内智能语音及人工智能行业的特殊性、高水平科研人才的稀缺性以及人才培养的滞后性,智能语音和人工智能人才将面临持续短缺,吸引和培养高水平人才队伍的力度不足,智能语音行业今后发展存在潜在风险。

(二)重点关键技术有待突破

从智能语音技术发展来看,当前语音合成技术已经较为成熟,合成清晰度和自然度已经达到较高水平,但是语音识别技术仍有许多需要提升的技术难点。目前大部分语音识别的研究和应用,主要是基于英语、汉语、阿拉伯语和法语等大语种,而世界上一共有6900多种语言,快速实现一套基于任何语言的语言识别系统是非常困难的。

(三)语音交互平台“各自为政”

目前各个语音交互开放平台各自为政,相关真实数据训练彼此分散,在语义理解和图谱识别等认知技术方面也尚未形成通用的技术框架,智能手机、智能可穿戴设备、智能音箱、智能电视等不同产品类型、不同品牌间语音交互技术不统一,影响用户使用体验,不利于构建融合、开放的智能终端应用生态,制约语音交互市场和产业发展。

我市智能语音发展建议

(一)构建产业生态圈

加快推进智能语音应用平台布局,引导和支持已落户的科大讯飞联合百度、腾讯、思必驰等智能语音公司,在渝搭建开放共享平台,统一开发者和用户入口,为智能音箱、智能家电、智能可穿戴设备等不同类型、不同品牌的智能产品用户提供统一的平台入口和功能服务,构建智能应用生态圈。鼓励欧珀、维沃、传音、美的、海尔等本地智能手机厂商、智能家电厂商加强与统一开放平台的合作,植入智能语音技术与服务,推进产品提档升级。

(二)加强公共平台建设

整合大数据资源,建立支持智能语音产业发展的基础数据,引导建设基于语音的海量训练资源库和标准测试数据集。通过新建或协议使用等方式,引导建设满足深度学习等智能计算需求的国家超级计算中心、新型计算集群共享平台、云端智能分析处理服务系统、智能系统安全服务平台等基础资源平台,降低人工智能创新成本。鼓励和支持现有众创空间等创新孵化平台加大对智能语音项目的培育。

(三)加强技术创新

研究制定专项政策,下大力引进培育5G、智能语音等关键技术研究、产品开发、应用创新等方面的人才或研发团队。推动产业链各方加强深度协作,推动智能语音交互、智能可穿戴设备、智能服务机器人、材料及系统的关键技术突破和成果转化。鼓励企业离岸创新,将境外智能语音技术形成创新成果后在园区实现产业化。加强与本地高校联动,合力制定语言学和人工智能交叉的复合型人才联合培养计划,推动人才引进与培养。

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐