车载语音进入“后普及时代”，谁能“笑到最后”

车载语音交互市场正在呈现出多元化的发展趋势，本地+云端、自然语言理解、多元化内容及服务生态都在持续快速升级。高工智能汽车研究院监测数据显示，2020年国内新车（合资+自主品牌）前装搭载语音识别及交互功能上险量为1206.4万辆，同比增长17.88%。车载语音已成为汽车继中控屏外的第二交互手段。在前装搭载率方面，去年语音识别及交互功能前装标配搭载率从2019年的49.82%提升至63.25%。而今年

高工智能汽车

848人浏览 · 2021-08-19 13:45:13

高工智能汽车 · 2021-08-19 13:45:13 发布

车载语音交互市场正在呈现出多元化的发展趋势，本地+云端、自然语言理解、多元化内容及服务生态都在持续快速升级。

高工智能汽车研究院监测数据显示，2020年国内新车（合资+自主品牌）前装搭载语音识别及交互功能上险量为1206.4万辆，同比增长17.88%。车载语音已成为汽车继中控屏外的第二交互手段。

在前装搭载率方面，去年语音识别及交互功能前装标配搭载率从2019年的49.82%提升至63.25%。而今年1-6月，这个数字继续提升至68.01%。

此外，一批头部汽车制造商正在加快语音交互与智能座舱的深度融合，并视为改善驾驶体验的新机会。传统的语音识别功能，也被升级为智能语音助手。

在高工智能汽车研究院看来，未来的语音助手前装方案将呈现两种主流路线：

其一，一线头部品牌将倾向于打造自有的交互平台，并融合多家供应商技术引擎；其二，一二线主打性价比市场的车型，则倾向于选择可以提供高性价比的整体解决方案（引擎+内容+服务生态）的供应商。

车载语音进入“后普及时代”，谁能“笑到最后”

新势力掀起自研浪潮

其中，第一种路线仅有个别头部厂商的落地案例，却是大势所趋。

例如，小鹏P7于去年推送的Xmart OS 2.1.0升级版本包含了一项重要功能：全场景语音车载系统。用户从此可将语音操控从车机延伸至整台车。

而该交互系统除了底层技术由思必驰提供，其他的大部分功能，包括语音交互的框架搭建，都依靠小鹏的团队自研完成，实现了从单一语音功能到平台的升级。如此，小鹏汽车也成为了首家自主集成语音交互的车企。

在整个生产链条中，小鹏汽车除了本身的主机厂的角色外，既包括了一部分技术供应商，又相当于一个系统集成商。从产业层面，为其他新势力主机厂提升用户体验提供了新的合作思路。

“主机厂对于整车的理解力高于供应商，所以它可以打造自己的专有知识域。在这个域里提供语音服务的话质量会更高。而这种语音研发模式也是未来的主流趋势。”业内人士表示。

在该模式中，主机厂需要自上而下重新定义汽车屏幕、按键、操作系统、上层应用，甚至车内各类ECU的功能，且包含开放可定制的特征；语音的交互框架需要具备足够的鲁棒性，实现真正的“好用”；整个团队则需要达成一致目标，完成诸多细致功能。

与此前大多数车企配备的语音助手不同的是，后者基本以车上的应用为前提，再将部分的应用赋予语音控制能力。而小鹏汽车的全场景语音系统则将语音能力放在车辆的每一个应用中，实现在车内通过语音来控制所有的场景。

供应商模式转型

从整体的功能设计来看，多数车企热衷于狂砸资金，向不同的供应商购买他们的产品及功能。事实上，这种依靠长期“购买”的方式到达一定阶段后，导致的必然结果便是车企之间的产品同质化问题日趋严重，从而影响自身的竞争力。

正如小鹏汽车董事长何小鹏说的那样，只有坚持“深度全栈自研”，才能真正做出差异化。

从总体上看，以小鹏、理想、蔚来等为代表的新势力品牌基本都趋向了自研的模式，且自研比例在持续提高。其中，小鹏建立了独立的语音框架，同时也通过语音产品塑造了鲜明的品牌个性。

语音框架是主机厂打造差异化产品的重要利器。可以更灵活地定制各种不同的功能，拥有不受制于供应商的开放能力。例如，暂时抛开车企对于安全边界的界定，小鹏可以在最新升级的Xmart OS 2.6.0版本中，通过开放接口来自行定义语音能力，增加了用语音控制车辆变道等新功能。

理想汽车则可通过多音区交互技术实现 4 路人声分离与 6 路音区检测，并完成人声定位、降噪、回声消除等功能。准确判断座舱内不同人发声的空间位置，突出其“家庭座舱”的功能定位。

蔚来汽车将语音融入了辅助驾驶，同时， NOMI 的一整套情感引擎连接了车辆的底层网关、车机、NOMI 屏幕的电机驱动器等，实现了人机精确的情感表达，打造了差异化的品牌亮点。

针对新势力品牌，用户体验最直接的部分便是人机交互部分。所以对于主机厂而言，掌控基础的AI技术能力是增强其行业竞争力的不二法门。

接下来，以新势力主机厂为代表的行业头部玩家将会在基础技术方面投入更多的资源，控制几乎所有的核心技术，形成从设计、研发到生产的整体闭环。而这对于一直以来主打通用技术的供应商来说，将会是一盆狠狠泼下的冷水。

主机厂的自研趋势将成为市场中的一条鲶鱼，将语音供应商的竞争难度卷升至下一个指数级。

而过去语音供应商为主机厂提供“everything”的服务模式，也随着主机厂自主能力的增强而走上转型之路。

大众问问CEO张人杰表示，如果主机厂直接使用语音公司提供的技术，那么接下来在做跨垂类生态打通时将会遭遇很大的瓶颈。

由此，除了走自研路线的新势力品牌外，大众问问等头部供应商也正在由过去的服务输出转向能力输出，帮主机厂构建通用化、高定制的平台。

简单来说，这些头部供应商并非从底层操作系统着手研发，而是提供一个基础的框架平台，能够适配到各个不同的操作系统，最后通过语音来实现全链条的打通。

这样一来，供应商相当于帮助主机厂实现了AI能力的聚合，可以将各个领域最优秀的技术整合在一起，完成其个性化的私有部署，更好地赋能主机厂提升跨垂类生态打通的灵活度。

聚合能力是根本

在另一种趋势下，一部分供应商也在为传统品牌或主打性价比的车型提供包含引擎、内容、服务生态的整体解决方案。

而具备资源聚合能力仍然是其突出重围的关键所在。

于今年年初完成近亿元融资的极豆科技与微软合作，推出的MicroBean语音助手，基于微软Azure AI、Azure Bot Service、及Azure Bot Service开发，结合极豆车主资源J-Service 服务平台，将智能车载系统同云端服务深度结合，向车主提供用车服务、生活服务、出行服务、资讯服务等丰富的场景服务。

其中，Azure机器人服务框架整合集成了Speech语音唤醒、识别、合成，LUIS自然语义理解，自定义意图，QnA知识库等能力。

张人杰表示，“谷歌、微软等头部厂商的AI底层实力都很强，其知识域的广度优于其他企业。所以未来理想的合作方式是这些超大型的厂商负责最基础的AI能力，而语音或集成厂商会将这些能力加以整合，着力汽车专有域AI的开发，并在此基础上根据主机厂的需求进行私有化的部署。”

原因是，目前多数车型搭载的语音助手只掌握了汽车的专有知识域：比如语音怎么开启，冷冻液在哪等，但并不知道爱因斯坦是谁。而用户对于智能汽车的要求是语音并不仅限于汽车里的东西，这对于语音厂商来说便是一个巨大的挑战。

相比之下，微软等巨头厂商所掌握的知识域的广度远超专有域，但缺乏做聚合的经验，也缺少垂直场景落地的案例。

而只有汽车的专有域与通用知识域相互融合，才能做出真正“好用”的车载语音。张人杰强调，除了知识广度外，域之间还要将数据打通，才能实现畅通无阻的智能。“未来是一个数据业务化，业务数据化的时代。语音厂商必须具备将不同垂直领域数据打通的能力，实现生态聚合。这也是未来必然的趋势。”

极豆科技相关负责人表示，车载语音依然处于初期阶段，且大多数语音公司的业务中心局限于基础功能的研发，鲜有具备资源聚合能力的公司。

而从另一个角度来看，多数供应商的主要策略为，尽可能地降低成本，服务更多的OEM。其产品特征为高度标准化，方案统一，但在灵活性与可定制化方面略有欠缺。同时，其收费方式多以传统的License模式为主。整体采取一次性收费的方式，每辆车的搭载均价约为100元左右。

这种收费方式也大概可以说明，语音厂商目前的服务方仍然只是主机厂，并未将消费者的体验纳入服务范畴。而正由于成本低廉，多数产品的体验也可想而知。

不过，Cerence公司表示，未来业界将会逐步向SaaS的收费模式转换。

该模式可为车厂提供高可用性、高可配置性、功能服务的高扩展性，用于组合出各种销售模式提供给最终用户。用户完全可以根据自己的需要进行按需选购。

只有发展至彼时，车载语音才会真正服务于用户。

据《高工智能汽车》的调研数据，2021年上半年，智能座舱100％前装标配的只有特斯拉、理想和蔚来三个品牌。其余品牌的搭载率平均只有13.86%，这也从侧面表明，语音市场的扩展仍有很大空间。