对话式AI操作系统架构(学习心得)
什么是对话式操作系统以智能IoT设备(如智能音箱)为依托平台的操作系统在这个操作系统上,开发者可以进行应用程序的开发对话式操作系统的请求流程以百度的DuerOS为例:用户发出语音指令智能音箱收集音频流语音识别,将语音转化为文本文本请求在系统内转化为请求指令,发送给对应的应用服务应用服务处理请求,生成回复语音合成,将应用服务的回复结果以音频形式输出与传统web服务的区...
·
什么是对话式操作系统
- 以智能IoT设备(如智能音箱)为依托平台的操作系统
- 在这个操作系统上,开发者可以进行应用程序的开发
对话式操作系统的请求流程
以百度的DuerOS为例:
- 用户发出语音指令
- 智能音箱收集音频流
- 语音识别,将语音转化为文本
- 文本请求在系统内转化为请求指令,发送给对应的应用服务
- 应用服务处理请求,生成回复
- 语音合成,将应用服务的回复结果以音频形式输出
与传统web服务的区别
键盘和鼠标对浏览器进行输入操作,网站对输入的指令进行回复。
对话式操作系统中的技能服务,就类似于浏览器中的不同功能网站,也类似于手机操作系统上的各种APP。
对话式操作系统的相关思考
- 需要以AI技术为基础,理解人类的语言指令
- 交互形式和传统的屏幕交互差别很大
- 应用层技能服务的反馈形式也需要是语音形式,而不是传统的在屏幕画面上显示
- 在流程设计上,为了能让应用的步骤清晰,需要设计者做对应的安排(比如遇到网络延迟和处理中的情况,用户没有屏幕看在缓冲中,那怎么让客户知道应该等待下去)
- 人类是视觉动物,如何让对话式的交互可以更好的为人接受将是一个很大的挑战
- 应用服务的切换和并行处理也将是值得思考的方面
更多推荐
已为社区贡献1条内容
所有评论(0)