1. 产品简介
1.1 背景介绍
本项目是面向汽车行业B端客户的大模型能力展示Demo,旨在通过智能车机交互场景,全方位展现模型在车载场景的优越性能与商业价值。
1.2 核心功能
功能主要包括基础语义理解及增强,端侧语义支持:车控、导航、音乐、电话、全局垂域的全意图。
2. 语音助手核心交互
2.1 核心交互流程

其中:中断关闭的意思是关闭的优先级是最高的,无论是处于唤醒、思考还是执行指令状态,用户下达关闭指令后关闭立刻停止交互。
2.2 整体界面
理想同学的设计参见:解锁理想汽车 AI 密码:革新智能座舱,引领驾驶未来
本Demo的整体界面如下图所示:

1.左侧为车况显示界面,固定不变。
2.右侧为语音助手交互部分,主要包括聊天内容、状态反馈两个区域。
- 交互内容:(输入源于用户,输出源于模型,需进行前后端联调,具体内容待定)。该区域主要包括语音助手拟人形象以及交互的内容(流式文本展示);
- 状态反馈:初始化不显示该区域,在用户输入某些指令后出现。该区域内容与对话内容所在场景对应,例如用户说“查一下天气”,则出现状态反馈区域,显示对应的卡片;
- 唤醒按钮:点击音助手拟人形象即可实现唤醒。

3.底部为车内高频使用的控制功能按键(对应着以前车内的实体按键)。
2.3 形象
语音助手在不同状态下应具备不同形象:
- 刚唤醒状态
- 思考(等待输出)状态
- 输出状态
- 异常状态

其他参考:三星语音助手形象
2.4 唤醒
唤醒主要有两种方案:
1.(首选)用户通过点击唤醒按钮进行唤醒。
2. 通过特定语音唤醒。
唤醒后语音助手切换对应的形象,并在聊天内容显示特定的交互提示词,引导用户进行进一步语音指令的输入。
2.5 等待
等待模型输出时,语音助手需切换对应的形象,体现出“思考中”的状态。
2.6 关闭
2.6.1 交互内容关闭
关闭的优先级是最高的,无论是处于唤醒、思考还是执行指令状态,用户下达关闭指令后关闭立刻停止交互。
关闭同时使用以下两种方案:
1. 点击拟人形象关闭。
2. 在交互内容区域添加特定的关闭按钮。
2.6.2 状态反馈关闭
关闭主要有两种方案:
1. 滑动状态反馈区域弹出的卡片关闭。
2. 在状态反馈区域添加特定的关闭按钮。
3. 功能模块详细交互
功能模块主要针对车控、音乐、电话、导航、全局五个方面进行设计,在Demo中只选取核心的功能点进行展示

3.1 车控功能
展示功能点列表:
大意图 | 功能描述 |
---|---|
空调类 | 打开空调 |
关闭空调 | |
车窗类 | 打开<位置>车窗 |
灯光类 | 打开氛围灯 |
关闭氛围灯 | |
座椅类 | 打开座椅通风 |
关闭座椅通风 | |
背门类 | 打开背门 |
关闭背门 |
3.1.1 已有按键的功能
由于界面底部已经设计好一些车内高频使用的控制功能按键,所以这些功能点的交互状态不必在状态反馈区域展示。
功能点包括:空调类,座椅类。展示方式举例:
座椅类 –> 打开座椅通风

转变对应按键形态,同时根据模型输出在交互内容区域展示流式文本。
3.1.2 其他功能
对于界面底部没有的功能,需要在状态反馈区域以卡片形式展现。

功能点包括:车窗类、灯光类、背门类。展示方式举例:
背门类 –> 打开背门

在状态反馈区域弹出动效或卡片进行展示,同时根据模型输出在交互内容区域展示流式文本。
3.2 音乐功能
展示功能点列表:
大意图 | 功能描述 |
---|---|
音乐类 | 播放音乐 |
关闭音乐 |
交互时跳转对应音乐App界面,并点亮底部音乐对应按键。同时根据模型输出在交互内容区域展示流式文本。

3.3 电话功能
展示功能点列表:
大意图 | 功能描述 |
---|---|
电话类 | 拨打电话 |
挂断电话 |
交互时跳转对应通话App界面(或直接弹出拨号窗口),并点亮底部通话对应按键。同时根据模型输出在交互内容区域展示流式文本。
参考 3.2 音乐功能。
3.4 导航功能
展示功能点列表:
大意图 | 功能描述 |
---|---|
导航类 | 开始导航 |
交互时跳转对应导航App界面。同时根据模型输出在交互内容区域展示流式文本。
3.5 全局功能
展示功能点列表:
大意图 | 功能描述 |
---|---|
全局类 | 打开<应用> |
关闭<应用> |
交互时跳转对应App界面(这里的“App界面”主要是指汽车桌面或应用列表)。同时根据模型输出在交互内容区域展示流式文本。
可参考华为的汽车桌面和应用列;

3.6 兜底回复功能
3.6.1 其他指令回复
对于未在展示功能点列表中提及的用户输入,需设计兜底回复功能。
首先需要在状态反馈区域弹出“xx指令完成”相关的卡片(指令来源需和后端确认)。
同时根据模型输出在交互内容区域展示流式文本。
3.6.2 异常状态回复
可能存在大模型生成时间较长、生成失败情况等异常状态,采取以下措施处理:
1. 超过 20 秒未返回则提示用户失败,可重新发起新一轮对话,回复语为“这个话题把我卡住了,我们换个话题吧”;
2. 如果出现生成失败的情况,回复用户“我运转超负荷了,稍后再试吧”;
3. 当大模型未反馈结果或命中敏感词策略,则回复“我们换个话题聊聊”。
Comments NOTHING