1. 产品简介

1.1 背景介绍

本项目是面向汽车行业B端客户的大模型能力展示Demo,旨在通过智能车机交互场景,全方位展现模型在车载场景的优越性能与商业价值。

1.2 核心功能

功能主要包括基础语义理解及增强,端侧语义支持:车控、导航、音乐、电话、全局垂域的全意图。

2. 语音助手核心交互

2.1 核心交互流程

其中:中断关闭的意思是关闭的优先级是最高的,无论是处于唤醒、思考还是执行指令状态,用户下达关闭指令后关闭立刻停止交互。

2.2 整体界面

本Demo的整体界面如下图所示:

1.左侧为车况显示界面,固定不变。

2.右侧为语音助手交互部分,主要包括聊天内容、状态反馈两个区域。

3.底部为车内高频使用的控制功能按键(对应着以前车内的实体按键)。

2.3 形象

语音助手在不同状态下应具备不同形象:

其他参考:三星语音助手形象

2.4 唤醒

唤醒主要有两种方案:

1.(首选)用户通过点击唤醒按钮进行唤醒。

2.  通过特定语音唤醒。

唤醒后语音助手切换对应的形象,并在聊天内容显示特定的交互提示词,引导用户进行进一步语音指令的输入。

2.5 等待

等待模型输出时,语音助手需切换对应的形象,体现出“思考中”的状态。

2.6 关闭

2.6.1 交互内容关闭

关闭的优先级是最高的,无论是处于唤醒、思考还是执行指令状态,用户下达关闭指令后关闭立刻停止交互。

关闭同时使用以下两种方案:

1.  点击拟人形象关闭。

2.  在交互内容区域添加特定的关闭按钮。

2.6.2 状态反馈关闭

关闭主要有两种方案:

1.  滑动状态反馈区域弹出的卡片关闭。

2.  在状态反馈区域添加特定的关闭按钮。

3. 功能模块详细交互

功能模块主要针对车控、音乐、电话、导航、全局五个方面进行设计,在Demo中只选取核心的功能点进行展示

3.1 车控功能

展示功能点列表:

大意图
功能描述
空调类
打开空调
关闭空调
车窗类
打开<位置>车窗
灯光类
打开氛围灯
关闭氛围灯
座椅类
 
打开座椅通风
关闭座椅通风
背门类
打开背门
关闭背门

3.1.1 已有按键的功能

由于界面底部已经设计好一些车内高频使用的控制功能按键,所以这些功能点的交互状态不必在状态反馈区域展示。

功能点包括:空调类,座椅类。展示方式举例:

座椅类 –> 打开座椅通风

转变对应按键形态,同时根据模型输出在交互内容区域展示流式文本。

3.1.2 其他功能

对于界面底部没有的功能,需要在状态反馈区域以卡片形式展现。

功能点包括:车窗类、灯光类、背门类。展示方式举例:

背门类 –> 打开背门

在状态反馈区域弹出动效或卡片进行展示,同时根据模型输出在交互内容区域展示流式文本。

3.2 音乐功能

展示功能点列表:

大意图
功能描述
音乐类
播放音乐
关闭音乐

交互时跳转对应音乐App界面,并点亮底部音乐对应按键。同时根据模型输出在交互内容区域展示流式文本。

3.3 电话功能

展示功能点列表:

大意图
功能描述
电话类
拨打电话
挂断电话

交互时跳转对应通话App界面(或直接弹出拨号窗口),并点亮底部通话对应按键。同时根据模型输出在交互内容区域展示流式文本。

参考 3.2 音乐功能。

3.4 导航功能

展示功能点列表:

大意图
功能描述
导航类
开始导航

交互时跳转对应导航App界面。同时根据模型输出在交互内容区域展示流式文本。

3.5 全局功能

展示功能点列表:

大意图
功能描述
全局类
打开<应用>
关闭<应用>

交互时跳转对应App界面(这里的“App界面”主要是指汽车桌面或应用列表)。同时根据模型输出在交互内容区域展示流式文本。

可参考华为的汽车桌面和应用列;

3.6 兜底回复功能

3.6.1 其他指令回复

对于未在展示功能点列表中提及的用户输入,需设计兜底回复功能。

首先需要在状态反馈区域弹出“xx指令完成”相关的卡片(指令来源需和后端确认)。

同时根据模型输出在交互内容区域展示流式文本。

3.6.2 异常状态回复

可能存在大模型生成时间较长、生成失败情况等异常状态,采取以下措施处理:

1.  超过 20 秒未返回则提示用户失败,可重新发起新一轮对话,回复语为“这个话题把我卡住了,我们换个话题吧”;

2.  如果出现生成失败的情况,回复用户“我运转超负荷了,稍后再试吧”;

3.  当大模型未反馈结果或命中敏感词策略,则回复“我们换个话题聊聊”。