1. 前言

1.1 背景

近期正在开发我们自己的车机系统Demo,需并针对目前市场上领先的车机产品进行调研,以获取第一手的用户体验和技术反馈。为了更好地理解现有车机系统的功能、用户交互设计,对“蔚小理”(蔚来、小鹏、理想)三大车企的车机系统进行了线下体验。

1.2 体验车型

理想:L9/MEGA

蔚来:eT7/eS6

小鹏:G9

 由于蔚小理的车机功能具有高度的重复性,所以下文主要以理想的车机为主。而蔚来和小鹏只有差异化的设计会单独分析。

2. 屏幕设计

2.1 前排屏外观

理想中控屏采用目前市场主流的(特斯拉、小米、问界等几乎都是横屏)横屏设计,并在右侧加上了一块副驾的娱乐屏。反观蔚来中控屏尺寸较小,且采用不那么常见的竖屏设计。

从蔚来顾问那里了解到,蔚来车机设计时安全性的权重较大,较小中控屏的初衷是想减小屏幕对于主驾驶的影响。而采用竖屏是沿用了手机的竖屏模式,可以保留用户在手机上的操作习惯。

除此之外,竖屏可以完美适配导航的信息展示,不必像其他车机的中控再切分其他导航界面,可以将导航界面铺满全屏。

而弊端就是除了导航之外的交互体验都极差,无论是娱乐还是查询信息,竖屏的设计对主驾和副驾都不是很友好。所以蔚来的交互高度依赖语音,中控屏几乎完全为导服务(驾驶场景)。

而从小鹏的两款车型G9和P7+也能看出来,中控屏幕的外观设计需要考虑到车型定位以及车型用户画像。

车型
小鹏G9
小鹏P7+
用户画像
主要为30-50岁的男性,家庭年收入在35万元以上,可能已有燃油车,倾向于增购或置换为新能源SUV。他们对车辆的豪华感和家庭适用性有较高要求。
多为追求性价比的消费者,可能是年轻的单身人士或作为家庭的第二辆车。他们更关注车辆的实用性、性能和智能化程度,对空间和豪华配置的需求相对较低。

G9定位是家庭的SUV,核心用户是已婚且有孩子的男主人,但是用户(乘客)还包括女主人和孩子。因此除了考虑驾驶员的体验,还要考虑家庭用车场景下乘客的用车体验。在此场景下,娱乐功能就是必不可少的,尤其是播放视频(女主人的需求)。此外,车辆增加屏幕的成本并不高,但它却能给这辆车带来一定的溢价和利润空间,并让整个座舱更科技感与豪华感,这也与车型定位一致。

P7+定位是AI智驾掀背轿跑,核心用户是单身人士。因此车辆的驾驶体验就极为重要,对于一些较低频(娱乐)的功能体验感就没有那么重要。除此之外,年轻人对价格较为敏感,所以P7+在配置上更注重实际使用频率高的功能,如座椅通风、加热和按摩等,而未配备副驾驶娱乐屏。

(ps:极越的屏幕设计的也是独具特色,科幻风。不过百度的产品设计一直都挺与众不同的)

2.2 中控屏桌面

中控屏作为车机交互的核心,桌面的布局和内容十分重要。中控屏既需要承担传统车机的部分物理按键功能,还需要承担最重要的导航功能以及大部分娱乐功能。大部分网页或应用来说,用户使用频率越高的功能交互成本应该越低,车机界面也是如此,所以桌面需要放哪些控件、卡片,就需要根据用户的用车习惯进行设计。

交互成本:用户在网站或应用中为了完成目标而产生的费力度总和,包括心智与肢体操作两个方面。 举个例子,微信点赞的交互成本要高于QQ点赞。

接下来以理想的中控桌面布局为样例进行分析:

状态栏除了显示车辆指示灯与警告灯等信息,还融入了时间、网络信号、车外温度等手机状态栏中常见的信息,使用户能有一种熟悉感。

值得一提的是,状态栏中的部分图标支持点击操作,用户点击后会弹出相应的提示信息或操作界面。这种多入口设计更符合用户心智,也方便操作。

除此之外,新弹出的操作界面也是一个二次确认。既能防止用户误触,也能提示下一步会发生什么。例如,用户点击状态栏中的“sos”图标后,会弹出紧急呼救的卡片,而不是直接拨打电话(若安全气囊弹出,则会直接拨打电话)。

环境感知信息区域在驾驶时显示车辆状态、驾驶信息、提示信息、道路及车辆周边画面。

当车辆处于 P 挡时,显示车控图标,点击可解锁油箱盖、开启后备厢门和充电口盖。

之所以这么做是因为驾驶员在“驾驶”和“停车”两个场景下的需求是不一样的,以档位作为切换开关可以适应驾驶员的不同需求,同时提高了界面使用效率。(该设计在大多数车机系统中都被采用,小米甚至将整个界面都采用了)

此外,驾驶员还可通过点击该区域,扩展换面展示更多信息,如路标、停车灯、障碍物等

 这里有一个重复设计(一个界面内有多个入口指向相同的功能)。

 一般来说,重复设计违反了效率、用户预期的原则,让用户拉高转化的成本,理想这么做的原因可能如下:

 1.  汽车场景下,用户除了主驾还有副驾,两个区域的图标倾向于让两位不同的用户使用;

 2.  由于分区设计原则,加油、充放电功能应位于右半区(非黄金注意区域),但这些功能又是(停车场景下)驾驶员的高频需求,因此放到了P挡下的环境感知区域内。

环境感知信息区域是驾驶员的黄金注意区域,在设计时应该将驾驶员的高频需求放入该区域。

媒体卡片用于展示和承接中控屏和副驾娱乐屏多媒体播放状态,包括音乐、视频、拨号等,方便主驾用户快速控制功放媒体的播放状态(▶️ ⏩️)。媒体卡片也是驾驶员的高频需求之一,因此设计时要布局在驾驶员的黄金注意区域。

底部功能栏采用分区设计,左边区域包含回到主页,导航,设置等常用入口;右边区域包含锁车,空调,座椅等传统车机实体按键的功能。

底部功能栏是固定不动的,所以放置的都是最基础、最常用的一些功能,方便用户在任何情况下都能第一时间调用这些功能。

同时,在调用后,对应图标也会通过外观、颜色等转变作为调用成功的反馈。

特别的,对于一些“程度可控”的功能,应该弹出对应的卡片便于用户进行调节。如图是温度调节的卡片:

3. 语音助手

3.1 形象

“蔚小理”三家的语音助手虽然都采用了拟人化设计,但形象却各有特色。

理想的语音助手“理想同学”设计元素非常简洁,但在添加了多样的动作和表情变化后,朴素却显得活泼、贴心,使用户(特别是小孩)更容易产生一种亲切感和归属感。

蔚来的语音助手“NOMI”采用独树一帜的实体形象,确实是一把双刃剑。优点是可以提升用户情感体验,并实现诸如旋转之类的操作;缺点是增加了成本(研发成本高,故障率也高),并会带来潜在的分心等安全隐患。但从结果上看,NOMI已经成为了蔚来的灵魂,对蔚来来说的确是利大于弊。

小鹏的语音助手“小P”采用科幻风的机器人形象,强调智能性和技术先进性,设计语言更科技感十足,且互动形式更加简洁直观。小P也是针对技术爱好者、年轻消费者,尤其注重智能车机体验的用户设计的,但在细节优化方面要略逊色于另外两家。

不难看出,语音助手的形象高度匹配核心用户的风格,所以不存在一个普适性的形象,还是需要根据核心用户的用户画像进行针对性的设计。

3.2 唤醒

语音助手的唤醒方式主要有两种,这里以理想同学为例介绍。

1.  语音唤醒

通过固定的语音唤醒是语音助手最常见的唤醒方式,,也是语音助手的标配。对于理想的车机,说出“理想同学”即可唤醒(唤醒指令也可自定义)。唤醒后,通过语音回答和视觉形象两种方式给予用户唤醒成功的反馈。

2.  按键唤醒

除了语音唤醒之外,使用实体按键作为备选(兜底)方案也是必不可少的。对于理想的车机,向上拨动方向盘左键即可唤醒。实体按键的置信度较高,增加该功能可以用较低的成本提高用户的信任感,此外也更方便主驾进行控制,同时也满足了一些年长用户的偏好。

3.3 特色交互

3.3.1 免唤醒交互

理想同学可以支持不唤醒就直接说出指令。但该功能的局限性在于只支持部分特定的指令,并非所有指令都能执行。此外,了解到在理想车机中,免唤醒交互属于还在测试阶段的功能,因此效果还会持续优化。就体验效果来说,该功能暂时没有“一气呵成”好用。

与免唤醒搭配的功能是“语义拒识”,即理想同学可以有效识别与 TA 的对话,不会打扰乘客间的聊天,避免误操作。

而目前这一套功能在车机上的使用率较低(试乘时顾问大部分时间都是用唤醒的方式输入指令),而想要提高使用率的核心是提高准确率和应答率。

3.3.2 多人识别交互

理想同学可以区分车内所有人的不同指令,并同时理解每个人说的话,并做出答复。同时,理想同学也会出现在最近的屏幕上,对用户进行视觉上的反馈。

在体验的时候,多人识别是基于位置的,而不是声纹。而且和后续介绍的“随时打断”功能一样,灵敏度不够。(但是理想同学也支持声纹识别,并且可以在设置中启用“锁定唤醒人”的功能)

这里所说的“理解”是需要考虑位置信息的(这是一个典型的针对用户兴奋型需求设计的功能)。举个例子:当用户说“打开车窗”的时候,需要正确开启离用户最近的车窗,而不是打开全车车窗。

3.3.3 一气呵成

用户可以将唤醒词连同指令一起说出,这样即可跳过理想同学对唤醒成功的反馈。例如:直接说:“理想同学打开设置”,就可以跳过唤醒环节直接让理想同学打开设置。

3.3.4 手势交互(理想独有)

理想同学可以通过 “指代指令” 和手势相结合,完成对舱内物体的控制(主要是通过识别食指指向执行相应操作,没有太多意图的识别)。例如:用户食指向上说:”打开它”, 理想同学会自动打开遮阳帘。

就目前版本来说,该功能局限性较大:

1.  目前仅支持控制遮阳帘和车窗

2.  极易受摄像头视野限制

当然,后排也有相应的摄像头。且为了保护用户隐私,都可以可以手动关闭。

3.3.5 其他能力

1.  方言问答:可以使用方言和理想同学进行对话,目前支持方言有:粤语、上海话、四川话、河南话、河北话、山东活、天津话、陕西话。

2.  连续对话:在一段时间内进行多次对话,不需要重复唤醒。

3.  打断对话:不需要等理想同学说完,就可开启新的对话。(该功能和连续对话是一套的)

4.  可见即可说:用户可以直接说屏幕上的按键文字,看见什么说什么。

5.  聆听等待:用户在说话停顿或者犹豫发问,理想同学不会打断。

3.4 关闭

理想同学主要有三种退出方式:

1.  通过语音指令“退出”或者类似表达来关闭理想同学;

2.  通过点击屏幕上理想同学的头像来关闭;

3.  通过方向盘上的按键进行关闭。这种情况下关闭方式和唤醒方式一致,即向上拨动方向盘左键。之所以不设计为向上开启,向下关闭其实是为了提高按键的使用效率。也就是说,控制的功能从2种变为了4种(向下可控制通话)。

4. 理想同学

目前的车机助手几乎都接入了大模型,如理想的Mind GPT,蔚来的NOM GPT。以大模型为核心的功能如语音车控,生活百科,GUI-Agent已经成为了目前智能座舱的核心卖点之一,同时也是本次调研的关注重点。由于蔚小理三家在这些功能上有较高的重叠,所以下文以理想同学为例进行介绍分析。

4.1 任务大师

用户使用一句话描述条件和预期结果,理想同学能够帮用户创建任务。

理想同学可以联动座椅、空调、导航等常用功能,通过AI来规划执行任务要求。

蔚小理三家都有适配任务大师的功能,但就完善程度来说理想>蔚来>小鹏。

任务大师这个功能初看有些鸡肋,在我对三家车企进行试乘过程中,没有任何一位顾问主动向我演示该功能。但出乎意料的是,用户的反馈以及热度都极高。

从理想app中帖子的热度来看(暂不考虑官方流量扶持),任务大师相关的帖子要高于其他的帖子,甚至高过了一些官方发帖。

因此,该功能至少是抓住了一些用户的需求:

1.  个性化定制

对C端产品来说,用户的需求千人千面,每个用户几乎都会有自己独有的且未被满足的需求。如果在设计功能的时候,将所有的需求都考虑进去,系统就会非常臃肿,并带来不好的体验,得不偿失。因此个性化定制的功能在大部分产品中都很常见,理想的任务大师功能也是个性化定制的一种。

任务大师允许用户根据自己的使用习惯和需求,创建个性化的任务。这种个性化的设置让用户感觉自己像是在定义自己的车辆,提供了一种自己做产品的体验。

2. 社区属性

除此之外,理想还将任务大师构建成了一个分享平台。用户可以在平台分享自己创作的任务,也可以快捷使用别人分享的任务。通过这种UGC的方式,使任务大师具有了一定的社区属性,将原本互不相识的车主们变成了车友,更容易留住用户。

UGC产品的难点在于找到第一批天使用户,但可以看到,已经有了很多实用的任务被分享出来。

4.2 用车助手

用车助手是用户高频使用的场景,也是整个理想同学功能的核心。功能主要分为询问和控制两种。

4.2.1 询问

询问功能主要是指用户可以通过该助手查询车辆状态(空气质量、温度等),询问用车问题,诊断车辆故障。

这是用户在用车过程中的需求之一,无论是紧急状况(脱困)下还是日常使用,相比于查询用户手册,用户更倾向于接受这种即问即答的方式。

该功能需要接入对应车型的知识库,针对特定车型进行回答。因此在设计用于展示的产品时,需要和特定车企达成合作。

4.2.2 控制

说到大模型语音助手,一定离不开语音控制的功能。这是用车场景下最高频的需求,也是在试乘过程中体验最频繁的功能。

功能主要包括车控、导航、媒体、通话四个场景(系统控制也算一个场景,但是比较依赖于免唤醒,且涵盖的指令较少,理想暂未将其分为一大类)。

在执行成功后,屏幕上的视觉反馈较少,更多是以语音播报的方式体现,这么设计的原因可能有以下几个:

1.  控制功能大部分是驾驶场景下主驾进行使用,因此用视觉展示不利于查看,且容易造成分心;

2.  大部分功能例如座椅按摩、空调、音乐等,都能明显的被感知。

但作为一个Demo来说,设计时还是应该使用视觉反馈为主,语音反馈为辅。因为人类的感知80%来源于视觉,而上述两个原因在Demo展示的场景下又都不成立。

4.3 出行助手

除了日常用车,出行也是一个高频场景,特别是对于理想的核心用户。

出行助手支持城市介绍、景点分类推荐、景点介绍和信息查询,还可以认直接发起导航、查询周边美食(需要将位置信息打开)。

出行助手和小红书、美团等都有适配。例如在查询完景点之后,可以在最后查看对应的小红书笔记;而美食查询就是基于美团(专属的车机版本,但不支持订餐)。

出行助手是一个高频和第三方应用交互的功能,对于demo来说,可以很好的展现模型GUI-Agent的能力。

对于“用手机”or“用车机”的问题,后续会提到。就订餐/点餐这个需求是不是伪需求,还是需要数据进行支撑。对于我个人而言,在“发现餐厅/美食–>选择餐厅–>导航到餐厅”的链路中,似乎还是缺少了“订餐/点餐”这一环,理想不做可能还是因为这个环节本就比较复杂,收益不高(或是模型能力还需优化)。但对于一个用户展示的demo,还是值得进一步考虑的。

4.4 百科老师

百科老师可以对用户输入的知识性、常识性问题进行回答,这也是大模型最原始的功能之一。

从回答不难看出,该功能面向的核心用户之一就是儿童,通过通俗易懂的解答来吸引孩子的交互兴趣。

这个功能对于熟悉大模型的用户来说,可能不是那么热衷,但对于普通用户来说,还是能带来很多新奇感。

4.5 绘画助手

用户通过一句话描述绘画创意想法,理想同学可生成多张绘画作品。

绘画支持油画,漫画,梵高,水彩等9种风格。用户可以选择保存到汽车或手机。

绘画功能上车似乎会有一些违和,除了展现模型能力,为用户提供新鲜感之外,还有一些其他原因。

从理想的顾问那里了解到,该功能的核心用户也是指向了小孩。此外在家庭场景中,将一家人的合照绘制出来作为背景也是一个兴奋点。

5. 其他细节

5.1 引导式对话

在某些和理想同学对话的场景中,理想同学会主动引导/询问用户下一步的操作,并提供一些选项。

5.2 兜底回复

除了常见的回复“未理解”,理想同学在大部分情况下都能针对具体场景进行兜底回复,例如:

1.  用户在后排车窗已打开的情况下要求:打开后排车窗,理想同学会回复:后排车窗已经开启;

2.  用户说:我能打开这个吗(对应手势识别场景),理想同学会回复:没看清你指的哪里,把手往后放一点。同时还会在对应屏幕上展示规范姿势的示意图;

3.  在展厅中操作时,如果用户要求调节座椅等车控功能,理想同学会回复:展车模式下不支持该功能。

5.3 登车问候(NOMI)

针对主驾或副驾,在开门上车的瞬间,NOMI会转至对应方向,并问候上车用户。

此外,在交互过程中,NOMI也会自动转向正在说话的用户进行回答。

而理想采用的是在对应屏幕显示理想同学形象实现,前提是得有足够多的屏幕。

在demo展示的过程理论上不会涉及该场景,但是为了展现“辨位”的能力,也可以加入,在一块屏幕的情况下,可以通过改变语音助手形象来实现。

5.4 “用手机”or“用车机”

对于车机系统中,是否要适配一些原来手机已有的一些功能或APP,例如浏览器,美团等。这是用户反馈比较多也是比较有争议的一个问题,有的人认为完全没有必要,也有的人认为功能不错。

以美团上车这一功能来说,个人认为要解决的主要痛点是在出行场景下,副驾(或其他乘客)在手机上选好餐厅后给主驾导航不便。而在用户认知中,美团的标签是外卖,因此用车机点外卖(停车后,用车机点餐)这一功能违反人们的习惯,产生了认知失调的状况,从而导致了较多用户的负面评价。

对于点外卖/点餐的功能,如果是停车后,用车机进行点餐,确实非常鸡肋。但如果是在驾驶过程中,能够通过语音和GUI-Agent实现半自动点餐甚至全自动点餐,能大大提高用户体验。

目前,麦当劳、肯德基等快餐巨头都在不同程度上尝试和应用语音点餐技术,同时在茶饮咖啡这类重复性高,点餐快速的行业也有较大的落地空间。

除了解决问题,促使APP上车还有一个原因就是大家都在往华为提出的“超级终端”方向在走。李想本人也在最近的AI Talk上说:

一些看起来是鸡肋的功能其实是为了更长远的布局。

6. 总结

6.1 用户画像

无论是屏幕外观、界面还是语音助手,都需要针对车型核心用户画以及场景像进行设计。在这一点上,理想优化的非常好,无论是屏幕外观,语音助手形象还是理想同学的AI功能,都对家庭场景做了很好地适配。

对于demo产品,目标客户是车企和供应商,所以不会有明确的核心用户画以及场景。因此在设计时,可以抓住市场上购车的主流用户画像,只满足一部分人的需求,且要具备一定的泛化性。

从数据上看,购车主流人群集中在25-35岁的有房群体。该群体对品质有一定需求,且普遍已经成家立业,需要考虑家庭用车场景以及日常通勤用车场景。

6.2 定制化

在出行前和出行中所使用的各类汽车用品领域,”专车专用” 已成为不可逆转的消费趋势。根据天猫数据表现,新能源车主对定制化车载产品的购买需求日益旺盛。专车专用属性的车载产品在2024 年 8 月末周订单量相比去年同期呈现上升态势,

从蔚小理三家的车机中也不难感受到,无论是桌面布局还是功能自定义(任务大师),它们都会给予用户定制化的空间,满足不同用户的不同需求。

因此在车机产品的设计时,可以考虑加上一些可供用户体验定制化的功能(例如理想的任务大师)。

6.3 差异化

从体验上说,目前市面上的车机产品已经有了一些同质化的趋势,因此我们的车机产品的侧重应该是智能化的体验,注重差异化,体现模型能力。以下有一些可能的探索方向:

1.  与视觉模组结合

对于大部分车企来说是一个看似鸡肋的功能,但诸如像蔚来(易微联CAST)、小米(米家生态)、华为(鸿蒙生态)等追求人车家生态互联的企业,已经在车机内进行了适配。

而我们车机demo是用来展示的,核心是展现模型能力。而视觉模组也是模型的落地场景之一,在低成本的情况下将两个场景进行结合,能达到锦上添花的效果。

2.  主动响应

在过去一年里,大模型+RAG无疑是最快速的落地方式,也就是我们最常见的Gen AI。但随着技术的进一步深耕,Agentic AI又慢慢进入了大家的视野。在《Practices for Governing Agentic AI Systems》一文中,OpenAI 强调了 Agentic AI的潜力。而最近清华&面壁提出新一代主动 Agent 范式,在车机系统主动响应上有了一些落地的可能。

可以使用“生成式人工智能”和“自主式人工智能”来简单理解Gen AI和Agentic AI。

传统车机语音助手都是采用请求-响应的模式。主动响应是指根据具体环境推测用户需求,然后确认执行。例如,在车内温度较低的环境下,主动询问用户是否打开空调加热。

主动响应的最大难点在于用户的需求千人千面,且用户期待AI主动的程度非常难界定,因此主动响应功能非常容易带来负面效果,降低用户体验。
目前“蔚小理”三家车型中唯一的主动响应是“登车问候”(详见前文5.3),而“车控型”的主动响应功能则没有涉及。

ps:用户可以通过任务大师间接实现主动响应,可以参考这几篇帖子:

蔚来:https://www.toutiao.com/article/7450485597888430619/?upstream_biz=doubao&source=m_redirect

理想:https://baa.yiche.com/lixiangone/thread-48619637.html

Car Play:https://zhuanlan.zhihu.com/p/618177542

奔驰EQE:https://www.toutiao.com/article/7362408254531518987/?upstream_biz=doubao&source=m_redirect

3.  GUI-Agent

GUI Agent是一种基于多模态视觉模型驱动的人工智能系统,能够自动推理并执行UI交互,模拟人类用户的操作,如点击、输入、拖拽、读取界面信息等,以完成人类要求的工作任务。

例如用户要在网页上搜索资料,它能识别浏览器页面的搜索框等元素,输入关键词并点击搜索按钮。

这是测试文本,单击 “编辑” 按钮更改此文本。

                                                                                                                                   来源:https://arxiv.org/pdf/2312.08914

在车机端,GUI Agent主要用于和第三方APP交互,例如上文提到的美团订餐/点餐。但只有在准确率提升,用户建立信任之后才会有进一步落地的可能。