1. 前言

1.1 背景

近期正在开发我们自己的车机系统Demo，需并针对目前市场上领先的车机产品进行调研，以获取第一手的用户体验和技术反馈。为了更好地理解现有车机系统的功能、用户交互设计，对“蔚小理”（蔚来、小鹏、理想）三大车企的车机系统进行了线下体验。

1.2 体验车型

理想：L9/MEGA

蔚来：eT7/eS6

小鹏：G9

由于蔚小理的车机功能具有高度的重复性，所以下文主要以理想的车机为主。而蔚来和小鹏只有差异化的设计会单独分析。

2. 屏幕设计

2.1 前排屏外观

理想中控屏采用目前市场主流的（特斯拉、小米、问界等几乎都是横屏）横屏设计，并在右侧加上了一块副驾的娱乐屏。反观蔚来中控屏尺寸较小，且采用不那么常见的竖屏设计。

从蔚来顾问那里了解到，蔚来车机设计时安全性的权重较大，较小中控屏的初衷是想减小屏幕对于主驾驶的影响。而采用竖屏是沿用了手机的竖屏模式，可以保留用户在手机上的操作习惯。

除此之外，竖屏可以完美适配导航的信息展示，不必像其他车机的中控再切分其他导航界面，可以将导航界面铺满全屏。

而弊端就是除了导航之外的交互体验都极差，无论是娱乐还是查询信息，竖屏的设计对主驾和副驾都不是很友好。所以蔚来的交互高度依赖语音，中控屏几乎完全为导服务（驾驶场景）。

而从小鹏的两款车型G9和P7+也能看出来，中控屏幕的外观设计需要考虑到车型定位以及车型用户画像。

车型	小鹏G9	小鹏P7+
用户画像	主要为30-50岁的男性，家庭年收入在35万元以上，可能已有燃油车，倾向于增购或置换为新能源SUV。他们对车辆的豪华感和家庭适用性有较高要求。	多为追求性价比的消费者，可能是年轻的单身人士或作为家庭的第二辆车。他们更关注车辆的实用性、性能和智能化程度，对空间和豪华配置的需求相对较低。

G9定位是家庭的SUV，核心用户是已婚且有孩子的男主人，但是用户（乘客）还包括女主人和孩子。因此除了考虑驾驶员的体验，还要考虑家庭用车场景下乘客的用车体验。在此场景下，娱乐功能就是必不可少的，尤其是播放视频（女主人的需求）。此外，车辆增加屏幕的成本并不高，但它却能给这辆车带来一定的溢价和利润空间，并让整个座舱更科技感与豪华感，这也与车型定位一致。

P7+定位是AI智驾掀背轿跑，核心用户是单身人士。因此车辆的驾驶体验就极为重要，对于一些较低频（娱乐）的功能体验感就没有那么重要。除此之外，年轻人对价格较为敏感，所以P7+在配置上更注重实际使用频率高的功能，如座椅通风、加热和按摩等，而未配备副驾驶娱乐屏。

（ps：极越的屏幕设计的也是独具特色，科幻风。不过百度的产品设计一直都挺与众不同的）

2.2 中控屏桌面

中控屏作为车机交互的核心，桌面的布局和内容十分重要。中控屏既需要承担传统车机的部分物理按键功能，还需要承担最重要的导航功能以及大部分娱乐功能。大部分网页或应用来说，用户使用频率越高的功能交互成本应该越低，车机界面也是如此，所以桌面需要放哪些控件、卡片，就需要根据用户的用车习惯进行设计。

交互成本：用户在网站或应用中为了完成目标而产生的费力度总和，包括心智与肢体操作两个方面。举个例子，微信点赞的交互成本要高于QQ点赞。

接下来以理想的中控桌面布局为样例进行分析：

状态栏除了显示车辆指示灯与警告灯等信息，还融入了时间、网络信号、车外温度等手机状态栏中常见的信息，使用户能有一种熟悉感。

值得一提的是，状态栏中的部分图标支持点击操作，用户点击后会弹出相应的提示信息或操作界面。这种多入口设计更符合用户心智，也方便操作。

除此之外，新弹出的操作界面也是一个二次确认。既能防止用户误触，也能提示下一步会发生什么。例如，用户点击状态栏中的“sos”图标后，会弹出紧急呼救的卡片，而不是直接拨打电话（若安全气囊弹出，则会直接拨打电话）。

环境感知信息区域在驾驶时显示车辆状态、驾驶信息、提示信息、道路及车辆周边画面。

当车辆处于 P 挡时，显示车控图标，点击可解锁油箱盖、开启后备厢门和充电口盖。

之所以这么做是因为驾驶员在“驾驶”和“停车”两个场景下的需求是不一样的，以档位作为切换开关可以适应驾驶员的不同需求，同时提高了界面使用效率。（该设计在大多数车机系统中都被采用，小米甚至将整个界面都采用了）

此外，驾驶员还可通过点击该区域，扩展换面展示更多信息，如路标、停车灯、障碍物等

这里有一个重复设计（一个界面内有多个入口指向相同的功能）。

一般来说，重复设计违反了效率、用户预期的原则，让用户拉高转化的成本，理想这么做的原因可能如下：

1. 汽车场景下，用户除了主驾还有副驾，两个区域的图标倾向于让两位不同的用户使用；

2. 由于分区设计原则，加油、充放电功能应位于右半区（非黄金注意区域），但这些功能又是（停车场景下）驾驶员的高频需求，因此放到了P挡下的环境感知区域内。

环境感知信息区域是驾驶员的黄金注意区域，在设计时应该将驾驶员的高频需求放入该区域。

媒体卡片用于展示和承接中控屏和副驾娱乐屏多媒体播放状态，包括音乐、视频、拨号等，方便主驾用户快速控制功放媒体的播放状态（▶️ ⏩️）。媒体卡片也是驾驶员的高频需求之一，因此设计时要布局在驾驶员的黄金注意区域。

底部功能栏采用分区设计，左边区域包含回到主页，导航，设置等常用入口；右边区域包含锁车，空调，座椅等传统车机实体按键的功能。

底部功能栏是固定不动的，所以放置的都是最基础、最常用的一些功能，方便用户在任何情况下都能第一时间调用这些功能。

同时，在调用后，对应图标也会通过外观、颜色等转变作为调用成功的反馈。

特别的，对于一些“程度可控”的功能，应该弹出对应的卡片便于用户进行调节。如图是温度调节的卡片：

3. 语音助手

3.1 形象

“蔚小理”三家的语音助手虽然都采用了拟人化设计，但形象却各有特色。

理想的语音助手“理想同学”设计元素非常简洁，但在添加了多样的动作和表情变化后，朴素却显得活泼、贴心，使用户（特别是小孩）更容易产生一种亲切感和归属感。

蔚来的语音助手“NOMI”采用独树一帜的实体形象，确实是一把双刃剑。优点是可以提升用户情感体验，并实现诸如旋转之类的操作；缺点是增加了成本（研发成本高，故障率也高），并会带来潜在的分心等安全隐患。但从结果上看，NOMI已经成为了蔚来的灵魂，对蔚来来说的确是利大于弊。

小鹏的语音助手“小P”采用科幻风的机器人形象，强调智能性和技术先进性，设计语言更科技感十足，且互动形式更加简洁直观。小P也是针对技术爱好者、年轻消费者，尤其注重智能车机体验的用户设计的，但在细节优化方面要略逊色于另外两家。

不难看出，语音助手的形象高度匹配核心用户的风格，所以不存在一个普适性的形象，还是需要根据核心用户的用户画像进行针对性的设计。

3.2 唤醒

语音助手的唤醒方式主要有两种，这里以理想同学为例介绍。

1. 语音唤醒

通过固定的语音唤醒是语音助手最常见的唤醒方式，，也是语音助手的标配。对于理想的车机，说出“理想同学”即可唤醒（唤醒指令也可自定义）。唤醒后，通过语音回答和视觉形象两种方式给予用户唤醒成功的反馈。

2. 按键唤醒

除了语音唤醒之外，使用实体按键作为备选（兜底）方案也是必不可少的。对于理想的车机，向上拨动方向盘左键即可唤醒。实体按键的置信度较高，增加该功能可以用较低的成本提高用户的信任感，此外也更方便主驾进行控制，同时也满足了一些年长用户的偏好。

3.3 特色交互

3.3.1 免唤醒交互

理想同学可以支持不唤醒就直接说出指令。但该功能的局限性在于只支持部分特定的指令，并非所有指令都能执行。此外，了解到在理想车机中，免唤醒交互属于还在测试阶段的功能，因此效果还会持续优化。就体验效果来说，该功能暂时没有“一气呵成”好用。

与免唤醒搭配的功能是“语义拒识”，即理想同学可以有效识别与 TA 的对话，不会打扰乘客间的聊天，避免误操作。

而目前这一套功能在车机上的使用率较低（试乘时顾问大部分时间都是用唤醒的方式输入指令），而想要提高使用率的核心是提高准确率和应答率。

3.3.2 多人识别交互

理想同学可以区分车内所有人的不同指令，并同时理解每个人说的话，并做出答复。同时，理想同学也会出现在最近的屏幕上，对用户进行视觉上的反馈。

在体验的时候，多人识别是基于位置的，而不是声纹。而且和后续介绍的“随时打断”功能一样，灵敏度不够。（但是理想同学也支持声纹识别，并且可以在设置中启用“锁定唤醒人”的功能）

这里所说的“理解”是需要考虑位置信息的（这是一个典型的针对用户兴奋型需求设计的功能）。举个例子：当用户说“打开车窗”的时候，需要正确开启离用户最近的车窗，而不是打开全车车窗。

3.3.3 一气呵成

用户可以将唤醒词连同指令一起说出，这样即可跳过理想同学对唤醒成功的反馈。例如：直接说：“理想同学打开设置”，就可以跳过唤醒环节直接让理想同学打开设置。

3.3.4 手势交互（理想独有）

理想同学可以通过 “指代指令” 和手势相结合，完成对舱内物体的控制（主要是通过识别食指指向执行相应操作，没有太多意图的识别）。例如:用户食指向上说:”打开它”，理想同学会自动打开遮阳帘。

就目前版本来说，该功能局限性较大：

1. 目前仅支持控制遮阳帘和车窗

2. 极易受摄像头视野限制

当然，后排也有相应的摄像头。且为了保护用户隐私，都可以可以手动关闭。

3.3.5 其他能力

1. 方言问答：可以使用方言和理想同学进行对话，目前支持方言有：粤语、上海话、四川话、河南话、河北话、山东活、天津话、陕西话。

2. 连续对话：在一段时间内进行多次对话，不需要重复唤醒。

3. 打断对话：不需要等理想同学说完，就可开启新的对话。（该功能和连续对话是一套的）

4. 可见即可说：用户可以直接说屏幕上的按键文字，看见什么说什么。

5. 聆听等待：用户在说话停顿或者犹豫发问，理想同学不会打断。

3.4 关闭

理想同学主要有三种退出方式：

1. 通过语音指令“退出”或者类似表达来关闭理想同学；

2. 通过点击屏幕上理想同学的头像来关闭；

3. 通过方向盘上的按键进行关闭。这种情况下关闭方式和唤醒方式一致，即向上拨动方向盘左键。之所以不设计为向上开启，向下关闭其实是为了提高按键的使用效率。也就是说，控制的功能从2种变为了4种（向下可控制通话）。

4. 理想同学

目前的车机助手几乎都接入了大模型，如理想的Mind GPT，蔚来的NOM GPT。以大模型为核心的功能如语音车控，生活百科，GUI-Agent已经成为了目前智能座舱的核心卖点之一，同时也是本次调研的关注重点。由于蔚小理三家在这些功能上有较高的重叠，所以下文以理想同学为例进行介绍分析。

4.1 任务大师

用户使用一句话描述条件和预期结果，理想同学能够帮用户创建任务。

理想同学可以联动座椅、空调、导航等常用功能，通过AI来规划执行任务要求。

蔚小理三家都有适配任务大师的功能，但就完善程度来说理想>蔚来>小鹏。

任务大师这个功能初看有些鸡肋，在我对三家车企进行试乘过程中，没有任何一位顾问主动向我演示该功能。但出乎意料的是，用户的反馈以及热度都极高。

从理想app中帖子的热度来看（暂不考虑官方流量扶持），任务大师相关的帖子要高于其他的帖子，甚至高过了一些官方发帖。

因此，该功能至少是抓住了一些用户的需求：

1. 个性化定制

对C端产品来说，用户的需求千人千面，每个用户几乎都会有自己独有的且未被满足的需求。如果在设计功能的时候，将所有的需求都考虑进去，系统就会非常臃肿，并带来不好的体验，得不偿失。因此个性化定制的功能在大部分产品中都很常见，理想的任务大师功能也是个性化定制的一种。

任务大师允许用户根据自己的使用习惯和需求，创建个性化的任务。这种个性化的设置让用户感觉自己像是在定义自己的车辆，提供了一种自己做产品的体验。

2. 社区属性

除此之外，理想还将任务大师构建成了一个分享平台。用户可以在平台分享自己创作的任务，也可以快捷使用别人分享的任务。通过这种UGC的方式，使任务大师具有了一定的社区属性，将原本互不相识的车主们变成了车友，更容易留住用户。

UGC产品的难点在于找到第一批天使用户，但可以看到，已经有了很多实用的任务被分享出来。

4.2 用车助手

用车助手是用户高频使用的场景，也是整个理想同学功能的核心。功能主要分为询问和控制两种。

4.2.1 询问

询问功能主要是指用户可以通过该助手查询车辆状态（空气质量、温度等），询问用车问题，诊断车辆故障。

这是用户在用车过程中的需求之一，无论是紧急状况（脱困）下还是日常使用，相比于查询用户手册，用户更倾向于接受这种即问即答的方式。

该功能需要接入对应车型的知识库，针对特定车型进行回答。因此在设计用于展示的产品时，需要和特定车企达成合作。

4.2.2 控制

说到大模型语音助手，一定离不开语音控制的功能。这是用车场景下最高频的需求，也是在试乘过程中体验最频繁的功能。

功能主要包括车控、导航、媒体、通话四个场景（系统控制也算一个场景，但是比较依赖于免唤醒，且涵盖的指令较少，理想暂未将其分为一大类）。

在执行成功后，屏幕上的视觉反馈较少，更多是以语音播报的方式体现，这么设计的原因可能有以下几个：

1. 控制功能大部分是驾驶场景下主驾进行使用，因此用视觉展示不利于查看，且容易造成分心；

2. 大部分功能例如座椅按摩、空调、音乐等，都能明显的被感知。

但作为一个Demo来说，设计时还是应该使用视觉反馈为主，语音反馈为辅。因为人类的感知80%来源于视觉，而上述两个原因在Demo展示的场景下又都不成立。

4.3 出行助手

除了日常用车，出行也是一个高频场景，特别是对于理想的核心用户。

出行助手支持城市介绍、景点分类推荐、景点介绍和信息查询，还可以认直接发起导航、查询周边美食（需要将位置信息打开）。

出行助手和小红书、美团等都有适配。例如在查询完景点之后，可以在最后查看对应的小红书笔记；而美食查询就是基于美团（专属的车机版本，但不支持订餐）。

出行助手是一个高频和第三方应用交互的功能，对于demo来说，可以很好的展现模型GUI-Agent的能力。

在体验过程中，特地问了顾问是否支持美团订餐，他的回答是：不支持，这并不是一个高频需求，你是第一个问我的人，想要订餐的话可以通过手机进行操作。

对于“用手机”or“用车机”的问题，后续会提到。就订餐/点餐这个需求是不是伪需求，还是需要数据进行支撑。对于我个人而言，在“发现餐厅/美食–>选择餐厅–>导航到餐厅”的链路中，似乎还是缺少了“订餐/点餐”这一环，理想不做可能还是因为这个环节本就比较复杂，收益不高（或是模型能力还需优化）。但对于一个用户展示的demo，还是值得进一步考虑的。

4.4 百科老师

百科老师可以对用户输入的知识性、常识性问题进行回答，这也是大模型最原始的功能之一。

从回答不难看出，该功能面向的核心用户之一就是儿童，通过通俗易懂的解答来吸引孩子的交互兴趣。

这个功能对于熟悉大模型的用户来说，可能不是那么热衷，但对于普通用户来说，还是能带来很多新奇感。

4.5 绘画助手

用户通过一句话描述绘画创意想法，理想同学可生成多张绘画作品。

绘画支持油画，漫画，梵高，水彩等9种风格。用户可以选择保存到汽车或手机。

绘画功能上车似乎会有一些违和，除了展现模型能力，为用户提供新鲜感之外，还有一些其他原因。

从理想的顾问那里了解到，该功能的核心用户也是指向了小孩。此外在家庭场景中，将一家人的合照绘制出来作为背景也是一个兴奋点。

5. 其他细节

5.1 引导式对话

在某些和理想同学对话的场景中，理想同学会主动引导/询问用户下一步的操作，并提供一些选项。

5.2 兜底回复

除了常见的回复“未理解”，理想同学在大部分情况下都能针对具体场景进行兜底回复，例如：

1. 用户在后排车窗已打开的情况下要求：打开后排车窗，理想同学会回复：后排车窗已经开启；

2. 用户说：我能打开这个吗（对应手势识别场景），理想同学会回复：没看清你指的哪里，把手往后放一点。同时还会在对应屏幕上展示规范姿势的示意图；

3. 在展厅中操作时，如果用户要求调节座椅等车控功能，理想同学会回复：展车模式下不支持该功能。

5.3 登车问候（NOMI）

针对主驾或副驾，在开门上车的瞬间，NOMI会转至对应方向，并问候上车用户。

此外，在交互过程中，NOMI也会自动转向正在说话的用户进行回答。

而理想采用的是在对应屏幕显示理想同学形象实现，前提是得有足够多的屏幕。

在demo展示的过程理论上不会涉及该场景，但是为了展现“辨位”的能力，也可以加入，在一块屏幕的情况下，可以通过改变语音助手形象来实现。

5.4 “用手机”or“用车机”

对于车机系统中，是否要适配一些原来手机已有的一些功能或APP，例如浏览器，美团等。这是用户反馈比较多也是比较有争议的一个问题，有的人认为完全没有必要，也有的人认为功能不错。

以美团上车这一功能来说，个人认为要解决的主要痛点是在出行场景下，副驾（或其他乘客）在手机上选好餐厅后给主驾导航不便。而在用户认知中，美团的标签是外卖，因此用车机点外卖（停车后，用车机点餐）这一功能违反人们的习惯，产生了认知失调的状况，从而导致了较多用户的负面评价。

对于点外卖/点餐的功能，如果是停车后，用车机进行点餐，确实非常鸡肋。但如果是在驾驶过程中，能够通过语音和GUI-Agent实现半自动点餐甚至全自动点餐，能大大提高用户体验。

目前，麦当劳、肯德基等快餐巨头都在不同程度上尝试和应用语音点餐技术，同时在茶饮咖啡这类重复性高，点餐快速的行业也有较大的落地空间。

除了解决问题，促使APP上车还有一个原因就是大家都在往华为提出的“超级终端”方向在走。李想本人也在最近的AI Talk上说：

“一个真正的大模型产品，一定是能够去自主使用所有的设备，会拥有所有的服务，这才是真正的人工智能。”

一些看起来是鸡肋的功能其实是为了更长远的布局。

6. 总结

6.1 用户画像

无论是屏幕外观、界面还是语音助手，都需要针对车型核心用户画以及场景像进行设计。在这一点上，理想优化的非常好，无论是屏幕外观，语音助手形象还是理想同学的AI功能，都对家庭场景做了很好地适配。

对于demo产品，目标客户是车企和供应商，所以不会有明确的核心用户画以及场景。因此在设计时，可以抓住市场上购车的主流用户画像，只满足一部分人的需求，且要具备一定的泛化性。

从数据上看，购车主流人群集中在25-35岁的有房群体。该群体对品质有一定需求，且普遍已经成家立业，需要考虑家庭用车场景以及日常通勤用车场景。

6.2 定制化

在出行前和出行中所使用的各类汽车用品领域，”专车专用” 已成为不可逆转的消费趋势。根据天猫数据表现，新能源车主对定制化车载产品的购买需求日益旺盛。专车专用属性的车载产品在2024 年 8 月末周订单量相比去年同期呈现上升态势，

从蔚小理三家的车机中也不难感受到，无论是桌面布局还是功能自定义（任务大师），它们都会给予用户定制化的空间，满足不同用户的不同需求。

因此在车机产品的设计时，可以考虑加上一些可供用户体验定制化的功能（例如理想的任务大师）。

6.3 差异化

从体验上说，目前市面上的车机产品已经有了一些同质化的趋势，因此我们的车机产品的侧重应该是智能化的体验，注重差异化，体现模型能力。以下有一些可能的探索方向：

1. 与视觉模组结合

对于大部分车企来说是一个看似鸡肋的功能，但诸如像蔚来（易微联CAST）、小米（米家生态）、华为（鸿蒙生态）等追求人车家生态互联的企业，已经在车机内进行了适配。

而我们车机demo是用来展示的，核心是展现模型能力。而视觉模组也是模型的落地场景之一，在低成本的情况下将两个场景进行结合，能达到锦上添花的效果。

2. 主动响应

在过去一年里，大模型+RAG无疑是最快速的落地方式，也就是我们最常见的Gen AI。但随着技术的进一步深耕，Agentic AI又慢慢进入了大家的视野。在《Practices for Governing Agentic AI Systems》一文中，OpenAI 强调了 Agentic AI的潜力。而最近清华&面壁提出新一代主动 Agent 范式，在车机系统主动响应上有了一些落地的可能。

可以使用“生成式人工智能”和“自主式人工智能”来简单理解Gen AI和Agentic AI。

传统车机语音助手都是采用请求-响应的模式。主动响应是指根据具体环境推测用户需求，然后确认执行。例如，在车内温度较低的环境下，主动询问用户是否打开空调加热。

主动响应的最大难点在于用户的需求千人千面，且用户期待AI主动的程度非常难界定，因此主动响应功能非常容易带来负面效果，降低用户体验。
目前“蔚小理”三家车型中唯一的主动响应是“登车问候”（详见前文5.3），而“车控型”的主动响应功能则没有涉及。

ps：用户可以通过任务大师间接实现主动响应，可以参考这几篇帖子：

蔚来：https://www.toutiao.com/article/7450485597888430619/?upstream_biz=doubao&source=m_redirect

理想：https://baa.yiche.com/lixiangone/thread-48619637.html

Car Play：https://zhuanlan.zhihu.com/p/618177542

奔驰EQE：https://www.toutiao.com/article/7362408254531518987/?upstream_biz=doubao&source=m_redirect

3. GUI-Agent

GUI Agent是一种基于多模态视觉模型驱动的人工智能系统，能够自动推理并执行UI交互，模拟人类用户的操作，如点击、输入、拖拽、读取界面信息等，以完成人类要求的工作任务。

例如用户要在网页上搜索资料，它能识别浏览器页面的搜索框等元素，输入关键词并点击搜索按钮。

这是测试文本，单击 “编辑” 按钮更改此文本。