1. 产品概述

1.1 产品介绍

理想汽车在ai板块主要包括智能座舱和智能驾驶两大ai应用落地方向：

1.2 核心技术

1.2.1 看得清、听得懂、超智能

看得清：采用全新舱内RGB、IR感知硬件和三维视觉算法，即使在地库或隧道等场景，理想同学也能准确执行家人的指令；
听得懂：通过全车多组双麦阵列式麦克风技术，实现更准确的空间声源定位，进而实现更准确的多语种、多方言、多任务的个性化语音感知能力；
超智能：以大模型 Mind GPT 为核心的新一代多模态人机交互技术，拥有超过111个领域和1000种以上专属能力，能够通过车内多模态传感器感知和理解车内信息。

1.2.2 端到端+VLM 快慢系统

“快慢系统”双轨并行策略下，快系统将采用第三代端到端技术，由单一模型直接输出行驶轨迹；慢系统则基于 VLM技术，为决策提供深度支持。

快系统将传感器采集的信息输入模型提取特征值，结合自车状态和导航信息进行解码，得到动态障碍物、道路结构、OCC 以及规划的行驶轨迹。这些输出结果一方面用于描绘环境并呈现给用户，另一方面分别进行监督训练和模仿强化学习，规划轨迹最终输出给控制模块；
慢系统将相机信息、导航信息进行视觉编码，输入解码器后回归输出，输出结果包括：对环境的理解、驾驶决策建议和参考轨迹，最终辅助快系统的驾驶策略。

2. 功能模块介绍

2.1 智能座舱功能模块

2.1.1 AI任务执行

使用一句话描述条件和预期结果，理想同学即可直接帮用户创建任务。任务可以联动座椅、空调、导航等常用功能，通过ai来规划执行任务要求。

交互流程：

用户唤醒理想同学；
用户通过语音输入任务的条件和预期结果。用户输入通常是非结构化的，所以需要对用户意图进行提取后转为结构化任务条件和预期结果。提取后的内容会在中控屏幕（靠左部分）显示，供用户核对修改；
用户可以试运行该任务，查看是否符合预期；
用户可以保存该任务，以便后续调用；
在结束一次语音输入后，理想同学处于待机状态，用户可以随时进行新的语音输入。

例如，用户语音输入：我想要车内温度低于22度的时候，帮我打开方向盘加热和座椅加热； —> 提取结构化信息：1）条件：主驾有人就座、车内前排温度低于22摄氏度、车内后排温度低于22摄氏度。2）执行任务：方向盘加热、主驾座椅加热、附加座椅加热、二排左侧座椅加热、二排右侧座椅加热、三排左侧座椅加热； —> 显示结构化信息，用户可以对信息进行修改；

2.1.2 AI绘画

一句话描述绘画创意想法，可生成多张绘画作品。支持油画，漫画，梵高，水彩等9种风格。用户可以选择保存到汽车或手机。