梦想汽车VLA司机大模子：收尾从“动物”到“东谈主类”的智能进化

发布日期：2025-05-10 21:53 点击次数：209

2025年5月7日，梦想汽车推出“梦想AI Talk第二季——梦想VLA司机大模子，从动物进化到东谈主类”，梦想汽车董事长兼CEO李想重心共享了关于东谈主工智能的最新想考，VLA司机大模子的作用、考试方法和挑战，以及关于创业和个东谈主成长的见解。

迷水商城迷水商城

李想将AI器用分为三个层级，差异是信息器用、扶持器用和分娩器用。面前，大多数东谈主将AI算作信息器用使用，但信息器用常陪同多量无效信息、无效肃除和无效论断，仅具参考价值。成为扶持器用后，AI不错提高效果，举例面前的扶持驾驶，但仍需东谈主类参与。改日，AI发展为分娩器用后，将能独处完成专科任务，显贵提高效果与质料。

迷水商城

李想线路：“判断Agent(智能体)是否实在智能，要害在于它是否成为分娩器用。独一当东谈主工智能变成分娩器用，才是其实在爆发的时刻。就像东谈主类会雇佣司机，东谈主工智能期间最终也会承担近似职责，成为实在的分娩器用。”

迷水商城

VLA的收尾不是突变的进程，是进化的进程

迷水商城

面前的L2、L2+组合驾驶扶持仍属于扶持器用阶段，而VLA(Vision-Language-Action Model，视觉言语行动模子)概况让AI实在成为司机，成为交通规模的专科分娩器用。对梦想汽车而言，改日的VLA便是一个像东谈主类司机一样责任的司机大模子”。

VLA的收尾不是一个突变的进程，是进化的进程，经验了三个阶段，对应梦想汽车扶持驾驶的昨天、今天和未来。第一阶段，梦想汽车自2021年起自研依赖规定算法和高精舆图的扶持驾驶，近似“虫豸动物智能”。第二阶段，梦想汽车自2023年起磋议，并于2024年认真推送的端到端+VLM(Vision Language Model，视觉言语模子)扶持驾驶，接近“哺乳动物智能”。

端到端模子在处理复杂问题时存在局限，虽可借助VLM视觉言语模子扶持，但VLM使用开源模子，使其在交通规模的才智有限。同期端到端模子也难以与东谈主类相通。为了料理这些问题并提高用户的智能体验，梦想汽车自2024年起开展VLA磋议，并在多项顶级学术会议上发表论文，夯实了表面基础。

迷水商城

在端到端的基础上，到第三阶段，VLA将开启“东谈主类智能”的阶段。它能通过3D和2D视觉的组合，竣工地看到物理天下，而不像VLM仅能理会2D图像。同期，VLA领有竣工的脑系统，具备言语、CoT(Chain of Thought，想维链)推理才智，既能看，也能相识并实在实施行动，相宜东谈主类的运作口头。

迷水商城

VLA考试进程模拟东谈主类学习，对王人东谈主类价值不雅

VLA的考试分为预考试、后考试和强化考试三个要领，近似于东谈主类学习驾驶手段的进程。预考试相等于东谈主类学习物理天下和交通规模的学问，通过多量高清2D和3D Vision(视觉)数据、交通连系的Language(言语)语料，以及与物理天下连系的VL(Vision-Language，视觉和言语)王人集数据，考试出云表的VL基座模子，并通过蒸馏滚动为在车端高效开动的端侧模子。

后考试相等于东谈主类去驾校学习开车的进程。跟着Action(动作)数据的加入——即对周围环境和自车驾驶行为的编码，VL基座变为VLA司机大模子。收货于短链条的CoT，以及Diffusion扩散模子关于他车轨迹和环境的预计，VLA具备及时性的特色，收尾了在复杂交通环境中的博弈才智。

强化考试近似于东谈主类在社会中本色开车进修，指标是让VLA司机大模子愈加安全、酣畅，对王人东谈主类价值不雅，以致超越东谈主类驾驶水平。强化考试包含两部分：一是通过RLHF(Reinforcement Learning from Human Feedback，基于东谈主类响应的强化学习)完成安全对王人，使模子盲从交通规定，贴合中国用户的驾驶风俗；二是将纯强化学习模子放入天下模子中考试，提高酣畅肠，幸免碰撞事故，盲从交通规定。经过预考试、后考试和强化考试后，VLA司机大模子即可部署至车端开动。

VLA司机大模子以“司机Agent(智能体)”的家具形态呈现，用户可通过当然言语与司机Agent相通，跟东谈主类司机怎样说，就跟司机Agent怎样说。简便通用的短辅导由端侧的VLA径直处理，复杂辅导则先由云表的VL基座模子理会，再交由VLA处理。

超等对王人确保AI决策安全，天下模子破解AI黑盒辛勤

除了提高专科才智，VLA司机大模子还需料理安全性和模子黑盒的问题。

迷水商城

模子才智越强，越需要功绩性不断，以确保才智下限。为了保险VLA司机大模子概况收尾功绩司机般的安全和酣畅，幸免学习加塞等违法行为，梦想汽车在强化考试要领干涉多量资源，迷昏烟并于2024年底组建卓绝100东谈主的超等对王人团队，相等于为司机Agent注入功绩教悔。

迷药APP迷水商城

为料理模子的黑盒问题，梦想汽车结合重建和生成两种旅途，打造了实在、相宜物理天下要领的天下模子，阴私统共交通参与者和因素。基于天下模子的仿真才智，VLA不错辞天下模子中低资本、准确地考证试验问题，提高料理问题的效果，灵验打法模子黑盒带来的挑战。

判断司机Agent是否是个好司机，有三个要害范例：专科才智、功绩才智和构建信任的才智。VLA司机大模子提高了专科才智，超等对王人增强了功绩才智，VLA通过相识当然言语、具备操心才智提高了构建信任的才智。

东谈主工智能时期，塌实的基本功比走捷径报复

梦想汽车收尾期间快速跃迁的背后，是从磋议、研发到才智抒发，再到将才智变成业务价值的基本功积蓄。磋议是要害，磋议窒碍后，研发的效果会大幅提高，且把稳价值滚动，最终收尾业务落地。

迷水商城

梦想汽车坚抓自研，通落后间赋能用户价值。举例，在扶持驾驶方面，由于英伟达Orin-X芯片无法径直开动言语模子，端到端+VLM的扶持驾驶决策对部分企业来说仍具挑战。梦想汽车依托自有编译团队，自研底层推理引擎，使芯片可通过INT4(4比特整型)量化的口头开动VLM。同期，凭借芯片、甘休器狡计和自研汽车操作系统等概括才智，梦想汽车收尾了让双Orin-X芯片和Thor-U芯片开动同等限制的VLA司机大模子。李想线路，大型企业的基本功和才智永远无法被跳跃。

收货于DeepSeek的开源，梦想汽车在VLA司机大模子的言语才智研发上提速显贵，省俭了近9个月的时分和数亿元资本。尽管如斯，梦想汽车仍选拔加大干涉，在基座模子上干涉超预期3倍的考试卡，专注打造适配多场景的自研模子。李想线路：“咱们不错站在巨东谈主的肩膀上，但它仅仅其中的一部分。”在受益开源的同期，梦想汽车也选拔开源自研的汽车操作系统——梦想星环OS，回馈社会。

成长带来能量，在可怜中保抓正能量

本年7月，梦想汽车将迎来缔造十周年。李想线路，创业路上苦多于甜，他选拔保留那些有价值的好意思好片断，用来激勉我方保抓正能量。“创业如实辞谢易，然则没必要苦哈哈的。苦和甜是一个硬币的正反面，取决于看哪一面。”他将企业遭受的打击视为必须面对的挑战，也恰是这些挑战，赋予了梦想汽车更多的才智。也正因这份积极乐不雅的创业心态，梦想汽车才能快速成长为千亿营收限制、百万请托量的新势力企业。

谈及如何成为更有能量的东谈主，李想合计，要害在于关心自我，秉承本人的优点和不及，并用成长替代转换——成长意味着增强才智。除此以外，李想强调亲密相关相同报复，关心他东谈主的成长也能带来能量，家东谈主和共事概况和他造成互补，相互撑抓。“我需要家东谈主和共事以致卓绝了他们需要我，最初是我需要他们，然后才是他们需要我，咱们在沿路概况造成尽头强的脑力和心力。”李想线路。

迷水商城

回来几次创业经验，李想线路，从高中创办个东谈主网站于今，我方的想维口头莫得什么变化：遇到问题料理问题，料理别东谈主不肯料理的辛勤，料理用户的痛点，不竭向他东谈主学习。不同的是，如今濒临的问题更复杂、做事的用户群体更多、公司限制和组织也更普遍。“几次创业一齐走来，最难时有东谈主相连，遇坑也能飞快爬出，一帮东谈主王人心合力变得更好，这是种侥幸，也没什么可后悔的。”

迷水商城迷水商城

面对AI的发展，李想合计，在AI面前统共的东谈主性都应被保留，非论猛烈，因为一切东谈主性都是文化、生命、脾性、才智的特质，亦然东谈主类实在的生命力地点。

迷水商城

从使用增程电动和5C超充期间料理电板资本高、充电难、充电慢的问题，到自研汽车操作系统攻克传统汽车操作系统性能差、诱骗渐渐、芯片匹配周期长等挑战，梦想汽车遥远以期间改进料理行业无法料理的问题。自研VLA时，梦想汽车更是踏入了东谈主工智能的无东谈主区。面前，扶持驾驶走到了新的十字街头上，梦想汽车将不竭挑战成长的极限，抓续为行业和用户创造价值。

【免责声明】本文仅代表作家本东谈主不雅点，与和讯网无关。和讯网站对文中述说、不雅点判断保抓中立，不合所包含内容的准确性、可靠性或竣工性提供任何昭示或默示的保证。请读者仅作参考，并请自行承担全部职守。邮箱：news_center@staff.hexun.com

上一篇：中新健康丨AI+中医药怎样发展？多位院士发声
下一篇：泰达新材北交所IPO上会被否保荐机构为华安证券