加入收藏 | 设为首页

首页    /    快讯    /    正文

李想带着理想,走向AI「无人区」

理想的AI Talk 第二季,时隔130天后,终于回归。

最新一季访谈中,李想不仅谈到了对人工智能的最新思考,以及当下辅助驾驶的情况,还涉及了DeepSeek、特斯拉、苹果等众多AI公司。

在李想看来,目前辅助驾驶虽然处于十字路口,但对理想影响不大,今天的辅助驾驶就像正处于黎明前的黑暗时刻,辅助驾驶行业遇到了问题,恰恰是理想证明自己价值所在的时刻。

早在*季,李想在访谈上就提出了自己的观点,理想是一家人工智能企业,我们要做的不是汽车的智能化,而是人工智能的汽车化。

面向人工智能时代,理想的逻辑是当AI成为生产工具时,人工智能才会迎来爆发时刻。

如今,人工智能的汽车化,理想已经有了具象的体现——VLA 司机大模型。

李想也坦言,做 VLA司机大模型,像走向一个无人区,Deepseek 没有走过这条路,OpenAl 没有走过这条路,谷歌、Waymo 也没有走过这条路。

01

AI要成为生产力工具

访谈刚开始,李想就抛出一个事实——虽然人工智能国内发展很快,但自己每天的工作时间并没有减少,还是在增加。

这是因为大多数人还把AI当做信息工具,李想认为AI仅仅作为信息工具是不*的,某种程度上,眼下的 AI 仍然是在做熵增,会增加大量的无效信息、无效结果、无效结论。

正视AI的工具属性,也是李想在过去的几个月,在内部跟很多人重点讨论的问题。

李想把AI工具分为三个层级,分别是信息工具、辅助工具和生产工具,作为信息工具时,仅具备参考价值。

如果把AI视为辅助工具,可以提升效率,比如现在的辅助驾驶功能,或者用语音的方式来进行导航,打开美团或者听歌等,它会让我们的效率更高,但仍然离不开我们。

什么时候,能真正改变我们的工作的成果以及减少工作时长,就会变成生产工具,也就是Agent的诞生,在李想看来,那时才是人工智能真正爆发的时刻。

“判断Agent是否真正智能,关键在于它是否成为生产工具。就像人类会雇佣司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。”

为了迎接这个时刻,理想的“VLA司机大模型”应运而生,也可以称为司机 Agent,在李想看来,VLA司机大模型就是成为交通领域专业的生产工具。

其实在一个月前,理想汽车的下一代自动驾驶架构VLA就已经亮相了,VLA是视觉-语言-行为大模型,它将空间智能、语言智能和行为智能统一在一个模型里,赋予了模型强大的3D空间理解、逻辑推理和行为生成能力,让自动驾驶能够感知、思考和适应环境。

所以它既是一个能与用户、理解用户意图的智能体,也是一名听得懂、看得见、找得到的专属司机。

而李想希望这个智能体,能像人类司机一样工作,将来也能像人类司机那样创造商业价值。

在访谈中,理想还展示了搭载了VLA司机大模型的 demo 演示视频,在视频里,理想的这个“司机 Agen”展示了和人类司机类似的智能能力,不仅具备现有的优秀辅助驾驶能力,而且还能直接通过语音的方式和人类驾驶员高效交互。

比如在通过高速收费站时,直接说出“走人工”三个字,系统就可以从 ETC 收费通道转向人工收费通道,在日常驾驶和泊车环节,也可以通过“前方掉头”、“C 区停车”、“靠边停车”等简单指令,调整行车或泊车的路线。

换句话讲,人类和VLA之间类似人和代驾的关系,人们怎么和代驾说,就怎么和司机Agent说。

在主持人提问试驾VLA的车有没有惊喜时刻时,李想颇为“凡尔赛”地表示,挺难有什么惊喜时刻,因为当你把它当做一个人看待时,它所呈现出的表现就很正常。

当然,当普通用户*次看到 VLA 的测试视频的时候,还是会惊讶于它的表现。

在谈及VLA司机大模型的时候,李想特意先感谢了DeepSeek,正是因为当初DeepSeek的开源,才让VLA推出的速度比原来的预期要快。

按照李想的说法,其内部原本打算要到今年年底才能做出能够满足需求的语言模型,但DeepSeek一开源,瞬间就加速了9个月的时间。

不过DeepSeeK的开源只是加速了 VLA的L(language 语言)的部分,像VL(视觉和语言)的组合语料,无论是OpenAI还是DeepSeek,都没有这样的数据,也没有这样的场景和需求,只能自己来做。

按照李想的话说,“我可以站在巨人的肩膀上,但是它只是我其中的一部分”。

其更是在访谈上直言,自己之所以将自研的整车操作系统理想星环OS给开源了,一方面是出于对DeepSeeK的感谢,一方面也是因为受到了那么大的帮助,所以自己认为应该对社会做点什么贡献,不让行业这么卷。

02

辅助驾驶的三个阶段

VLA就像一个「司机大模型」,可以像人类司机一样工作,不过 VLA 的诞生不是突变,而是进化,毕竟“没有办法直接吃第十个包子”。

整个过程经历了三个阶段,对应了理想汽车辅助驾驶的昨天、今天和明天。

*阶段,李想将其比喻为“昆虫动物智能”:通过机器学习感知配合规则算法的分段式辅助驾驶解决方案,有既定的规则,同时还依赖高精地图,类似蚂蚁完成任务的方式。

仅仅百万量级的参数自然无法完成更复杂的事情,因此需要不断地加限定规则,形成类似“有轨交通”的形式。

这对应了理想汽车自2021年起,通过自研依赖规则算法和高精地图的辅助驾驶方案。

而第二阶段则对应了理想汽车自2023年起研究,并于2024年正式推送的端到端+VLM辅助驾驶。

李想将其称之为“哺乳动物智能”阶段:通过端到端大模型学习人类驾驶行为,比如马戏团里的一些动物像人类学习怎么骑自行车,它们能学会人类的各种行为,但其本身对物理世界的理解并不充分。

因此需要通过三维图像判断自身速度和轨迹以及在空间中所处的位置,虽然足以应对大部分泛化场景,但很难解决从未遇到过或特别复杂的问题,此时需要配合视觉语言VLM模型,但现有视觉语言模型在应对复杂交通环境时只能起到辅助作用。

在端到端的基础上,才能来到第三阶段,也就是李想说的“人类智能”的阶段,给出的答案就是VLA司机大模型。

它能通过3D和2D视觉的组合,完整地看到物理世界,而不像VLM仅能解析2D图像。同时,VLA拥有完整的脑系统,具备语言、CoT推理能力,既能看,也能理解并真正执行行动,符合人类的运作方式。

李想还列举了端到端+VLM架构可能无法解决,但VLA(视觉语言行动模型)可以解决的corner case(长尾案例)。

03

怎么才能像人一样开车

至于如何训练VLA,李想也做了详细的阐述,整个过程就像人学会如何开车一样。

*步是预训练,这一步的目标是让AI拥有对世界和交通的基础认知,就像人先学习各种交规知识一样。

这一步放入足够多的Language,Vision的语料和token。其中Vision包含两个部分,一部分是物理世界的3D Vision,另一部分是高清2D Vision,然后再放入VL(视觉和语言)联合的数据,例如将导航地图和车辆对导航地图的理解同时放入训练集中。

从而形成一个VL的基座模型,然后会被“蒸馏”成一个更小、能更快运行的约 32B 端侧的模型,保证它运行速度足够得顺畅。

第二步是后训练,在VL的基础上加入Action,Action部分的后训练类似人类去驾校学开车,能够直接从视觉到理解再到输出,形成一个初级的 VLA「端到端」模型。

李想还强调,不会做长思维链,一般是两步到三步,否则长时延会无法满足安全性。另外,当 Action 完成后,VLA 还会根据性能做4-8秒的扩散模型,预测轨迹和环境。

第三步属于强化学习,主要分为两部分,一是RLHF,基于人类反馈的强化学习,会参考大量人类司机的驾驶数据,当它做得好时得到鼓励,做得不好的时候,会得到反馈。

同时,理想汽车搭建了一个非常逼真的虚拟“交通世界”,有点像一个超高水平的模拟器,让AI在里面自己练习,这部分属于纯粹的强化学习。

在训练指标上,理想会通过G值来判断辅助驾驶的舒适性,同时做碰撞的反馈,还有交通规则的反馈。

不难看出,第三步,就相当于人类拿到驾照后,来到社会上来开车来强化自己的驾驶技能。当这三个步骤完成了以后,VLA 能够跑在车端的模型其实就产生了。

但还没有完事,这时虽然有了VLA司机大模型,但还无法做到人类跟VLA的交互,这时候理想就需要搭建一个司机 Agent,用自然语言教辅助驾驶系统应该如何开车。

如果是一些短指令,通用的短指令VLA司机大模型直接就处理了,不需要再经过云端。如果是一些复杂的指令,其实先要到云端的 32B 的基座模型那里,VL处理完以后,再整个交给VLA司机大模型来进行处理。

在李想看来,VLA是现阶段能力最强的架构,它的能力是最接近人类的,甚至有机会超过人类。但不一定是最*的架构。

“是否是一个效率最高的方式,是否有效率更高的架构出现,这些还要打个问号,我认为大概率还是会有下一代架构的。”

就像他说的那样,前面没有任何人走过这条路,理想其实走的是一个无人区。

“理想以前走的是汽车的无人区,以后走的是人工智能的无人区。”

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。。
您可能感兴趣的文章
  • 宾利品牌以开创性人工智能技术臻求皮革至境

    宾利汽车近日公布了一项开创性的人工智能技术,该技术将提升品牌标志性座驾内饰的工艺水平、可持续性及创新性,这正是宾利汽车Beyond100+商业战略的重要组成部分。人工智能皮革检测(AI...

    2025-05-09 09:47:02
  • 推5款车型东风纳米06开启预售售价8.99

    在预售发布会现场,东风纳米打造了露营的极致场景,展示了全新的生活方式,氛围感拉满,与其灵动、精致、朝气的气质相得益彰,吸引了众多现场观众前来打卡。东风纳米06为智趣生活小玩家而来,凭借...

    2025-05-09 03:29:29
  • 七丰精工股票两个交易日涨幅偏离值达43.0

    杨洋编|李亦辉 5月8日,七丰精工科技股份有限公司发布股票交易异常波动公告。公司股票在2025年5月7日至2025年5月8日两个交易日内,收盘价涨幅偏离值累计达到43.00%,符合《...

    2025-05-09 02:04:37
  • 从"头顶烧烤"到智能防晒,海优威“墨影瞬光

    5月8日,当智己L6开启预售的第20天,这款以全系标配“瞬感智控防晒天幕”为卖点的智能轿车背后的核心技术提供商——海优威终于走至台前,首次公开“墨影瞬光”液晶调光膜的技术细节。 天下...

    2025-05-09 01:28:39
  • 奥迪一季度营收增长12.4%维持全年业绩预

    盖世汽车讯近日,大众汽车旗下的高端品牌奥迪公布第一季度财报,一季度营收为154.3亿欧元,而去年同期为137.3亿欧元,同比增长12.4%,主要得益于搭载V6/V8发动机车型的销售占比...

    2025-05-08 22:31:03
  • 中国鄂州跨境电商综试区葛店跨境电商产业园揭

    中国跨境电商综合试验区葛店跨境电商产业园与湖北省航空物流与供应链行业产教融合共同体8日在长江职业学院武汉新城校区同步揭牌。 葛店跨境电商产业园创新性推出“产业带+人才链+跨境电商”融...

    2025-05-08 22:04:12
  • 海外动力电池回收是新蓝海吗?

    中国车企及动力电池企业“出海”正在开拓新的阵地——海外动力电池回收。近日,国轩高科与晋景新能达成战略合作,双方将在电池回收及售后服务体系建设等领域推进深度合作,面向全球共建回收及售后服...

    2025-05-08 21:04:47
  • 沃尔沃汽车旗下电池公司NovoEnergy

    盖世汽车讯据外媒报道,5月5日,沃尔沃汽车旗下的电池公司NovoEnergy表示,由于原合资方瑞典Northvolt公司破产,在重新评估业务后,为削减成本,公司将裁员50%。 Nov...

    2025-05-08 16:36:14
  • 雷诺17.6万美元电动汽车上市首周已斩获8

    盖世汽车讯据路透社报道,法国汽车制造商雷诺表示,尽管其新推出的限量版电动车型的起售价高达15.5万欧元,但上市首周仍已斩获850份订单。据悉,该款车型复刻了1980年款经典燃油掀背车R...

    2025-05-08 15:54:50
  • ST恒立:公司收到终止上市事先告知书

    冯秀语编|李亦辉 5月7日,*ST恒立公告,公司于2025年5月7日收到深圳证券交易所送达的《终止上市事先告知书》。告知书指出,因公司2023年度经审计的净利润为负值且营业收入低于1...

    2025-05-08 12:01:24
精彩推荐
热门文章
新增越野版2026款本田CR-V官图正式发布派特鲜生获1.8亿元天使轮融资,宠物经济叠加青春业态,市场潜力这么大万亿级股份行,一副行长辞任!火速执行!这些地方明起下调公积金贷款利率超长续航超大空间超快充电起亚EV5带你玩转五一假期英国4月新车销量同比下降10.4%,纯电动车销量同比增长8.1%Rivian第一季度净亏损大幅收窄,下调今年电动汽车交付预期2025跨境新趋势:西之月重塑跨境供应链效率,打造出海通路公积金贷款利率下调!100万本金月供少还132元特斯拉Model3/Y零部件95%来自中国;传奇瑞寻求香港IPO筹资约1A股,又见国企整合!交易价格超40亿元莱绅通灵股票交易连续两个交易日涨幅偏离超20%翰宇药业利拉鲁肽原料药获韩国审批受理市场结构性震荡寻找高波“固收+”强队