• 股票资金配资 跨越特斯拉的“海量数据”,商汤“智驾版DeepSeek”来了

  • 发布日期:2025-04-23 21:04    点击次数:85

    股票资金配资 跨越特斯拉的“海量数据”,商汤“智驾版DeepSeek”来了

    2月22日,以“模塑全球 无限可能”为主题的2025GDC全球开发者先锋大会在上海举办,旨在探索大模型产业化解决方案。商汤绝影CEO股票资金配资,商汤科技联合创始人、首席科学家王晓刚发布行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练。

    这与DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

    2022年底,商汤绝影提出了行业首个感知决策一体化自动驾驶通用模型UniAD,同年8月,特斯拉CEO马斯克直播试驾FSD V12,即端到端自动驾驶技术,越来越多的车企和科技公司开始跟进端到端的技术路线。如今,数据驱动的端到端自动驾驶解决方案已成为行业共识。

    端到端的自动驾驶本质是通过海量的高质量人类驾驶数据,来实现最佳的“模仿”驾驶效果。然而,基于模仿学习的技术范式可以做到接近人类但难以突破人类能力上限。同时,受限于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端智驾方案要达到人类驾驶能力的天花板并不容易,动辄千万Clips的高质量数据回流形成了规模门槛。

    特斯拉通过七百万辆高阶智驾量产车和超10万P算力,已经跨越了这个门槛,同时也构筑了与国内车企具有数量级差距的基础设施壁垒。

    然而,大模型性能的提升多依靠进一步扩大算力规模和增加模型参数,一定程度上变成了算力的比拼。今年春节期间,DeepSeek-R1基于纯强化学习的关键创新引发了广泛的关注。通过少量高质量数据的冷启动,模型进行多阶段的强化学习训练,有效降低大模型训练的数据规模门槛。更重要的是,强化学习能够让大模型自行涌现出长思维链能力,显著提升推理效果,甚至可能具备超越人类的思维能力。

    王晓刚表示,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发之中。

    从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。

    从性能上限来看,纯强化学习训练让端到端智驾模型有望通过在提升性能的同时,探索多元场景和驾驶风格。未来,端到端智驾体验的上限不再是“类人”,而是可以拥有超越人类的驾驶表现。

    商汤绝影的R-UniAD是“多阶段强化学习”端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。

    “智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端”,去年11月,商汤绝影升级并发布“开悟”世界模型,其最基础也是最核心的能力是生成高质量视频数据,基于“开悟”,1个GPU产生的仿真数据相当于500台量产车的数据采集效果。

    在现场演示中,商汤绝影展示了“开悟”世界模型与主车闭环交互的方式。通过场景库文件导入一个BEV视角下的初始主车和他车位置,世界模型自动生成主车视角下11V(11个摄像头)的传感器仿真数据,端到端模型接收到这一数据后,生成自车下一时刻位置并进行反馈,世界模型根据刷新的主车位置和预测的他车位置渲染新的11V传感器仿真数据。

    商汤绝影的量产端到端智驾方案预计将在年底交付,“开悟”世界模型也正式用于数据生产。而在今年4月的上海车展上,商汤绝影将会展示“与世界模型协同交互的端到端自动驾驶方案”的实车部署。

    依托商汤大装置算力基础设施,商汤绝影能够建立云端自动驾驶大模型,蒸馏得到可以部署在更小算力芯片的端到端模型,助力车企合作伙伴,基于更小数量级的数据,超越特斯拉依靠百万台量产车数据回流的自动驾驶方案,超越人的驾驶水平。

    南方+记者 郜小平