小鹏发力720亿参数自驾基模,开启自动驾驶新征程
作者:赵仓唐 栏目:热点 来源:中国广告网 发布时间:2025-04-24 13:57 阅读量:12179 会员投稿
内容摘要:小鹏聚力发力720亿参数自驾基模,自信开启自动驾驶全新征程 在汽车行业步入大模型研发热潮之际,4月14日,小鹏汽车于香港举办AI技术分享会,首次公开披露正在研发的720亿参数超大规模自动驾驶大模型——“小鹏世界基座模型”。未来,小鹏将采用...小鹏聚力发力720亿参数自驾基模,自信开启自动驾驶全新征程

在汽车行业步入大模型研发热潮之际,4 月 14 日,小鹏汽车于香港举办 AI 技术分享会,首次公开披露正在研发的 720 亿参数超大规模自动驾驶大模型 ——“小鹏世界基座模型”。未来,小鹏将采用云端蒸馏小模型的方式,把基模部署至车端,为 “AI 汽车” 装上全新 “大脑”,该模型还将为小鹏的 AI 机器人、飞行汽车等赋能。
小鹏汽车自动驾驶负责人李力耘介绍,小鹏基模以大语言模型作为骨干网络,借助海量优质驾驶数据训练,是多模态大模型。它具备视觉理解、链式推理及动作生成能力。经强大的强化学习训练,基座模型持续自我进化,有望逐步发展出超越人类的自动驾驶技术。
为研发基模,小鹏汽车早在去年便着手布局 AI 基础设施,现已建成国内汽车行业首个万卡智算集群,用以支撑基座模型的预训练、后训练、模型蒸馏、车端模型训练等任务。小鹏将这套从云到端的生产流程称作 “云端模型工厂”。目前,小鹏 “云端模型工厂” 算力达 10 EFLOPS,集群运行效率常年维持在 90% 以上,从云到端的全链路迭代周期平均 5 天一次。
早在 2024 年下半年,小鹏汽车就已面向 L4 级别的自动驾驶,研发全新的 “AI 大脑”—— 小鹏世界基座模型。研发团队利用优质自动驾驶训练数据,先后开发出多个尺寸的基座模型,目前正全力推进 720 亿(72B)超大规模参数世界基座模型的研发,其参数量约为主流 VLA 模型的 35 倍。
小鹏世界基座模型的显著优势是具备链式推理能力,在充分理解现实世界的基础上,能像人类一样进行复杂的常识推理,并将推理结果转化为行动,比如输出方向盘、刹车等控制信号,实现与物理世界的交互。未来,在基座模型的赋能下,智能驾驶系统有望从 “模仿人类” 迈向 “超越人类”,最终解决全场景的自动驾驶问题,包括模型从未在训练数据中遇到过的难题。
自设计之初,小鹏汽车就将基模定位为可泛化到多种具身终端的基座模型。李力耘表示:“小鹏世界基座模型是小鹏自动驾驶迈向 L3、L4 的基石,也会成为未来小鹏所有物理 AI 终端的通用模型。” 后续,小鹏世界基座模型将全面赋能小鹏 AI 体系,应用于小鹏汽车的 AI 汽车、AI 机器人、飞行汽车。
为开发小鹏世界基座模型,小鹏汽车打造了 “云端模型工厂”,其 “车间” 涵盖基座模型预训练、后训练、模型蒸馏、车端模型预训练到部署上车的完整生产链路。“云端模型工厂” 采用强化学习、模型蒸馏技术路线,能高效生产 “小身材、大智商” 的端侧模型,甚至可为不同需求的汽车定制专属 “大脑”,让 “千人千面” 的模型研发成为现实。
小鹏汽车自 2024 年开始搭建 AI 基础设施,目前已建立起万卡规模的智能算力集群,是国内汽车行业最大的自动驾驶算力集群。小鹏汽车算力储备达 10EFLOPS,集群利用率常年超 90%,高峰时运行效率可达 98%。
小鹏世界基座模型负责人刘博士介绍,多模态模型训练的瓶颈不仅在于 GPU,数据访问效率也需解决。小鹏汽车自主开发底层数据基础设施,使数据上传规模提升 22 倍、训练中的数据带宽提升 15 倍;通过联合优化 GPU/CPU 以及网络 I/O,最终让模型训练速度提高了 5 倍。目前,小鹏汽车用于训练基座模型的视频数据量高达 2000 万 clips,今年这一数字将增至 2 亿 clips。
依托强大的 AI 基础设施和数据基础设施,小鹏开启全新的基座模型研发范式,从云端模型预训练到车端模型部署,整个 “云端模型工厂” 的迭代周期平均 5 天一次。
在分享会上,小鹏汽车披露了基模研发的三个阶段性成果:验证规模法则在自动驾驶领域持续生效;在后装算力的车端成功实现基模控车;启动 720 亿参数基模训练,搭建针对强化学习的模型训练框架。
规模法则揭示了大模型性能随计算量、训练数据量和参数量提升而增强的规律,被视作 AI 领域的 “摩尔定律”。在大语言模型领域,规模法则已得到充分验证,但自动驾驶基座模型更为复杂,其训练数据包含摄像头信息、导航信息等物理世界的多模态数据,本质上要求模型对物理世界形成认知与理解。此前,利用驾驶数据训练基模,尤其是参数规模扩大到百亿级别后,规模法则是否依旧生效,行业内尚未有充分验证。小鹏团队首次证实了规模法则在自动驾驶领域持续有效。刘博士称:“过去一年,我们开展大量实验,在 10 亿、30 亿、70 亿、720 亿参数的模型上,均看到显著的规模法则效应:参数规模越大,模型能力越强。同样的模型大小,训练数据量越大,模型能力也越强。”
不久前,小鹏汽车将理论转化为实践,在后装算力的车端用小尺寸基模实现了控车。尽管只是早期实车测试,但全新基模已展现出令人惊喜的基础驾车技能。
小鹏汽车去年就已开展强化学习技术研发,以提升基座模型的性能上限。刘博士表示,强化学习能助力模型自我进化,学会处理训练数据中未出现的长尾问题,实现极致安全的自动驾驶。只有足够强大的基座模型,才能被强化学习不断激发能力上限。这也是小鹏汽车选择云端蒸馏路线的原因之一:在云端不计成本地训练出足够聪明且泛化能力强的模型,将其蒸馏到适配车端算力的小尺寸模型上,最终使车端模型性能突破车端算力限制。值得一提的是,强化学习、云端蒸馏等技术方案,在今年备受关注的 DeepSeek 论文中均得到验证。
基模研发是小鹏汽车 “AI 化” 转型的关键一步。即便进入 “大模型时代”,过去 “规则时代” 的领先经验仍在发挥作用。在开发强化学习的奖励模型时,研发团队依据规则经验设计奖励函数,将规则时代的沉淀转化为训练基座模型的生产力。
同时,小鹏汽车已着手开发世界模型,作为 “云端模型工厂” 的重要部分,为基座模型的性能优化提供支持。刘博士介绍,小鹏的世界模型是一种实时建模和反馈系统,能基于动作信号模拟真实环境状态,渲染场景,并生成场景内其他智能体(即交通参与者)的响应,构建闭环反馈网络,助力基座模型不断进化,逐步突破过去 “模仿学习” 的局限。
今年 6 月,小鹏汽车将在计算机视觉国际顶会 CVPR 上,进一步分享小鹏世界基座模型研发和训练成果的更多细节,值得期待。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。