86

浪潮信息元脑品牌:车载计算赋能-从域控EIS400到软件框架AutoDR

a_632025-08-07 15:48:10   来源:盖世汽车  阅读量:13634   

2025年7月22日,在第八届智能辅助驾驶大会上,浪潮信息边缘车载计算团队负责人张清对EIS400域控平台和AutoDRRT框架进行了详细介绍,

EIS400域控平台采用混合异构架构,算力达1000 TOPS,支持L2++到L4级场景,具备灵活扩展与安全容错能力。软件层面,AutoDRRT计算框架实现多SoC自动化分布式并行,支持多种模型架构,解决迁移与性能优化问题,通过软硬件协同优化,显著降低端到端延时,提升计算效率。

AutoDRRT框架不断迭代,从1.0到2.0,针对不同模型架构实施延时优化,通信效率与数据传输效率大幅提升。目前正针对VLA大模型开展优化,已取得阶段性成果,并探索多芯片并行模式,强化容错计算能力,确保算法失效时快速切换,保障车载计算稳定可靠。

张清|浪潮信息边缘车载计算团队负责人

以下为演讲内容整理:

就智能辅助驾驶的技术趋势而言,AI模型算法正从2D+CNN/BEV+Transformer小模型向VLM/VLA大模型的方向演进。当前,模型规模正逐步扩大,此前CNN模型规模可能仅为二十几兆或10兆量级,而目前已有规模接近10B量级的VLA模型处于研究阶段。在计算模式方面,正从基于分离的模块化架构向集中的端到端架构转变。计算需求也从百TOPS量级发展至目前的1000 TOPS量级。

图源:演讲嘉宾素材

目前,车载模型正朝着大模型方向发展,在此过程中面临两大计算挑战。一是在数据中心端,需解决大模型的训练问题。以特斯拉数据中心为例,从其发展态势来看,GPU数量逐年递增,截至2024年,已超过8万片。二是需解决车载大模型在车端算力有限情况下的部署及计算延时问题。此前,如Resnet模型的计算延时可低至8ms,而目前部分VLE模型的计算延时已高达1800ms,这显然无法满足车载低延时计算的要求。因此,需从车载计算系统的硬件设计层面入手,同时结合软件进行协同优化,以解决计算延时问题。

图源:演讲嘉宾素材

我们在车载计算领域进行了相应布局,主要涵盖两个方面。在数据中心端,我们提供大模型AI训练平台、高并发仿真的GPU计算平台,以及用于大规模数据处理的大模型CPU处理平台。在边缘侧,我们依托路侧计算平台与车载计算平台,共同支撑单车智能、车路协同以及车路云等应用场景。

边缘侧涵盖了路侧及车端的计算产品,包括边缘盒子型设备,其算力为200/275 TOPS,可支撑车路协同场景;还有与合作伙伴联合研制的边缘服务器产品。此外,在车载域控方面,我们提供单SoC平台,算力达100 TOPS,用于解决L2++级应用场景需求;同时还推出了4*SoC的大算力域控平台。

EIS400这一平台级域控平台旨在应对车载大模型对大算力的需求。从平台架构来看,如云图所示,其采用了混合异构架构,由CPU搭配四个SoC以及MCU,构成异构分布式布局,算力可达1000 TOPS,能够满足从L2++到L4级别的应用场景需求。整个平台的设计延续了我们在边缘计算领域所秉持的模块化设计理念,支持不同的SoC、IO、存储以及网络单元,具备出色的灵活扩展能力,可实现快速产品化。

图源:演讲嘉宾素材

此外,在解决计算问题的同时,该平台域控还充分考虑了安全容错机制。系统采用充分的冗余架构设计,在计算、通信以及IO等方面均实现了容错功能。上图左侧展示的是整个SoC部分,其中包含了相应的以太网互联架构,以及支持P3E的互联架构。

除车载硬件系统设计外,在软件层面,我们正着力研发相关计算框架,以解决车载大模型从单个SoC迁移至多个SoC时面临的迁移问题与性能优化问题。我们的AutoDRRT平台是一个能够实现多个SoC自动化分布式并行,且具备安全容错与低延时特性的计算框架。该平台支持2D + CNN小模型、BEV + Transformer模型,以及当前VLM、VLA等大模型。

图源:演讲嘉宾素材

在分布式计算方面,该平台解决了应用快速迁移问题,可实现零代码从单个SoC到多个SoC的自动分布式并行;在容错方面,保障应用安全运行,实现失效可操作,且在算法失效过程中,备用算法能够实时接管,完成低延时切换;在低延时计算方面,CNN算法已实现端到端延时达60ms,BEV算法端到端延时可达到100ms量级。

另外是AutoDRRT,该平台架构采用五层设计。底层涵盖不同芯片架构平台的硬件支持,以及基础工程层面的通信、调度优化与分布式编排报告。中间层为计算加速层,针对特定算子和典型库进行加速,为上层应用开发提供工具和算法API支持。

图源:演讲嘉宾素材

该框架首要解决的是低延时问题。在车载模型部署中,计算资源和仿真能力受限,且对时间有严格约束。我们的低延时计算设计理念强调软硬件协同优化,需综合考虑算法流水线的整体延时及其可扩展性。优化工作从多个维度展开:一是系统层面,包括硬件系统级优化,针对硬件架构和芯片单元特点进行针对性优化;二是软件环境层面优化;三是应用框架级,针对整个算法流水线进行优化;最后是微观层面的算法内核级优化。我们将从上述多个维度采取相应方法推进优化工作。

在AutoDRRT 1.0阶段,我们针对基于CNN的模型架构实施了一系列延时优化方法,这些方法涵盖硬件层面与算法层面,大大小小共计40余种。通过这套完整的优化方法体系,端到端延时从原来的875ms显著降低至优化后的94ms,实现了近一个量级的提升。

为验证优化效果在实际应用场景中的表现,我们采用仿真模拟的方式进行测试,部署了AutoDRRT+AWSIM仿真器,硬件采用EIS400域控以及GPU服务器作为仿真平台,运行L4级场景。从AutoDRRT的架构布局来看,我们将全部算法分布于5个计算单元中,共计229个算法,整体延时可控制在60毫秒左右。

图源:演讲嘉宾素材

在AutoDRRT 2.0中,我们开展了基于BEV+Transformer模型架构的延时优化工作。针对BEV部分,整体融合策略从后融合转变为中融合,此过程中需重点考虑模型算法的加速问题。为此,我们对相关典型算法库进行了内核级优化,针对BEV data实现了一倍的性能加速。

通信方面,我们实现了对DDS的全面支持,通信接口从以太网扩展至PCIE,满足了大数据通信需求,通信效率提升了4倍。同时,我们还对数据IO吞吐进行了优化,使IO传输效率提高了6倍。这些优化措施有效解决了BEV相关算法在部署过程中的延时问题。

图源:演讲嘉宾素材

我们与某主机厂针对NOA场景进行了测算,在应用AutoDRRT 2.0及其优化后的BEV感知算法后,该场景下的整体端到端延时可控制在99毫秒。

图源:演讲嘉宾素材

此外,基于实际车端测试需求,我们正与合作伙伴开展相关合作,主要构建BEV+Transformer的闭环仿真体系。该体系旨在打通数据采集、模型训练与车端验证的全流程,形成完整闭环。同时,测试工作采用AutoDRRT平台在车端进行完整测试,目前该平台已支持不同模型的部署。

目前,我们正针对最新的VLA模型开展延迟优化相关工作,此类模型规模更大、参数更为复杂。我们选取了一个参数量接近十亿级的VLA模型进行优化试验,当前已取得阶段性成果。

经优化,该模型可在2Hz频率下稳定运行。最初,模型运行一次需8秒钟,通过内核优化、算子融合以及解码优化等手段,运行时间已缩短至0.4秒。不过,我们的目标是将延迟控制在100ms以内,后续还需通过量化等方法进一步优化。

除针对单个SoC在不同算法层面开展软硬件优化外,我们还需关注从单个SoC扩展至两个甚至更多芯片单元的并行与分布式并行问题。这需要首先解决从单个SoC到多个SoC的快速自动化分布式并行问题。

其次,需解决并行模式问题。此前,框架中更多采用任务并行与数据并行模式,目前我们也在研究针对大模型的pipeline并行、张量并行以及专家模型并行等模式,旨在使车载大模型能够在多维度测试中快速实现并行化,并达到较优的延时效果。

此前,在采用任务并行与数据并行模式时,我们将算法的pipeline分布于五个计算单元上。通过这种分布式并行方式,一方面能够实现硬件资源的快速合理利用,另一方面相较于单个SoC,可显著提升性能表现。在此案例中,端到端延时较单个SoC降低了200毫秒。

图源:演讲嘉宾素材

我们的思考不仅局限于计算层面,还充分考虑了平台的容错计算能力。在软件框架中,我们充分采用了设备监控以及功能算法节点监控模块,确保失效的算法模块能够快速被备份节点切换接管。整体切换延时可控制在1ms量级以内。

边缘车载计算团队负责人张清于2025年7月22日在第八届智能辅助驾驶大会发表的《车载计算赋能:从域控EIS400到软件框架AutoDRRT》主题演讲。)

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

推荐阅读
浪潮信息元脑品牌:车载计算赋能-从域控EIS400到软件框架AutoDR
头条

2025年7月22日,在第八届智能辅助驾驶大会上,浪潮信息边缘车载计算团队负责人张清对EIS400域控平台和AutoDRRT框架进行了详细介绍, EIS400...

2025-08-07

优哩哩S2K2C模式:全球跨境电商的创新运营范式
头条

在数字经济重塑全球贸易格局的背景下,优哩哩打造的 S2K2C模式,以“供给端(S)—流量端(K)—消费端(C)”的协同架构,为跨境电商行业提供了一套可...

2025-08-07

采用全新设计语言奔驰GLCEV将于9月首发
头条

近日,车质网从相关渠道获悉,梅赛德斯-奔驰即将推出全新纯电SUV——GLCEV,新车将于9月7日在慕尼黑IAAMobility车展全球首发。作为奔驰电动车阵容中...

2025-08-07

暑期出行最优解,问界新M5Ultra全能实力护航每段旅程
头条

在暑期这一出行高峰期,一辆能应对复杂路况、保障安全舒适、兼顾续航与性价比的座驾,成为许多人的刚需。问界新M5Ultra凭借在辅助驾驶、安全防护、续航能力等方面的...

2025-08-07

智野护航,征途再启!猛士M817“俞你同行”内蒙全境穿越冲
头条

由知名企业家、新东方创始人俞敏洪发起的俞你同行内蒙全境穿越之旅,已顺利完成前9天行程。作为18天行程的中场节点,这场由智能越野第一车猛士M817护航的探索之旅,...

2025-08-07

暑期“小胖墩”减重应讲科学,全国现存健身企业超163.6万
头条

暑假期间,不少“小胖墩”因饮食不节制、缺乏运动等,体重飙升,甚至引发健康问题。肥胖不仅影响孩子外在形象,更会增加糖尿病、心血管疾病风险,引发自卑等心理问题。假期...

2025-08-07

哈尔滨:把冰雪“搬进”夏天,超3800家企业黑龙江省冰雪经
头条

三伏天里,当全国多地酷热难耐时,哈尔滨却凭借独特的夏日冰雪文旅业态,成为游客心中的“清凉魔法师”。梦幻冰雪馆内,零下10摄氏度的寒气与室外高温形成鲜明对比,9大...

2025-08-07

各地文旅冰品引潮流,冰淇淋相关企业全国已达4.3万家
头条

暑期旅游旺季,各地文创冰品成热门。在西安大唐不夜城,“冰馍馍”文创冰淇淋外形还原陕西肉夹馍,内馅咸甜融合,包装是本地农民画师创作,满是陕西味儿。此外,还有大雁塔...

2025-08-07

JINS TODAY 2025秋冬潮流系列上新!营造休闲运
头条

随着消费者对舒适与时尚需求的提升,运动风格逐渐成为日常穿搭的主流。时尚眼镜JINS睛姿敏锐捕捉这一趋势,推出JINSTODAY2025秋冬潮流系列新品,通过设计...

2025-08-07

顶配成标配,理想i8对30-40万级纯电SUV市场展开强势
头条

8月5日,理想汽车宣布理想i8统一版本,标配即顶配,售价统一为33.98万元。此次调整以此前的Max版本为标准配置,售价降低1万元,并赠送价值1万元的铂金音响,...

2025-08-07

做增程不一定有用,但不做增程更没机会
头条

“增程最没技术含量,打死不做增程。” “做增程的车企销量很好,消费者的选择不会骗人。” 这几年,身边汽车圈内人士对增程车的态度大致分为上述两种,一种对增程式...

2025-08-07

上市一周年销量超10万台途岳新锐2026款惊喜回馈
头条

自去年成都上市以来,途岳新锐凭借7.99万元起的创新一口价模式、从动力总成升级到整车的无忧终身质保政策、以及省油耐久的全面产品力,收获市场和用户的高度认可,累计...

2025-08-07

李想透露理想i8小订破3万
头条

理想汽车CEO李想近日通过抖音平台透露,其首款纯电SUV车型理想i8上市后市场反响积极,小订用户数量已突破3万人。 李想表示,团队在短时间内对i8的配置和价格...

2025-08-07

佛瑞亚海拉联手亿纬锂能,在中国实现12V锂电池管理系统全球首次量产
头条

8月6日,佛瑞亚海拉宣布,其联手亿纬锂能在中国实现了12V锂电池管理系统全球首次量产,并即将登陆欧洲主流豪华品牌乘用车。 据悉,该系统具备以下特点:精准监测与...

2025-08-07

没有预售价,6分钟小定破万,全新小鹏P7怎么做到的?
头条

8月6日,全新小鹏P7正式亮相并开启预订。新车共发布3款车型,分别为702km长续航版、820km超长续航版、750km高性能版。 图源:小鹏 需要指出的是...

2025-08-07

阳光人寿宁波中支工会组织开展春季踏青活动

时值仲春、阳和初起,正是春游踏青的好时光。为丰富员工业余生活,营造和谐融洽、团结向上的工作氛围,3月23日,阳...

这所城乡接合部的新学校,为招生曾挂过三块牌子

#8203;“上级对我提的要求,就是让寒门子弟接受更好的教育,让普通孩子上好学。”一所城乡接合部的新学校,为招...

东航坠机现场:救援人员获得飞机残骸定位信息

新京报讯据中国民用航空局消息,3月21日,东航一架波音737客机在执行昆明--广州航班任务时,于梧州上空失联。...

调研指今年就业形势基本稳定实体产业人才吸引力增加

专业人力资源机构中智公司21日发布的最新调研结果显示,2022年中国就业形势基本稳定,实体产业对人才吸引力增加...

大黄鱼上热搜背后的“黑科技”

大黄鱼上热搜背后的“黑科技”前不久,浙江渔民一网捞上近2.5吨大黄鱼卖出957万元的新闻,让东海大黄鱼上了热搜...