首页 > 车圈原创 > 车圈原创 > 行业首个!商汤正式开源原生多模态架构NEO,训练仅需1/10数据量

行业首个!商汤正式开源原生多模态架构NEO,训练仅需1/10数据量

发布时间:2025-12-03 10:41:40来源: 13041198719

12月2日消息,昨天,商汤科技正式发布并开源了全新多模态模型架构NEO,该架构由商汤科技和新加坡南洋理工大学AI技术实验室S-Lab合作研发,是行业首个可用的、实现深层次融合的原生多模态架构,基于NEO架构的NEO模型仅用3.9亿训练数据,就达到了模块化架构下顶级VLM(视觉-语言模型)模型的性能,数据量仅需其他同等性能模型的1/10。

从基准测试来看,NEO模型在多模态能力综合评估、跨学科和复杂推理等多项指标中碾压上海AI Lab推出的Mono-InternVL-1.5、清华大学、上海AI Lab联合商汤推出的HoVLE等原生VLM模型,还在多项视觉理解任务中追平通义千问的视觉语言模型Qwen2-VL、上海AI Lab联合商汤推出的InternVL3等基于模块化架构的顶级VLM模型。

当前,业内主流的多模态模型大多遵循“视觉编码器+投影器+语言模型”的模块化范式,本质上仍以语言为中心,图像与语言的融合仅停留在数据层面,视觉编码和语言解码分离,模型学习效率低下,在复杂多模态场景下处理任务受限。

为此,商汤科技抛弃了传统的模块化结构,推出从零设计的NEO原生架构。NEO架构在注意力机制、位置编码和语义映射进行了底层创新,构建一个统一的原生基元,让模型具备统一处理视觉与语言的能力。

NEO架构相关论文已发布在arXiv上,题为《从像素到文字——迈向大规模的原生视觉语言原始基元(From Pixels to Words — Towards Native Vision-Language Primitives at Scale)》,商汤科技联合创始人、执行董事及AI基础设施和大模型首席科学家林达华博士,南洋理工大学S-Lab负责人、副教授刘子纬等均在该论文的作者行列。

车圈原创更多>>

方盒子新选手登场 传祺越7官图正式发布 扒开2026款HR-V的配置表 本田已经这么勇了吗? 极氪8X底盘用料大揭秘,性能旗舰果然名不虚传 全新奔驰纯电GLC SUV开启预售;字节跳动声明无造车计划 比亚迪城市智驾兜底,其他车企为什么不跟? 外卖党、通勤族、预算党:城市通勤电摩到底该怎么挑 从月销过万到月销三千,新款尚界H5预售 能否助其重回万辆? 新势力过“生死线”,出口一片火热,真能止跌回暖 6月上市,零跑C10/C11/C16都改了啥? 消息称印度塔塔汽车计划引进奇瑞整车平台,推进高端电动汽车项目 单品牌力克日系三强,中国汽车改写韩国进口车市场格局 极狐品牌向上的接力棒,问道V9接手了 单月出口三刷纪录、新能源破10万:奇瑞集团5月销量快报 以一敌三碾压日系!比亚迪首次拿下韩国第三 大湾区车展实拍!上汽大众双ePro新车,合资插混终于亲民了 不要被厂家宣传带偏了!大五座和大六座SUV该怎么选? 丰田普锐斯PHEV召回!后车门开关线路有瑕疵免费回厂修正 上汽奥迪摊牌了! E7X的上市定价 让消费者永远是赢家 中国第四款专属配色/氤氲蓝主题/ 劳斯莱斯库里南新色发布 秋季上市 / 单电机续航900km / 启境GX7谍照首曝 GTI 灵魂正式电动化!大众 ID. Polo GTI 登场 80万车主之选,实测全维进阶的新红旗H5,家用商务两相宜! 要买轿车的有福了,上半年还有这5款值得期待,颜值高配置牛! 悦意08预售10.49万起,800V+6C快充,央企新品牌能打动年轻人吗 预售价37万元起,越野“卷王”全新猛士M817性能拉满! 比理想L6、汉兰达都大的星光L,要做一台更有品质的五菱 三品牌矩阵全员登场 蔚来全系阵容亮相粤港澳大湾区车展 10.49-14.49万元 一汽悦意08开启预售 2026款星途ES更多官图发布!智能化升级,配备猎鹰700+27个传感器 何小鹏公开\"抛弃\"激光雷达!纯视觉智驾要赢了