端侧AI破局:面壁智能如何以1B参数撬动万物智能新生态

2 阅读

人工智能的下半场战场,正从云端算力中心迅速向物理世界的边缘节点迁移。这并非简单的技术延伸,而是一场关于算力效率、能耗控制与场景适配的深层重构。在2026年6月12日举办的北京智源大会上,面壁智能以其在端侧大模型领域的深耕成果,揭示了AI从“云端交互”迈向“物理世界”的关键路径。面对“体积、算力、能耗”这三大制约端侧AI规模化落地的核心瓶颈,行业亟需跳出单纯追求参数规模的传统误区,转而追求模型的能力密度与极致高效。

智源大会|技术、应用、生态协同发力 面壁智能描绘端侧 AI 新图景

从“可用”到“好用”:端侧智能的工程化跃迁

端侧AI的发展阶段,本质上是从“功能实现”向“体验优化”的跨越。早期的端侧模型往往受限于硬件性能,仅在特定任务上表现尚可,难以形成完整的感知-决策闭环。面壁智能在智能座舱领域的实践,为这一跃迁提供了极具参考价值的样本。

photoLink

在搭载面壁智能量产级多模态模型的智能座舱中,系统摒弃了对云端的依赖,能够在本地完成从感知、记忆、推理到执行的完整闭环。这种架构不仅降低了网络延迟带来的交互迟滞,更提升了数据隐私的安全性。具体而言,系统能够自动串联车控功能,根据环境与乘客状态进行无感车窗、无感空调调节。更为关键的是,在紧急场景下如车辆事故,SuperMate系统能实时识别状态,介入安抚驾驶员情绪,并引导完成定责定损流程。这种从单一功能响应到全链路服务的能力,标志着端侧AI真正具备了“类人”的语境理解与主动服务能力。

然而,实现这种“无感智能”并非易事。李大海指出,端侧设备面临着严苛的物理限制。传统的云端大模型架构无法直接平移至移动端或车端,必须在保持高智能水平的同时,大幅降低计算负载。这要求技术团队在算法优化、模型压缩以及硬件协同上取得突破,而非仅仅依赖堆砌算力。

技术内核:以“能力密度”破解资源困局

为了解决端侧AI的资源受限问题,面壁智能构建了覆盖数据、模型、训练、推理及智能体系统的全栈高密度技术体系。其核心逻辑在于:通过极致压缩模型体积,同时通过技术手段尽可能保留模型的核心认知能力,即提高“智能密度”。

在这一理念指导下,面壁智能发布了MiniCPM5-1B模型。该模型仅拥有1B(十亿)参数规模,却在国际权威榜单AA-Index上超越了所有2B参数以下的模型。相较于3个月前发布的Qwen3.5-2B,MiniCPM5-1B在参数量减半的情况下,性能表现更优。这一突破的意义在于,它证明了小参数模型在特定优化下,完全具备处理复杂逻辑任务的能力。这对于在智能手机、物联网设备等资源受限场景下的部署具有里程碑意义。

MiniCPM5-1B的训练过程同样体现了技术自主性。该模型由面壁智能自主研发的AI训练框架ForgeTrain预训练完成。ForgeTrain是全球首个完全由AI编写的生产级大模型预训练框架,全程无人类程序员参与。这种“AI训练AI”的模式,不仅摆脱了人工调参的繁琐,其训练速度相比英伟达Megatron快了10%,为模型迭代提供了更高的效率与更低的成本。

国产算力适配:BitCPM-CANN的差异化路径

在供应链安全与算力自主可控的大背景下,大模型对国产算力平台的适配成为行业焦点。面壁智能发布的BitCPM-CANN,是国内首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。

这一成果的技术含金量在于其全链路的原生适配。从量化算子、训练算法到全链路框架,均在昇腾平台上完成,而非简单的移植或微调。相比传统的BF16精度模型,BitCPM-CANN在推理阶段释放了约6倍的显存红利,同时将模型能力保留率维持在90%–97.2%的高位。这种高精度的量化技术,使得大模型能够在显存有限的具身机器人、汽车、手机等设备上稳定运行,为国产硬件生态接入高端AI能力打通了关键堵点。

生态协同:从“内卷”到“外卷”的孵化新范式

技术创新若缺乏生态支撑,极易陷入孤军奋战的困境。端侧AI涉及硬件制造、操作系统、算法开发、应用场景等多个环节,单一企业难以覆盖全链条。为此,面壁智能联合北京智源人工智能研究院、OpenBMB开源社区,发起了“智能体+硬件创新加速孵化器”。

智源大会|技术、应用、生态协同发力 面壁智能描绘端侧 AI 新图景

这一举措的底层逻辑,是对中国AI发展路径的重新思考。首席科学家刘知远提出,中国AI不应仅仅在同一条赛道上复制OpenAI的模式(即“内卷”),而应走向端侧,走进未被充分定义的真实场景中,与硬件深度融合(即“外卷”)。这种“外卷”策略强调软硬结合,旨在通过孵化器将前沿技术快速转化为产业应用。

孵化器聚焦AI智能体、下一代AI硬件、AI垂直场景应用三大赛道,面向高校团队、新锐创业者开放。其提供的支持体系不仅包括最高500万的综合投资,还涵盖专属GPU算力、大模型Token额度、模型微调部署技术支持等核心资源。此外,通过1v1指导、产业客户对接及投融资服务,旨在解决早期团队在算力、技术、资金及落地渠道上的核心痛点。

这种“真资源、全赋能、高落地”的孵化体系,实际上是在构建一个从技术研发到初创孵化,再到产业规模化落地的完整闭环。通过汇聚全球创新力量,孵化器试图加速端侧AI技术的溢出效应,让每一个致力于端侧智能创新的团队都能借助产业势能高效起步。

展望:万物智能时代的协同进化

当前,端侧AI产业正处于高速成长期,但同时也面临着场景碎片化、硬件标准不一、开发门槛较高等挑战。面壁智能通过全栈技术突破降低技术门槛,通过开源共享促进技术普及,通过生态孵化加速应用落地,这三者构成了其推动端侧AI发展的完整闭环。

从MiniCPM5-1B的智能密度突破,到BitCPM-CANN的国产算力适配,再到智能体孵化器的生态构建,面壁智能的每一步都在回应端侧AI的核心命题:如何在有限的资源下,实现最大的智能价值。随着这些技术的成熟与生态的完善,AI将不再局限于云端的数据中心,而是深入汽车、机器人、家居等物理世界,成为像电力和水一样无处不在的基础设施。

未来,端侧AI的竞争将不再是单一参数的比拼,而是整个技术栈、生态系统以及场景落地能力的综合较量。面壁智能通过“技术+生态”的双轮驱动,正在描绘一幅端侧AI与硬件深度融合的新图景。对于行业而言,这不仅是技术的进步,更是AI应用范式的一次深刻变革。唯有通过技术、应用、生态的协同发力,才能真正实现从“云端智能”到“万物智能”的跨越,让AI在物理世界中生根发芽,创造出更具价值的实际应用场景。

photoLink