端侧AI破局：面壁智能如何以1B参数撬动万物智能新生态

2026-07-02 13:17 2 阅读

人工智能的下半场战场，正从云端算力中心迅速向物理世界的边缘节点迁移。这并非简单的技术延伸，而是一场关于算力效率、能耗控制与场景适配的深层重构。在2026年6月12日举办的北京智源大会上，面壁智能以其在端侧大模型领域的深耕成果，揭示了AI从“云端交互”迈向“物理世界”的关键路径。面对“体积、算力、能耗”这三大制约端侧AI规模化落地的核心瓶颈，行业亟需跳出单纯追求参数规模的传统误区，转而追求模型的能力密度与极致高效。

智源大会｜技术、应用、生态协同发力面壁智能描绘端侧 AI 新图景

从“可用”到“好用”：端侧智能的工程化跃迁

端侧AI的发展阶段，本质上是从“功能实现”向“体验优化”的跨越。早期的端侧模型往往受限于硬件性能，仅在特定任务上表现尚可，难以形成完整的感知-决策闭环。面壁智能在智能座舱领域的实践，为这一跃迁提供了极具参考价值的样本。

photoLink

在搭载面壁智能量产级多模态模型的智能座舱中，系统摒弃了对云端的依赖，能够在本地完成从感知、记忆、推理到执行的完整闭环。这种架构不仅降低了网络延迟带来的交互迟滞，更提升了数据隐私的安全性。具体而言，系统能够自动串联车控功能，根据环境与乘客状态进行无感车窗、无感空调调节。更为关键的是，在紧急场景下如车辆事故，SuperMate系统能实时识别状态，介入安抚驾驶员情绪，并引导完成定责定损流程。这种从单一功能响应到全链路服务的能力，标志着端侧AI真正具备了“类人”的语境理解与主动服务能力。

然而，实现这种“无感智能”并非易事。李大海指出，端侧设备面临着严苛的物理限制。传统的云端大模型架构无法直接平移至移动端或车端，必须在保持高智能水平的同时，大幅降低计算负载。这要求技术团队在算法优化、模型压缩以及硬件协同上取得突破，而非仅仅依赖堆砌算力。

技术内核：以“能力密度”破解资源困局

为了解决端侧AI的资源受限问题，面壁智能构建了覆盖数据、模型、训练、推理及智能体系统的全栈高密度技术体系。其核心逻辑在于：通过极致压缩模型体积，同时通过技术手段尽可能保留模型的核心认知能力，即提高“智能密度”。

在这一理念指导下，面壁智能发布了MiniCPM5-1B模型。该模型仅拥有1B（十亿）参数规模，却在国际权威榜单AA-Index上超越了所有2B参数以下的模型。相较于3个月前发布的Qwen3.5-2B，MiniCPM5-1B在参数量减半的情况下，性能表现更优。这一突破的意义在于，它证明了小参数模型在特定优化下，完全具备处理复杂逻辑任务的能力。这对于在智能手机、物联网设备等资源受限场景下的部署具有里程碑意义。

MiniCPM5-1B的训练过程同样体现了技术自主性。该模型由面壁智能自主研发的AI训练框架ForgeTrain预训练完成。ForgeTrain是全球首个完全由AI编写的生产级大模型预训练框架，全程无人类程序员参与。这种“AI训练AI”的模式，不仅摆脱了人工调参的繁琐，其训练速度相比英伟达Megatron快了10%，为模型迭代提供了更高的效率与更低的成本。

国产算力适配：BitCPM-CANN的差异化路径

在供应链安全与算力自主可控的大背景下，大模型对国产算力平台的适配成为行业焦点。面壁智能发布的BitCPM-CANN，是国内首个完全基于国产算力平台（华为昇腾）实现端到端训练并开源的三值（1.58-bit）大模型。

这一成果的技术含金量在于其全链路的原生适配。从量化算子、训练算法到全链路框架，均在昇腾平台上完成，而非简单的移植或微调。相比传统的BF16精度模型，BitCPM-CANN在推理阶段释放了约6倍的显存红利，同时将模型能力保留率维持在90%–97.2%的高位。这种高精度的量化技术，使得大模型能够在显存有限的具身机器人、汽车、手机等设备上稳定运行，为国产硬件生态接入高端AI能力打通了关键堵点。

生态协同：从“内卷”到“外卷”的孵化新范式

技术创新若缺乏生态支撑，极易陷入孤军奋战的困境。端侧AI涉及硬件制造、操作系统、算法开发、应用场景等多个环节，单一企业难以覆盖全链条。为此，面壁智能联合北京智源人工智能研究院、OpenBMB开源社区，发起了“智能体+硬件创新加速孵化器”。

智源大会｜技术、应用、生态协同发力面壁智能描绘端侧 AI 新图景

这一举措的底层逻辑，是对中国AI发展路径的重新思考。首席科学家刘知远提出，中国AI不应仅仅在同一条赛道上复制OpenAI的模式（即“内卷”），而应走向端侧，走进未被充分定义的真实场景中，与硬件深度融合（即“外卷”）。这种“外卷”策略强调软硬结合，旨在通过孵化器将前沿技术快速转化为产业应用。

孵化器聚焦AI智能体、下一代AI硬件、AI垂直场景应用三大赛道，面向高校团队、新锐创业者开放。其提供的支持体系不仅包括最高500万的综合投资，还涵盖专属GPU算力、大模型Token额度、模型微调部署技术支持等核心资源。此外，通过1v1指导、产业客户对接及投融资服务，旨在解决早期团队在算力、技术、资金及落地渠道上的核心痛点。

这种“真资源、全赋能、高落地”的孵化体系，实际上是在构建一个从技术研发到初创孵化，再到产业规模化落地的完整闭环。通过汇聚全球创新力量，孵化器试图加速端侧AI技术的溢出效应，让每一个致力于端侧智能创新的团队都能借助产业势能高效起步。

展望：万物智能时代的协同进化

当前，端侧AI产业正处于高速成长期，但同时也面临着场景碎片化、硬件标准不一、开发门槛较高等挑战。面壁智能通过全栈技术突破降低技术门槛，通过开源共享促进技术普及，通过生态孵化加速应用落地，这三者构成了其推动端侧AI发展的完整闭环。

从MiniCPM5-1B的智能密度突破，到BitCPM-CANN的国产算力适配，再到智能体孵化器的生态构建，面壁智能的每一步都在回应端侧AI的核心命题：如何在有限的资源下，实现最大的智能价值。随着这些技术的成熟与生态的完善，AI将不再局限于云端的数据中心，而是深入汽车、机器人、家居等物理世界，成为像电力和水一样无处不在的基础设施。

未来，端侧AI的竞争将不再是单一参数的比拼，而是整个技术栈、生态系统以及场景落地能力的综合较量。面壁智能通过“技术+生态”的双轮驱动，正在描绘一幅端侧AI与硬件深度融合的新图景。对于行业而言，这不仅是技术的进步，更是AI应用范式的一次深刻变革。唯有通过技术、应用、生态的协同发力，才能真正实现从“云端智能”到“万物智能”的跨越，让AI在物理世界中生根发芽，创造出更具价值的实际应用场景。

photoLink