端侧AI突围战:面壁智能如何以1B模型打破算力桎梏?
从云端到物理世界:AI进化的必然路径
人工智能的发展轨迹正在经历一次深刻的范式转移。过去十年,大模型的辉煌几乎全部建立在云端庞大算力集群的基础之上,这种“云-端”分离的架构虽然在初期迅速提升了模型能力,但也带来了高昂的延迟、隐私泄露风险以及巨大的能耗成本。随着技术瓶颈的显现,AI正在加速从云端交互走向物理世界,进入“从云到端”的全新阶段。这一过程不仅是算力的下沉,更是智能形态的根本性重构。
在2026年6月12日举办的北京智源大会上,面壁智能通过展示其多元化的应用场景、全栈自研的技术体系以及成熟的生态孵化能力,清晰地勾勒出端侧AI的未来图景。这一动作标志着AI产业重心开始从单纯追求参数规模的“大”转向追求能力密度与极致高效的“精”。端侧大模型不再仅仅是云端的缩小版,而是能够扎根于各类终端设备,实现实时感知与决策的核心组件。

突破“不可能三角”:端侧AI的技术重构

在智能汽车、具身智能、智能手机及智能家居等领域,端侧AI的落地正面临一个著名的“不可能三角”制约:体积受限、算力受限、能耗受限。传统的端侧模型往往需要在性能与效率之间做出巨大妥协,导致实际应用体验不佳。

面壁智能的选择是摒弃单纯堆砌参数的传统路径,转而构建覆盖数据、模型、训练、推理、智能体系统的全栈高密度技术体系。其核心理念是“多快好省”地在终端上应用大模型。这一技术路线的突破,直接体现在其最新发布的两款关键模型上。
首先是MiniCPM5-1B。这款仅拥有1B参数规模的多模态模型,在国际权威榜单AA-Index上超越了所有2B参数以下的模型。更令人瞩目的是,相比三个月前发布的Qwen3.5-2B,MiniCPM5-1B在效果更优的同时,参数量减少了一半。这种“智能密度”的极致提升,意味着更小的模型可以承载更复杂的逻辑推理与多模态理解能力。这一成果的底层支撑,是面壁智能自主研发的AI训练框架ForgeTrain。作为全球首个完全由AI编写的生产级大模型预训练框架,ForgeTrain在预训练速度上比英伟达Megatron快10%,且全程无需人类程序员介入,这标志着AI自进化能力在基础设施层面的重大突破。
其次是BitCPM-CANN。这是国内首个完全基于国产算力平台实现端到端训练并开源的三值(1.58-bit)大模型。它不仅在量化算子、训练算法到全链路框架上实现了国产化原生适配,更在推理阶段释放了约6倍的显存红利。与此同时,模型能力保留率维持在90%至97.2%的高位。这一突破对于具身机器人、汽车等低算力、低功耗场景的稳定运行具有决定性意义,解决了长期困扰行业的硬件适配与算力瓶颈问题。

场景落地:从“可用”到“好用”的质变
技术的终极价值在于场景落地。面壁智能在智能座舱领域的实践,为“好用”的端侧AI提供了生动注脚。
搭载面壁智能量产级多模态模型的智能座舱,实现了不依赖云端的“感知-记忆-推理-执行”完整闭环。这种无云依赖的特性,不仅降低了延迟,更保障了用户隐私。在实际用车过程中,系统能够自动串联多项车控功能,主动推荐座舱应用。例如,无感车窗和无感空调能够根据环境与乘客状态静默调节,营造出如贾维斯般的“无感智能”体验。
更为关键的是,在紧急场景下,SuperMate系统能够实时识别事故状态,快速介入安抚驾驶员情绪,并引导其完成现场处理流程与定责定损。这一过程打通了从事故识别到理赔服务的全链路智能化体验,展示了端侧AI在处理复杂、高时效性任务时的独特优势。这种能力是云端模型难以比拟的,因为网络连接的稳定性往往决定了生死攸关时刻的系统可靠性。
此外,这种能力密度也延伸到了具身智能领域。通过在机器人本体集成高密度模型,机器人能够更快速地响应环境变化,实现更自然的交互与更复杂的操作,从而真正走进人类的物理生活空间。
生态协同:开启“向外卷”的创新范式
技术创新若缺乏生态支撑,极易陷入孤岛效应。面对端侧AI广阔的蓝海市场,面壁智能联合北京智源人工智能研究院、OpenBMB开源社区,正式发起了“智能体+硬件创新加速孵化器”招募计划。

面壁智能联合创始人兼首席科学家刘知远提出了一个极具前瞻性的观点:中国AI一定要“向外卷”。这里的“向外”并非指简单的规模扩张,而是指走向端侧,走进那些还没有被充分定义的真实场景中,走到距离用户最近的地方。这种“向外卷”的策略,要求产业生态协同发力,孵化器正是为此设立的加速引擎。
该孵化器聚焦AI智能体、下一代AI硬件、AI垂直场景应用三大核心赛道,面向高校科研团队、新锐创业者及跨界创新人才开放。相较于常规扶持计划,它提供了“真资源、全赋能、高落地”的硬核支持。单项目最高500万的综合投资涵盖了现金、专属GPU算力、大模型Token与API额度,以及模型微调部署技术支持。同时,配套行业顶级大咖1v1指导、办公场地、产业链对接及投融资服务,全方位解决早期团队在算力、技术、资源、融资及落地渠道上的核心痛点。
产业启示:AGI时代的硬件新物种
端侧AI的爆发,正在重塑整个硬件产业的格局。传统的“硬件+软件”模式正在向“硬件+模型+智能体”模式演进。硬件不再仅仅是执行指令的工具,而是成为具备感知、记忆与推理能力的智能终端。
面壁智能的探索表明,未来的硬件竞争壁垒将不再仅仅是制造工艺或外观设计,而是底层模型的能力密度与场景适配能力。通过开源社区的力量,如MiniCPM系列与BitCPM系列的开源,面壁智能正在降低行业门槛,让更多开发者能够基于其技术底座进行创新。这种开放生态的构建,将加速AI智能体在各行各业的渗透,从智能家居到工业自动化,从个人助理到自动驾驶,形成一个繁荣的“万物智能”生态圈。
随着“智能体+硬件创新加速孵化器”的推进,我们可以预见,未来几年将出现一批基于端侧大模型的原创硬件物种。这些设备将不再依赖云端,而是具备独立智能,能够主动理解用户意图,提供个性化服务。这不仅是技术的进步,更是人机共生关系的一次深刻变革。
结语
从云端到端侧,AI的进化路径清晰可见。面壁智能通过全栈技术突破、极致场景应用及开放生态构建,正在重新定义端侧AI的标准。其成果不仅解决了算力与能耗的瓶颈,更为AI在物理世界的落地提供了可复制的范式。在AGI时代,谁能率先掌握端侧智能的核心技术,谁就能抢占物理世界入口的主导权。这场从云到端的革命,才刚刚拉开序幕。