发布日期:2025-08-16 06:29 点击次数:142
从概念走向商业化临界点,具身智能的落地还需要突破硬件瓶颈。
随着 ChatGPT、DeepSeek 等应用的兴起,大模型技术开始从训练到推理侧迁移,从云端向边端侧迁移。
这使得边端侧芯片跃入技术前台,它需要为机器人载体提供多种支持:
高算力,满足实时环境感知、多模态交互;
低功耗,适配移动场景的散热需要;
小体积,能够轻松嵌入各类机器人载体。
作为率先打开存算一体魔盒的领先企业,后摩智能新发布了端边大模型 AI 芯片——M50,为具身智能的高效落地给出针对性解决方案。
1、存算一体创新架构,打破存储墙与功耗墙
后摩智能给 M50 的定义是,这是当前市场上能效比最高的端边大模型 AI 芯片。
M50 尺寸仅 20×23mm,搭载后摩第二代存算一体 IP,实现 160Tops 的物理算力(非虚拟算力,为实际可调用算力),153GB/s 带宽,功耗约为 10W。
对于陪伴机器人等具身智能设备,这一芯片能深度契合其性能诉求。
160TOPS 的大算力能够支撑其多模态大模型的本地运行,如 VLA 视觉语言模型等,让机器人能实时处理处理视觉、语音等多源数据,实现类人化交互。
并且,由于具身智能对于功耗比车更为敏感,风扇噪音过大往往会影响交互体验,芯片体积过大也会限制移动能力,M50 把功耗仅做到 10W,可以支持被动散热,并且小体积尺寸可以轻松嵌入机器人机身。
而把一颗边端芯片做到大算力,低功耗,核心突破源于后摩坚持的存算一体架构。
传统冯·诺依曼架构是当前大多数芯片的设计思路,即把计算与存储环节分开。
数据像原材料,存在专门的仓库(内存/显存)里;
计算像加工,必须在专门的车间(CPU/GPU 的计算单元)里做。
这就导致每次计算时,都需要把数据从仓库搬到车间,算完了再把结果搬回仓库,不可避免导致传输损耗。
尤其现在大模型、AI 计算需要处理海量数据,这种来回搬运的消耗会被无限放大,数据搬运的时间可能比计算本身还长,功耗会居高不下。
而存算一体架构相当于把车间搬进了仓库里,在存储数据的地方直接嵌入计算单元,让数据在哪里存,就在哪里算。
这种设计从根本上解决了数据搬运难题,在处理大模型、多模态数据时,响应速度能够迅速提升,且功耗更低,算力密度更大。
值得一提的是,M50 搭载的是后摩打造的存算一体二代 IP 设计,针对当前大模型的应用特点还进行了特定优化。
一是自适应弹性加速。依托存算一体的 bit 级计算特性,即使输入数据非全零,也能通过跳过无效 bit 提升运算效率,较传统 GPU 稀疏加速更灵活。
二是基于存算架构做浮点运算。支持 FP8、FP16 等混合精度计算,可直接运行开源浮点模型,无需额外量化即可适配相关大模型,大幅降低应用落地门槛。
后摩智能还给这一芯片打造了新一代编译器工具链——后摩大道,支持自动算子拆分与优化,开发者无需关注硬件细节即可部署大模型,简化应用落地流程。
2、具身智能初期,后模智能率先卡位
后摩智能并未止步于芯片本身,而是围绕 M50 构建了覆盖「芯片-模组-终端」的完整产品矩阵,直指具身智能等前沿场景的硬件需求。
在终端产品层面,M50 衍生出四类形态:
一是口香糖大小的 M.2 卡(功耗 13W,支持被动散热),可嵌入 AI PC、智能语音设备,单卡即可运行 140 亿参数大模型;
二是 DUO M.2 双芯片模组,算力与带宽翻倍,支持 96GB 内存,适配需要更大模型的边缘设备;
三是半高/全高加速卡,基于多芯片互联技术,4 颗芯片级联可提供 640T 算力,满足 700 亿参数模型的推理需求;
四是集成加密与多接口的计算盒子,为信创市场、工业边缘计算提供一体化方案。
据悉,M50 的应用范围覆盖包括消费终端、智能办公、智能工业等领域,目前,该端边大模型芯片已经与联想、科大讯飞、中国移动达成意向合作,将应用在 AI PC、智能语音设备、边缘计算等终端产品上。
当然,具身智能也是重要落地领域之一,后摩智能创始人吴强非常看好具身智能的发展前景,并一直保持做一款陪伴机器人 AI 芯片的初衷。
目前,后摩智能也已经与机器人企业开展合作,共同测试 VLA 大模型在芯片上的运行效果。
尽管具身智能是一个新兴领域,但后摩智能愿意率先布局。
一方面,具身智能对于能效比、低延迟的需求已经逐渐明晰,对于适配硬件的诉求切口也逐步打开。
另一方面,具身智能尚未形成硬件标准,存算一体技术有机会成为底层支撑。重点在于,后摩智能的存算一体技术已形成壁垒,基于四年量产经验、自研软件栈等技术成果,让其它企业难以快速复制。
M50 仅是起点。吴强预告,2026 年将发布基于 DRAM 存算的新芯片,进一步突破带宽瓶颈,为具身智能等新兴赛道提供低功耗、高安全、好体验的硬件支持。
正如吴强所言:「希望有一天,大模型走出云端,真正走入千家百户。」显然,具身智能机器人就是这样的载体。
M50 等芯片的出现,或将成为实现这一愿景的关键一步。
上一篇:B站Q1日活用户达1.07亿
下一篇:没有了
Powered by 今年会不会下雪2022 @2013-2022 RSS地图 HTML地图