周日. 7 月 5th, 2026

基石筑底｜WAIC 2026算力：超节点与光互连，能否绕过单芯片的物理天花板？

作者gjqs

7 月 5, 2026

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

基石筑底｜WAIC 2026算力：超节点与光互连，能否绕过单芯片的物理天花板？

“单卡比拼”进入“系统级主权竞争”

新阶段，衡量标准不再是单芯片峰值，而是整套系统能把算力用多满。

2026年，产业重心已从训练转向推理，推理算力规模反超训练，算力从科研工具变为全行业通用基建，成为每天必须支付的运营成本。行业不再问

，万卡集群意味着数亿元的真金白银。

当单芯片逼近物理极限，靠什么支撑有效算力的持续增长？

WAIC 2026的“基石筑底”篇章，从架构、技术、生态和工程四方面给出了系统级答案。

架构破局：超节点能否打破单芯片的物理天花板？

单颗芯片的性能快到天花板了，算力规模继续做大，只能靠一件事，那就是把更多芯片用更快的方式连起来。这就是“超节点”在做的事情。

传统做法就是堆卡，而且越多越好。但这条路越走越窄。GPT-5级别的大模型训练，跨节点通信开销占了总训练时间的三成以上。也就是说，买

张卡的时间在干等数据。GPU算力每年

，两者之间的差距越来越大。

超节点解决的就是这个问题，通过高速互联技术，把几十甚至上百颗GPU变成一个统一的“计算矩阵”，让原来需要跨机柜传输的数据变成内部通信，大幅减少等待时间。

华为在WAIC 2026全球真机首展Atlas 950 SuperPoD，这是目前行业规模最大的商用超节点。

，专门为万亿参数的大模型训练和推理设计。华为还提出了一个叫

的新思路，与其死磕晶体管尺寸，不如压缩信号传输的时间延迟，用架构创新在成熟制程上跑出高性能。

Atlas 950 超节点

联合曦智科技、壁仞科技、沐曦股份、燧原科技、天数智芯等合作伙伴，构建基于OEX+dOCS架构的国产高性能Matrix超节点。

主张多芯协同，面向不同应用场景，自主选择国产最优芯片组合，打造TCO最优的算力底座，该创新架构已入围本届WAIC的SAIL奖。

国产各类芯片厂商齐心协力共同打磨一套系统，这件事本身就是信号——中国算力正走向体系化协同发展。

技术思辨：后摩尔时代，光互连是唯一的技术路线吗？

超节点解决的是“怎么连”的问题，光技术解决的是“用什么连”的问题，后者更接近物理底层。

摩尔定律放缓这件事，行业已经不再争论了。晶体管越做越小，成本越来越高，收益越来越低。电信号天生有发热和带宽上限，内存墙和互连墙这两堵墙，靠电子技术很难翻过去。光不一样。光子的传输速度比电子快得多，而且不发热、不耗电，天然适合做大范围高速数据传输。

光互连给算力集群修的是“数据高铁”，光计算则直接用光子做运算，绕过电子电路的物理极限。这两项技术加在一起，被行业视为后摩尔时代最有希望的路。

2026年曦智科技在港交所上市，被称为“全球AI硅光芯片第一股”。本届WAIC，曦智将举办大会历史上第一场光技术专场论坛。

传统电芯片受限于摩尔定律放缓与“内存墙”“互连墙”，算力供给严重滞后。因此，光技术成为破局的关键，光互连为算力集群提供低时延、高带宽、低能耗的支撑；光计算利用光子并行性与线性运算优势，绕过电子晶体管微缩极限。光技术专场论坛实实在在地展示光互连和光计算在智算集群里怎么落地，正面回应“光能不能替代电”这个行业终极问题。

一个越来越清晰的共识是：

在超节点这种大规模集群里，光技术不是可选项，而是必选项。

华为的Atlas 950、中兴的OEX，全都靠光模块实现万卡级互联。借助WAIC顶级行业平台，展示国内自研光算力技术方案，开放交流、共建算力生态。

生态突围：开源协作能否打破“一卡一软件”的碎片化困局？

硬件架构持续革新，光互联技术不断演进，倘若软件与存储配套能力跟不上，算力依旧难以跑满，生态底座必须同步升级。

现在全球有上百家AI芯片厂商，每家都有自己的编程模型、算子库、通信协议。一个模型从英伟达的卡迁移到国产芯片，往往要重新编译、重新优化，成本极高。算力碎片化的结果就是硬件越买越多，真正能用起来的却不到四成。

今年由图灵奖得主大卫·帕特森（David Patterson）亲自领衔的全球AI开放计算与智能体技术生态论坛，

瞄准的就是这个问题。核心方案是一个叫

的统一智算底座。也可以理解为给所有芯片做一个通用的“操作系统”，让不同架构的芯片能跑同一套软件。

更值得关注的是，这场论坛邀请到

Linux、Eclipse、PyTorch三大国际开源基金会，

用开源协作替代厂商锁定。这是国产算力第一次拿到国际通行的“软件护照”。

还有一个长期被忽略的角色，那就是存储。行业里所谓的“I/O墙”，本质上是冯·诺依曼架构中存储与计算速度不匹配的固有瓶颈——计算单元算力持续跃升，而数据供给效率无法同步跟上，导致GPU因等待数据而频繁处于空闲状态。

作者 gjqs

相关文章

天生多屏：中兴AI云电脑体验日，解锁数智生活新体验

7 月 5, 2026 gjqs

英伟达版「MacBook Pro」曝光：老黄自研了CPU！

7 月 5, 2026 gjqs

英博数科亮相CCIG 2026，首次公开EBFlex私有化算力管理平台

7 月 5, 2026 gjqs

You missed

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了2026-07-01

2026年7月5日 gjqs

Claude Mythos让梁文锋决定融资2026-06-29

2026年7月5日 gjqs

τ0-WM：最大规模预训练的开源具身世界模型来了

2026年7月5日 gjqs

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

2026年7月5日 gjqs