共筑行业新生态|沐创亮相第三届芯粒开发者大会

发布时间：2025-09

近日，第三届芯粒开发者大会在无锡成功举办，本次大会以“把握时代新机遇，携手共建芯粒库”为主题，为芯粒技术企业、院所及相关从业者搭建了一个高水平的交流平台。沐创受邀参与本次大会，并参与了共建“芯粒库”签约仪式，此外，沐创还在“芯粒技术标准与芯粒库”分会场作了题为《AGI时代网络通信的挑战与机遇》的演讲。

微信图片_20250918134654_137_106.jpg

本次大会邀请到了50余名知名专家学者先后在主会场及五个分会场做报告。大会主会场开幕后，中国工程院院士许居衍、无锡市政府副市长周文栋、中国科学院计算技术研究所副所长陈云霁、中国电子科技集团公司原副总经理赵正平先后为大会致辞。紧接着，中国科学院计算技术研究所研究员郝沁汾介绍了共建芯粒库的目标与规划。随后，大会隆重举行了共建“芯粒库”的发布和签约仪式，沐创作为企业代表上台签约。

微信图片_20250918134659_138_106.jpg

在“芯粒技术标准与芯粒库”分会场的专题演讲环节，沐创以人工智能的发展历史为切入点展开了本次报告。报告指出，随着大语言模型的崛起，智算集群规模不断扩大，迈向十万卡级。例如DeepSeek 达到了2K 规模，Meta为16K，OpenAI为60K，Tesla 更是高达 200K。大规模分布式并行计算随之产生了包括流水线并行、数据并行、张量并行、专家并行和上下文并行在内的海量且多维度的数据通信需求。为实现多个GPU之间的协同操作以完成数据交换，集合通信以及智算集群组网随之成为探讨的焦点。

微信图片_20250918134704_139_106.jpg

报告讲解了大模型场景下通信面临的挑战。集群算力并非简单的单个GPU算力与GPU数量的乘积，数据搬运能力制约了集群整体算力的发挥。以DeepSeek为例，虽能将通信时间隐藏在计算时间中，但却消耗了约15%的GPU资源。而智算网络有着独特且严苛的需求。一方面，通信数据量极大，对带宽要求极高；另一方面，要求极低延迟，且整体性能取决于最慢的流；数据流数目少但高并发。这些需求直接带来了带宽/时延、负载均衡以及拥塞控制等多维度的挑战。

面对这些挑战，芯粒互联这一概念引起了业界的关注。芯粒互联正是解决超节点内通信问题的关键。报告随后深入浅出的讲解了AI芯片内、AI芯片间的芯粒互联，介绍了符合Scale-up通信需求的芯粒标准，并着重讲解了现有的芯粒标准——UCle。

报告最后简单介绍了沐创智算网卡的产品路径。当前，沐创已量产的N10/N400/N500/N210芯片，在管理网络领域已有成熟产品，能够覆盖1-100G网络需求，并且全面适配国产生态，实现了国产化自主可控。此外，沐创在存储网络、Scale-Out网络和Scale-Up网络等领域均已有完善的产品规划，将于今年推出400G 高性能RDMA网卡。