AI基础设施链爆发:光模块与算力硬件领涨,达摩院发布亿级变量GPU求解器

AI基础设施链爆发式行情:光通信与算力硬件领涨,软硬协同进入亿级变量新纪元
近期A股市场呈现鲜明结构性特征:以光模块、AI服务器、高速连接器为代表的AI基础设施产业链迎来爆发式上涨。创业板指单日涨幅近2%,中际旭创、新易盛等光模块龙头股价接连刷新历史新高——这并非短期题材炒作,而是全球AI算力军备竞赛加速落地的必然映射。更关键的是,阿里达摩院于近日正式发布“敏迭”(Mindie)GPU求解器,首次实现对超1亿变量规模偏微分方程(PDE)系统的实时高精度求解,标志着中国在AI for Science底层工具链上取得重大突破。这一“硬件跃升+软件破壁”的双重共振,正推动AI算力需求从单一芯片性能比拼,系统性升级为覆盖光互联、先进封装、HBM内存、国产EDA/CAD等全栈技术环节的深度协同演进。
光通信率先兑现:800G/1.6T光模块进入规模化交付临界点
光模块是AI数据中心内部及集群间数据传输的“大动脉”。随着英伟达GB200 NVL72等新一代AI超级服务器部署加速,单机柜算力密度突破10PFLOPS,传统100G/200G光互连已成瓶颈。当前,800G光模块已从头部云厂商试点进入批量采购阶段,而1.6T模块亦在2024年Q2启动送样验证。据LightCounting最新报告,全球800G光模块出货量预计将在2024年同比增长超300%,2025年有望占据数据中心光模块总营收的45%以上。
中际旭创、新易盛等企业凭借在硅光集成、高速COB封装、热管理等关键技术上的先发优势,已获得微软、Meta、AWS等国际大厂主力订单。其股价创历史新高,本质是资本市场对“国产光通信供应链从追赶者蜕变为全球技术标准定义者”的价值重估。值得注意的是,光通信的爆发不仅拉动器件厂商,更向上激活了高速PCB(如深南电路)、激光器芯片(源杰科技)、以及向下延伸至液冷散热(高澜股份)等配套环节,形成强链效应。
算力硬件升级:从GPU到系统级优化,HBM与先进封装成新战场
单纯堆叠GPU数量已无法满足大模型训练效率需求。当前算力瓶颈正从计算单元向存储带宽与互连延迟转移。HBM3内存凭借高达1.2TB/s的带宽(较HBM2e提升2.5倍),成为GB200、MI300X等旗舰AI芯片的标配。国内长电科技、通富微电已在HBM3先进封装(如TSV硅穿孔、混合键合)领域实现小批量量产;而澜起科技、芯原股份则加速推进CXL内存池化协议芯片研发,旨在打破内存墙桎梏。
与此同时,“Chiplet”异构集成模式正重塑硬件生态。AMD MI300系列采用5nm CPU核心+6nm GPU核心+4nm I/O Die的3D封装架构,将不同工艺节点的芯粒高效协同。这直接带动了国产EDA工具(如概伦电子的NanoSpice、华大九天的ALPS)在多物理场仿真、信号完整性分析等高端场景的需求激增。过去被忽视的“设计使能”环节,正因系统级复杂度飙升而跃升为算力基建的关键一环。
敏迭求解器:亿级变量突破,标志AI软硬协同进入深水区
达摩院发布的“敏迭”GPU求解器,表面看是数学软件突破,实则揭示更深层趋势:AI基础设施的价值重心正从“算得快”转向“算得准、算得省、算得广”。传统科学计算求解器(如PETSc、Trilinos)在处理亿级网格的流体力学或电磁场仿真时,常受限于内存容量与通信开销,需依赖超算集群数小时甚至数天完成单次迭代。“敏迭”通过三项原创技术实现质变:
- 动态稀疏张量压缩算法:在保证数值精度前提下,将PDE离散矩阵压缩率提升至92%;
- GPU显存零拷贝跨核调度引擎:消除CPU-GPU间数据搬运延迟,显存利用率达98%;
- 自适应多精度混合计算框架:对非敏感区域启用FP16加速,关键区域保留FP64精度。
实测显示,“敏迭”在单台配备8卡H100的服务器上,可于12分钟内完成1.2亿变量的三维湍流模拟——效率较传统方案提升两个数量级。这意味着气象预报、新药分子动力学、芯片电磁兼容仿真等原本依赖国家级超算中心的任务,未来可在企业级AI集群中常态化运行。其意义远超技术指标:它倒逼硬件厂商必须提供更高带宽(HBM3)、更低延迟(CXL 3.0)、更强异构调度能力(如NVIDIA GPUDirect Storage)的系统级方案,从而将整个基础设施链的升级压力传导至上游。
估值重估逻辑:从主题投资迈向确定性成长
当前市场对AI基建的追捧,已超越概念阶段,进入业绩兑现验证期。光模块厂商Q1订单饱满,服务器厂商(浪潮信息、中科曙光)Q2招标量环比增长超40%,HBM封测产线处于满负荷状态。更重要的是,敏迭等国产基础软件的突破,打破了“重硬件轻软件”的旧有估值范式——当国产EDA工具能支撑3nm芯片设计、当自主求解器可替代ANSYS商业套件时,相关企业的估值锚点将从PE切换至PS(市销率)乃至客户LTV(生命周期价值)维度。
需警惕的是,地缘政治风险仍构成扰动项。商务部对日出口管制措施虽聚焦稀土等战略资源,但客观上加速了国内半导体材料、设备、EDA的自主替代进程。短期波动不改长期趋势:AI算力作为数字经济时代的“水电煤”,其基础设施建设具有强政策刚性、强资本投入惯性与强技术代际锁定效应。当光缆在机房内奔涌、GPU在液冷中低鸣、亿级变量在代码中收敛——一场静默而磅礴的算力革命,已然从图纸走向现实。
常见问题
什么是‘敏迭’(Mindie)GPU求解器?
阿里达摩院发布的国产高性能GPU求解器,支持超1亿变量规模偏微分方程的实时高精度求解,赋能AI for Science科研范式变革。
为何800G/1.6T光模块成为AI基建核心?
GB200等AI超级服务器算力密度激增,传统光互连带宽不足,800G已批量交付,1.6T进入送样验证,是支撑万卡集群低延迟通信的关键载体。
AI基础设施链包含哪些关键技术环节?
涵盖光通信(光模块/高速连接器)、算力硬件(AI服务器/HBM/先进封装)、底层工具(国产EDA/CAD/GPU求解器),强调全栈协同演进。