投研观点-详情

国产算力专题报告（二）：国产模型调用量激增，昇腾适配部署加速

2026-03-04 18:29 财通证券唐佳,朱陈星查看PDF原文

（以下内容从财通证券《国产算力专题报告（二）：国产模型调用量激增，昇腾适配部署加速》研报附件原文摘录）　　核心观点

　　春节模型密集发布，模型性价比提升显著：春节期间，国产模型密集发布，我们看到本轮模型迭代在性价比方面有了长足提升，以Minimax为例，M2.5提供100TPS和50TPS两种版本，其输出价格仅为同类产品的1/10至1/20。我们认为从国产模型迭代升级&性价比提升，到推理侧tokens的消耗量不断提升，进而抬升整体国产算力需求的这一逻辑闭环正在持续增强。事实情况也同样佐证我们的观点，由于交互人数激增，春节期间豆包一度暂停视频通话功能，我们认为目前算力储备端仍然为模型商业化拓展的主要瓶颈之一。

　　国产模型调用量激增：根据AI模型API聚合平台OpenRouter数据显示，2月9日~15日，国产模型以周度4.12万亿Token的调用量，首次超过同期美国模型的2.94万亿Token。16日~22日，中国模型的周调用量进一步提升至5.16万亿Tokens，伴随本轮模型迭代升级和性价比提升，国产模型调用量激增。

　　华为昇腾加速适配国产模型：针对近期发布的KIMI2.5，昇腾同步深度优化，在昇腾Atlas800A2、Atlas800A3上实现高效推理部署。此外，昇腾同步支持智谱GLM系列模型，针对GLM-5的昇腾AI基础软硬件实现0day适配，支持对GLM模型W4A8混合精度量化，744B超大参数模型基于Atlas800A3实现单机部署。

　　昇腾超节点方案领先行业：我们预期2026年将是推理侧国产超节点上量元年，华为Atlas900搭载384张算力卡，可以基于FP16提供307.2PFLOPS算力支持，D2D双向带宽达到784GB/s。此外，华为下一代Atlas950/960，搭载8192/15488张算力卡超节点方案将在算力性能、大带宽、低时延等方面持续升级。

　　投资建议：昇腾链上，我们建议重点关注华丰科技，伟测科技，此外华正新材、深南电路、南亚新材同样值得关注。与此同时，我们在国产算力板块持续看好ASIC趋势，建议重点关注芯原股份。

　　风险提示：行业竞争加剧风险，宏观经济下行风险，地缘政治风险，AI算力需求不及预期风险。

提示：本文属于研究报告栏目，仅为机构或分析人士对市场的个人观点和看法，并非正式的新闻报道，本网不保证其真实性和客观性，一切有关该股的有效信息，以沪深交易所的公告为准，敬请投资者注意风险。

查看PDF原文

网友评论