当前位置: 首页> 投研观点> 国产算力专题报告(二):国产模型调用量激增,昇腾适配部署加速

国产算力专题报告(二):国产模型调用量激增,昇腾适配部署加速

2026-03-04 18:29 财通证券 唐佳,朱陈星 查看PDF原文

(以下内容从财通证券《国产算力专题报告(二):国产模型调用量激增,昇腾适配部署加速》研报附件原文摘录)  核心观点

  春节模型密集发布,模型性价比提升显著:春节期间,国产模型密集发布,我们看到本轮模型迭代在性价比方面有了长足提升,以Minimax为例,M2.5提供100TPS和50TPS两种版本,其输出价格仅为同类产品的1/10至1/20。我们认为从国产模型迭代升级&性价比提升,到推理侧tokens的消耗量不断提升,进而抬升整体国产算力需求的这一逻辑闭环正在持续增强。事实情况也同样佐证我们的观点,由于交互人数激增,春节期间豆包一度暂停视频通话功能,我们认为目前算力储备端仍然为模型商业化拓展的主要瓶颈之一。

  国产模型调用量激增:根据AI模型API聚合平台OpenRouter数据显示,2月9日~15日,国产模型以周度4.12万亿Token的调用量,首次超过同期美国模型的2.94万亿Token。16日~22日,中国模型的周调用量进一步提升至5.16万亿Tokens,伴随本轮模型迭代升级和性价比提升,国产模型调用量激增。

  华为昇腾加速适配国产模型:针对近期发布的KIMI2.5,昇腾同步深度优化,在昇腾Atlas800A2、Atlas800A3上实现高效推理部署。此外,昇腾同步支持智谱GLM系列模型,针对GLM-5的昇腾AI基础软硬件实现0day适配,支持对GLM模型W4A8混合精度量化,744B超大参数模型基于Atlas800A3实现单机部署。

  昇腾超节点方案领先行业:我们预期2026年将是推理侧国产超节点上量元年,华为Atlas900搭载384张算力卡,可以基于FP16提供307.2PFLOPS算力支持,D2D双向带宽达到784GB/s。此外,华为下一代Atlas950/960,搭载8192/15488张算力卡超节点方案将在算力性能、大带宽、低时延等方面持续升级。

  投资建议:昇腾链上,我们建议重点关注华丰科技,伟测科技,此外华正新材、深南电路、南亚新材同样值得关注。与此同时,我们在国产算力板块持续看好ASIC趋势,建议重点关注芯原股份。

  风险提示:行业竞争加剧风险,宏观经济下行风险,地缘政治风险,AI算力需求不及预期风险。

提示:本文属于研究报告栏目,仅为机构或分析人士对市场的个人观点和看法,并非正式的新闻报道,本网不保证其真实性和客观性,一切有关该股的有效信息,以沪深交易所的公告为准,敬请投资者注意风险。

网友评论

×

  • 1.若本人/本机构拟认购/申购私募类资管产品、信托计划,则本人/本机构承诺符合以下条件之一:
  • (1)具有2年以上投资经历,且满足金融净资产不低于300万元,或家庭金融资产不低于500万元:或近3年本人年均收入不低于40万元;
  • (2)最近1年末净资产不低于1000万元的法人单位;
  • (3)金融管理部门视为合格投资者的其他情形。
  • 2.若本人/本机构拟认购/申购私募基金,则本人/本机构承诺符合以下条件之一:
  • (1)金融资产不低于300万元或者最近三年个人年均收入不低于50万元的个人;
  • (2)净资产不低于1000万元的单位。
  • 本人/本机构确认是为自己购买私募产品,不会以非法拆分转让为目的购买私募产品,且资金来源合法合规,不会使用贷款、发行债券等筹集的非自有资金进行投资。
特定对象认证

确 认

×

风险测评
温馨提示:本问卷旨在协助您选择符合您风险识别和承受能力的产品或服务,问卷结果并不能取代您的投资判断,也不会降低产品或服务的固有风险。
    下一题