国产算力专题报告(二):国产模型调用量激增,昇腾适配部署加速
(以下内容从财通证券《国产算力专题报告(二):国产模型调用量激增,昇腾适配部署加速》研报附件原文摘录) 核心观点
春节模型密集发布,模型性价比提升显著:春节期间,国产模型密集发布,我们看到本轮模型迭代在性价比方面有了长足提升,以Minimax为例,M2.5提供100TPS和50TPS两种版本,其输出价格仅为同类产品的1/10至1/20。我们认为从国产模型迭代升级&性价比提升,到推理侧tokens的消耗量不断提升,进而抬升整体国产算力需求的这一逻辑闭环正在持续增强。事实情况也同样佐证我们的观点,由于交互人数激增,春节期间豆包一度暂停视频通话功能,我们认为目前算力储备端仍然为模型商业化拓展的主要瓶颈之一。
国产模型调用量激增:根据AI模型API聚合平台OpenRouter数据显示,2月9日~15日,国产模型以周度4.12万亿Token的调用量,首次超过同期美国模型的2.94万亿Token。16日~22日,中国模型的周调用量进一步提升至5.16万亿Tokens,伴随本轮模型迭代升级和性价比提升,国产模型调用量激增。
华为昇腾加速适配国产模型:针对近期发布的KIMI2.5,昇腾同步深度优化,在昇腾Atlas800A2、Atlas800A3上实现高效推理部署。此外,昇腾同步支持智谱GLM系列模型,针对GLM-5的昇腾AI基础软硬件实现0day适配,支持对GLM模型W4A8混合精度量化,744B超大参数模型基于Atlas800A3实现单机部署。
昇腾超节点方案领先行业:我们预期2026年将是推理侧国产超节点上量元年,华为Atlas900搭载384张算力卡,可以基于FP16提供307.2PFLOPS算力支持,D2D双向带宽达到784GB/s。此外,华为下一代Atlas950/960,搭载8192/15488张算力卡超节点方案将在算力性能、大带宽、低时延等方面持续升级。
投资建议:昇腾链上,我们建议重点关注华丰科技,伟测科技,此外华正新材、深南电路、南亚新材同样值得关注。与此同时,我们在国产算力板块持续看好ASIC趋势,建议重点关注芯原股份。
风险提示:行业竞争加剧风险,宏观经济下行风险,地缘政治风险,AI算力需求不及预期风险。
提示:本文属于研究报告栏目,仅为机构或分析人士对市场的个人观点和看法,并非正式的新闻报道,本网不保证其真实性和客观性,一切有关该股的有效信息,以沪深交易所的公告为准,敬请投资者注意风险。×
确 认
×
网友评论
-
表情
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
清空 发表