互联网发展_河北网信网

Token爆发　AI算力全链涨价　开启“能效竞争”时代

2026-04-16 16:21:31 来源：人民邮电报

A- A+

　　算力，正成为AI时代最稀缺的“硬通货”，目前全链价格不断攀升。

　　海外英伟达H100一年期租赁价格涨幅近40％；国内云厂商集体调价——腾讯云Tencent HY 2.0 Instruct模型输入价上涨463％后再次整体提价5％，阿里云平头哥真武810E等算力卡产品上调5％～34％，百度智能云相关服务上调5％～30％，科大讯飞智算平台AI推理服务涨价8％，商汤科技SenseCore大模型训练费用平均上浮12％，智谱2月以来3次提价……近期算力产品全链涨价，持续两年多的AI“价格战”骤然逆转。

　　这是短期供需错配的周期性波动，还是AI驱动下的趋势性上涨？产业未来的竞争焦点将落在哪里？近日，记者采访了工信部信息通信经济专家委员会委员盘和林与中国信通院云计算与数字化研究所总工程师郭亮，深度探寻算力涨价潮背后的产业变革趋势。

　　Token激增是算力涨价潮的“核心引擎”

　　“涨价的根源是人工智能的需求驱动。”盘和林认为，其中既包括AI训练所带来的算力消耗，也包括AI应用爆发所激发的推理算力需求。

　　郭亮分析，涨价包含四方面因素：一是硬件成本“逆向”暴涨。高带宽内存（HBM）存储与高端芯片处于绝对卖方市场，2026年第一季度存储价格翻倍，硬件采购及运维成本高企。二是需求结构从训练转向推理。随着AI智能体爆发，推理端的Token调用量激增。推理属于持续性运营支出，海量并发带来的电力和带宽成本已超出云厂商的补贴上限。三是商业模式从“圈地”转向“盈利”。早期算力价格战已完成初步生态绑定，在财务压力下，厂商必须通过提价来覆盖昂贵的算力折旧。四是算力资源的战略性稀缺。全球高端算力租赁容量告急，电力配额紧张，供需极度失衡，导致价格失去下行空间。

　　此前两年多时间里，云厂商以“烧钱换市场”的逻辑持续降价，Token成本被压缩至每百万Token不到一元。但当前，复杂推理让单日调用费用高达数百元，价格不断上涨，此前大模型的免费公测也同步结束。

　　“行业集体提价是从‘烧钱扩规模’转向‘商业可持续’的必然结果。”郭亮表示，这宣告廉价算力时代终结，将进入以利润为导向的“价值重估”阶段。

　　谈及价格竞争，盘和林认为，此前云计算厂商尚未发掘出具有大规模用户黏性的AI应用场景，多数厂商采购的算力服务器主要应用于AI模型训练环节，而非直接面向企业或个人用户提供算力服务支持。今年以来，以“龙虾热”“欢乐马”为代表的AI开源作品涌现，凭借其创新性与易用性极大激发了普通用户对云计算产品的使用热情，不仅显著推动了Token销售量的爆发式增长，更进一步带动了算力资源及存储服务的整体需求提升。

　　存储与芯片是算力价格上涨的“成本推手”

　　当前，算力产业链的涨价态势从上游硬件蔓延至下游服务，包括国内外主流云厂商在内的数十家企业，相继上调了AI算力及相关服务的价格。那么，在算力产业链中，哪些环节是涨价的根源？

　　郭亮认为：“从算力产业链的结构来看，存储供应、先进封装、芯片制造和晶圆生产都对算力涨价产生了影响。”

　　具体而言，在存储供应方面，尤其是HBM和高容量闪存方面，随着模型参数规模持续扩大、多模态交互日益普及，推理任务对内存带宽的要求已超越了对算力本身的追求，比如三星、SK海力士等厂商的HBM产能在2026年之前便已被长期订单锁定。在CoWoS等先进封装技术方面，尽管晶圆制造产能正在扩张，但将计算芯片与HBM堆叠集成的先进封装工艺扩产周期较长、技术门槛较高。即便晶圆供应充足，若无法完成封装出货，市场上的算力资源仍将处于缺货状态。在晶圆生产环节，相比存储与封装，先进制程的晶圆产能虽同样紧俏，但在全球主要代工厂大规模扩建的背景下，其产能释放节奏相对可预期，已不再是当前价格波动的主要推手。

　　“涨价主要集中在两个环节。”盘和林分析说，“一是算力服务器本身的价格上涨，例如英伟达等厂商的AI算力服务器；二是云计算厂商提供的算力及存储租赁服务价格上调。”

　　其中，算力服务器涨价主要源于两个因素：一方面，芯片制造能力受限，核心瓶颈在于光刻机产能无法满足AI产业快速发展的需求。另一方面，存储芯片不足，内存芯片自身存在固有产能周期，而AI需求的爆发式增长进一步加剧了供不应求的局面。存储芯片产能的扩张通常需要3年左右，即便考虑到厂商已提前布局，至少也需要1～2年才能有效缓解供给压力。

　　算力涨价是一场加速产业出清的压力测试

　　“此轮涨价是一场‘压力测试’。”郭亮形象地概括，它将加速产业出清，告别粗放的发展时代，迈向高门槛、高效率的Token生产和使用“深水区”。

　　此轮算力涨价正在深刻重塑整个AI产业链的竞争格局，对头部厂商、中小企业产生不同影响。

　　对于头部厂商，郭亮认为，涨价将有助于利润与生态修复。一方面，提价缓解了云厂商巨额的算力折旧压力，使其从“亏损获客”转向“质量增长”；另一方面，头部厂商凭借自研芯片带来的成本优势，可能进一步压缩二线云服务商的生存空间，强化自身在算力生态中的控制地位。

　　对于中小企业，盘和林分析说：“算力涨价将显著增加中小企业和个人用户使用AI的成本。”当前，多数中小企业主要依赖在云端购买算力与存储资源完成模型训练，为AI应用提供算力支持。如果AI能够产出更多价值、创造更多利润，中小企业很可能选择忽视短期成本上升，选择“AI+”战略来提升经营效率与市场竞争力。

　　郭亮总结道：“算力产业高质量发展将加速‘脱虚向实’。”算力成本高企将使得“PPT创业”逐渐失去土壤。行业的投资重心将从纯模型研发转向能够产生实际流水、算力投入产出比更高的商业化场景。

　　“算力银行”与“算力超市”将为中小企业量身减负

　　面对算力供需紧张态势，政策端已加速破局。今年4月，工业和信息化部发布《关于开展普惠算力赋能中小企业发展专项行动的通知》，推出“算力银行”与“算力超市”两大创新模式，直击中小企业算力成本痛点。

　　郭亮表示：“专项行动是针对2026年AI算力成本激增的问题，为中小企业量身定制的‘减负’方案，关键在于有效落实两项创新业务。”

　　“算力银行”类似金融银行模式，将散落的闲置算力资源化、标准化、金融化，通过“零存整取”和跨域调度实现普惠供给。

　　具体分四步：首先，资源归集（存款），将不同品牌、规格的算力标准化为“标准算力单元”，像吸收存款一样，将科研机构、云厂商、企业的富余算力接入中国算力平台。其次，资源池化（金库），利用平台将分散的服务器整合为虚拟资源池，跨地域调度，平衡波峰波谷，解决“有的地方卡死，有的地方闲死”的问题。再次，按需配给（贷款），企业像申请贷款一样按需下单。中小企业通过“算力券”或按量付费等灵活套餐，低成本获取高性能算力。最后，价值清算（结算），建立计量与返利机制，提供方获得收益或未来优先使用权，使用方按实支付，政府通过平台数据实现精准补贴。

　　“一家自动驾驶初创公司需要大量算力处理路测数据，而某大学实验室的算力夜间闲置。通过算力银行，实验室存入算力获得未来积分；初创公司用政府发放的‘算力券’低价提取算力，避开公有云高峰高价。”郭亮举例说明。

　　“算力超市”的核心是算力资源的“商品化”与“便捷化”，让企业像网购一样获取AI算力。

　　其中包括四个关键环节：一是资源标准化上架，将底层硬件性能转化为标准化商品，按Token数、单精度浮点运算能力、核时计费的算力规格计算，消除技术门槛。二是智能搜索与比价，基于中国算力平台中小企业专区，实现动态比价和算力选型，自动推荐成本低、延迟低的算力包，解决信息不对称等问题。三是开箱即用服务，预装模型环境和开发工具，用户可一键部署主流大模型镜像和数据集，实现“下单即运行”，缩短开发周期。四是普惠政策与支付结算，对接政府补贴，支持“算力券”直接结算，提供预付、后付、包年包月等模式，平台承担QoS监控确保真实性能。

　　“如果说算力银行负责的是底层的‘资源流动’，解决的是‘资源流动’问题；那么算力超市负责的就是前端的‘用户体验’，解决的是‘交易门槛’问题，让算力变得看得见、买得起、好上手。”郭亮认为，这两个创新业务，将算力从高门槛的“资本密集型资产”转变为像水、电一样的“即用即付型信息基础设施”，是中小企业在2026年算力竞争中突围的关键。

　　针对中小企业的困境，盘和林建议要做好两手准备：一是企业主动与云计算厂商合作，推动传统算力服务向“算力超市”“算力银行”创新模式升级，依托其市场经验与资源优势，降低算力基础设施建设成本；二是政府引导国企跨领域融合金融、通信、算力资源，构建业务生态体系。他特别强调，企业是产业发展的核心主体，必须通过市场化机制充分激发其积极性；政府则需配套“算力券”补贴、利率贴息等精准政策工具，加速创新模式落地生效，最终实现中小企业从“被动承压”到“主动受益”的实质性转变。

　　未来算力产品价格或将保持较高水平

　　面向未来，此轮涨价是周期性波动还是趋势性上涨？

　　盘和林认为，答案取决于AI应用能否真正创造价值。算力涨价的长期性本质取决于AI应用的价值转化能力。若AI仅停留在“玩具”层面，缺乏实际生产力支撑，此轮涨价将如昙花一现般短暂；若AI成为驱动产业变革的生产力工具，其涨价则将演变为具有持续性的趋势性特征。

　　基于当前产业态势，盘和林判断：“趋势性价格上涨的概率更大。”AI仍处于技术爆发周期，算力产业将长期维持“需求激增—供给滞后”的紧平衡状态，短期内算力供给难以匹配需求增速。然而，未来尚存不确定性——AI究竟是泡沫还是生产力工具，仍需市场持续验证。

　　郭亮提出：“此轮涨价是‘短期供需错配’与‘长期成本刚性’共同作用的结果。”他预计，算力价格的高位震荡将持续至2027年初。随着全球先进制程产能逐步释放、CoWoS封装瓶颈得到突破以及HBM4内存的大规模交付，当前由极度缺货所导致的溢价将逐步回落。尽管短期内的极端涨幅会趋于平抑，但由于能源成本、地缘政治溢价以及芯片制造工艺正逼近物理极限，算力的价格中枢仍将保持在较高水平，其中高性能算力将获得更多溢价。

　　郭亮进一步表示，未来产业发展将有三大趋势。首先，算力将从通用走向异构，昂贵的处理器（GPU）不再是唯一解。针对特定算法优化的ASIC专用芯片将大规模普及，企业也将不再盲目追求万亿参数级别的模型，而是通过模型蒸馏等技术，在更廉价的算力上实现高效运行。其次，需求重心将从训练转向推理，推理所消耗的Token量将逐步超越训练阶段。大规模推理任务对实时性和并发性的要求，使得算力供给必须更加灵活。为降低单次调用的成本，产业将加速向低功耗推理芯片及端云协同模式转型。最后，算力将真正成为“新电力”，实现基础设施化。

　　“未来竞争的胜负手，将聚焦‘能源调度+算力能效+算法优化’的综合成本控制能力。”郭亮判断，从这个意义上说，涨价正是算力行业的“成年礼”——它将倒逼整个产业从粗放的扩张模式转向极致的能效竞争。（记者　李瑞璐）