随着人工智能技术的快速发展,算力已成为推动AI模型训练和应用的关键资源。全球各国正通过政策支持、战略规划等手段,加速构建领先的算力竞争力。算力不仅关系到AI技术的突破,更是衡量国家综合实力和国际话语权的重要指标。然而,算力发展也面临着供给不足、供需匹配难、能耗激增等挑战,这些挑战制约着人工智能时代的发展步伐。
关键词:人工智能,算力挑战,供需匹配,能源考验,算力评估
算力供给不足,供需匹配不平衡
在人工智能时代,算力需求的增长速度远超预期。据《新一代人工智能基础设施白皮书》显示,过去几年,大模型参数量以年均400%的复合增长,AI算力需求增长超过15万倍。这种爆发性增长对算力供给提出了巨大挑战。一方面,算力资源的供给速度跟不上需求的增长速度,导致算力供给不足;另一方面,现有供给结构与用户实际的算力需求不匹配,造成资源浪费。
在供需错位问题上,国内算力产业链企业相对分散,技术路径不同容易导致芯片和模型之间的不适配。此外,大多数智算服务仍是粗放式经营,无法精准满足不同企业的多元化需求。资源利用率不足问题同样突出,据清华大学研究,大模型在处理大量数据时,GPU算力利用率低于50%,造成了巨大的资源浪费。
算力面临能源考验,节能降碳刻不容缓
算力中心作为算力的主要载体,是公认的高耗能基础设施。据中国信通院数据,截至2023年底,我国算力中心耗电量达1500亿千瓦时,预计到2030年将超过4000亿千瓦时。若不加大可再生能源利用比例,2030年全国算力中心二氧化碳排放或将超2亿吨。面对人工智能对算力的旺盛需求,如何在保证算力供应的同时实现“碳中和”,是整个行业需要解决的重要问题。

人工智能模型训练的能耗远高于常规计算能耗。训练AI模型产生的能耗是常规云工作的三倍。例如,一个10万亿参数大模型训练需要10万卡H100集群,训练1193天,所消耗的电量约40亿千瓦时。面对这样的能源消耗,算力产业必须采取行动,通过技术创新、绿色管理等措施开展节能降碳行动,以实现绿色低碳的发展方向。
多样化算力需求提升,普适普惠水平较低
随着数字技术的不断发展,多元应用场景对算力的智能水平和计算能力要求不断提升。算力资源获取成本有待降低,多元算力匹配能力有待加强。据斯坦福《2024年人工智能指数报告》估算,OpenAI的GPT-4预计使用了价值7800万美元的计算资源进行训练,而谷歌的Gemini Ultra耗费了高达1.91亿美元的计算资源成本。目前大模型研发已进入万卡时代,对于中小企业来说算力成本过高。
算力应用上,大模型训练、推理等业务场景的出现促使企业业务对多样化算力需求提升。如今产业界不论是模型还是算力芯片,正处于百花齐放、创新并存的阶段,算力资源多元并用,多元算力与多种模型及框架的适配难度较大。另外,大模型应用能够帮助企业更高效率的实现商业目标,但对于绝大多数企业而言,大模型的应用开发流程繁琐,模型设计、训练、调优等环节需要专业开发人员,自研大模型成本高且研发门槛过高。
算力评估体系的构建与应用
在人工智能时代,算力评估体系的构建变得尤为重要。一个全面、实用的算力质量评估体系,可以客观评价算力质量发展水平,为算力产业的技术创新与基础设施建设提供指引。评估体系应涵盖算效、智效、碳效、可获得、可持续等算力系统建设运营关键因素,多维度客观评估我国算力质量情况。
算力评估体系的建立,不仅可以帮助企业用户识别和优化资源配置,提高算力资源的使用效率,还可以激励企业进行技术研发和创新,以满足更高的评估标准,从而推动整个行业的技术进步。在算力相关项目的规划期、建设期、运营期等不同阶段,该评估体系可为算力实现高质量、全生命周期可持续发展提供指导,推动算力产业的标准化进程,为行业的长远发展奠定基础。
总结
人工智能算力面临的挑战是多方面的,包括算力供给不足、能源消耗巨大、算力需求多样化以及评估体系的缺失。这些挑战不仅限制了AI技术的发展,也对环境和社会经济产生了影响。为了突破这些瓶颈,行业需要加大研发投入,优化算力资源配置,推动绿色节能技术的应用,并建立全面的算力评估体系。通过这些措施,可以促进算力产业的可持续发展,为人工智能时代的到来提供坚实的基础。