中青报·中青网记者 李新玲
“‘百模大战’带动人工智能走向通用,推动人工智能与千行百业融合的同时,为算力产业带来了冲击、挑战,也带来了机遇。”全国政协委员、中科院计算机研究员张云泉是超算领域的专家,面对由ChatGPT带来的“模型热”,他有很多思考。据不完全统计,现在国内各大机构公司、科研院所陆续推出了七八十个大模型。
(资料图片仅供参考)
“OpenAI的ChatGPT到底是一个技术革命还是一个‘扰动’,有不同的观点。但是它在短时间内就实现了上亿用户,引起了惊呼,同时对算力消耗也是前所未有。”5月29日,以“ChatGPT下算力的机遇与挑战”为主题的2023中国算力发展研讨会在中科院计算所举行,张云泉谈到,大数据、大算力、大算法是对大模型的三大决定因素,其中哪个最重要目前有争议,但对我们来说,算力无疑是三大因素中最难的,因为美国芯片禁运,我们被“卡脖子”。
“怎么解决这个问题?是通过算力融合来解决问题,还是进行多要素协同?此外,生态是大问题,我们有些芯片设计不错,真正应用起来还有很多路要走。”张云泉较早提出“算力经济”的概念,他对于国内算力现状非常清楚,“我们除了研制更大规模超算之外,也在算力建设和应用方面不断创新,提出建设算力网、智算网,算网融合等。”
据了解,我国算力基础设施主要包括超算中心、智算中心、数据中心和“城市大脑”四类形态,都在同步建设中。其中,全国有30多个城市提出建设智算中心。
中科院院士陈润生认为,虽然现在对于大模型的实现原理有争论,但可以明确的一点是,人工智能还要发展,而且一定会带来很多领域的变革,所以我们要紧紧跟上。陈润生院士反对遍地开花,因为大模型是高耗能的。他建议可以专业与通用大模型结合。比如解决医学问题,就做一个专用,架构是可以参考大模型,学习的数据专业化,这样能够做到小耗能又能达到专业水平,精度还能足够高。
国家信息中心信息化和产业发展部主任单志广表示,目前来看,算力是我们的短板,也是未来有机会发力的地方。ChatGPT是采用集中式的算力来推动,未来我们或许可以换一条路,可以通过更先进的互联技术将国内的一些算力基础设施更好地连接起来,打造更强的计算能力,构建更先进的创新基础设施。
“我们要从基本的计算模式演化规律和人工智能的发展规律出发,加强基础性、前瞻性研究和探讨,避免一哄而上或者现象级跟风,否则就只能跟在别人后面跑。”单志广提出,要避免在新一代信息技术领域出现隔代竞争、越追越远的风险。
人工智能计算形态在整个数据中心中占比越来越大,AI算力中心利用率比过去超算中心利用率好很多,这是清华大学计算机系陈文光教授的观察结果,他认为AI算力对经济的渗透会逐步增加,“AI整体的发展还处于初期阶段,对于后续怎么发展我们并不是特别清楚,所以在这个阶段应该鼓励多方探索,(算力方式)应该百花齐放。”
对于这一点,中国信息通信研究院余晓晖院长表示认同,“中国的人工智能算力在过去几年发展特别快,我们测算过大体上年均增长70%,CPU通用的算力大概是30%多,超算更低一点。”
他提出设想,“AI算力分散在不同的地方,怎么把它集中在一起形成统一算力,有一种可能就是把目前分散的异构算力连接起来变成一种可调度的算力基础设施。过去算力设施基本是以传统的CPU通用数据中心为核心。下一步发展AI算力基础设施会成为非常重要一个方向。”
算力需求发展越来越快,要求越来越高,面对这种现状,与会专家认为,最主要的问题是如何应用并提供服务,用最小的代价来提供算力。
对于ChatGPT的出现,中国科学院院士、北京航空航天大学钱德沛教授认为需要反思我们的创新环境,另外,技术追赶既需要政府的能力,也需要各行各业的参与,“对我们软件的开放模式,软件销售模式,对提供服务的超算中心或者智算中心的生存模式和应用模式都会产生影响。短期来看这是一个目标,长期来看是我们如何真正把算力渗透到各行各业,或者说让算力变成我们生活一部分,这还有很长的路要走。”
中国工程院院士、清华大学郑炜民教授提出了几个设想,例如可以把不同地方的算力连接起来,“我们需要有新型的算力基础设施,专门做人工智能的应用服务,很多问题需要解决,怎么连起来,怎么传输等等。”
余晓晖认为,现在算力需求大,但是算力是分布在不同的企业、科研机构手中,实现算力和需求供给的供需对接不太容易。据他介绍,目前我国已经做了一些尝试,算网融合建立互联互通平台,把某家通信运营商和科研机构超算系统连在一起,运行效果不错,下一步计划把更多资源连起来。“如果我们把算力连在一起,像过去调动主机那样去运行,对整个体系会有一个变革,会带来很多创新或者新需求,包括算力标识、调度、计费、操作系统、通信协议等等,这对我国是一个机会。”