近日,中共中央、国务院印发《数字中国建设整体布局规划》,提出系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局;科技部启动国家超算互联网部署工作,通过超算互联网建设打造国家算力底座,促进超算算力的一体化运营,助力科技创新和经济社会高质量发展……
算力建设,已成为夯实数字中国建设基础、打通数字基础设施大动脉的重要手段。而作为科学研究和人才培养重地的高校,随着科研、教学、管理对算力需求的不断增加,也掀起了一股算力建设浪潮。
2023年4月,复旦大学透露,正与阿里云共建中国高校最大的科研算力平台,预计在6月正式上线试运行;2021年12月,中国高校最强算力基座“思源一号”落户上海交通大学;2020年,南京航空航天大学成立校级高性能计算中心,在运维管理、科研服务、课程开发等方面开展了一系列有益探索;2019年,西湖大学高性能计算中心成立,为学校“高起点、小而精、研究型”的办学定位提供坚实的高性能计算基础支持……
在数字化转型的大时代,高校算力服务发展也处在风口。高校算力服务现状如何?如何建设算力平台?如何服务师生用户?如何持续不断发展?这些问题都有待探索和解答。
高校算力服务发展状况
近年来,我国高校算力服务得到了迅速发展和提升。许多高校纷纷建立了自己的算力中心,并且不断扩大硬件设施和软件服务范围。算力服务形式多样,包括高性能计算集群、虚拟化技术支持的云计算平台、自主研发的数据中心等各种形式,为高校师生用户提供了大规模的计算存储资源。
总体来看,目前许多重点高校已具备了成熟的建设和运营模式,二三线高校也正处于成长期,不断加大对算力的投入力度,增强计算能力。
据介绍,从算力建设来看,校级超算中心的通常规模在“百节点、万核心”,日常使用率都达到80%以上。高校超算承担着高校科研团队的学生教学培养和科研项目所需的中小规模计算任务,成为我国新型算力网络体系中不可或缺的组成部分。
从运营模式来看,目前大部分高校仍处于向校内提供计算服务、帮助用户学习使用超算的阶段;部分头部高校则已经开始积极探索计算驱动的交叉学科发展模式,推动更多符合我国科研实际情况的自主可控超算软件的研发。
但从整体来看,高校的算力储备还很不足,算力使用也很不均衡。一项相关调研显示,当前,大约8.4%的高校已建设校级算力平台,校级算力平台的运算能力主要分布在250Tflops以下;存储空间主要分布在500TB以下。[1]
在算力平台运营过程中,高校也面临诸多问题和挑战,如设备更新速度缓慢、平台管理和运维水平不高、人才团队建设受困于机制、算力储备难以满足科研数据增长等。
此外,高校用户对算力服务的需求也越来越高。除了大规模科研数据的处理分析和在线教学平台支持,用户还希望算力中心能提供“性价比高”“按需供给”“提供完整的解决方案”“安全可靠”“资源共享”“云计算”“免费测试”等算力服务。
算力支撑高校科研教学管理
在高等教育领域,数字化转型已成为推动高等教育创新发展,培养适应信息时代人才的大势所趋。数字化转型需要大量的计算资源和技术支撑,这就为算力服务提供了发展空间,让算力服务成为高校数字化转型中不可或缺的一部分。
通过算力服务,高校可以快速获取必要的计算资源和技术支持,实现数字化转型的各种需求。在对高校算力中心的调查和采访中,我们得知,算力服务对高校数字化转型的支持主要体现在以下几个方面:
一是科研支持。
高校科研需要大量的计算资源和数据存储空间,而算力平台可以为高校研究人员提供高效、可靠的科学研究环境。在科学研究中,算力服务可以为高校提供大量的计算资源,人们可以在云端进行模拟、计算等处理,进一步提高研究效率和研究成果。科研算力的提升和飞跃,使得研究人员将有机会探索和尝试各种新事物,有助于加快解决人们面临的各种棘手问题。
例如,南京航空航天大学高性能计算中心提供的科研服务包括科学计算和仿真计算,覆盖学校所有理工科学院、科研技术部门和部分文科学院;对华中农业大学作物遗传改良全国重点实验室来说,计算平台助力实验室完成生物学研究的重要手段基因组测序,并对测序的数据进行存储分析。
二是教学支持。
通过算力服务,高校快速搭建在线教育平台,在云端构建虚拟课堂、制定个性化教学方案、开展远程教学等活动。而学生则可以通过网络学习、在线交流和互动学习等方式,获取更加丰富和高效的学习体验。同时,算力服务还可以为高校提供强大的课程管理系统,帮助高校更好地管理和组织课程资源。
以上海交通大学为例,将计算深度融入教学,是富有交大特色的定制教学模式。交大组建了专职教辅团队,与专业课老师共同改造计算相关课程。交大还在教学支撑中使用最先进的计算平台,免费向校内师生提供优质的计算服务。优质的计算资源为课程升级赋能,让学生的使用体验、教师的教学成果都显著提升。
三是管理支持。
通过算力服务支撑,高校可以将教育教学、学生管理、课程管理等业务实现信息化、数字化,简化运营和管理过程,提高教学与管理效率。
算力作为数字时代新的生产力,正广泛融合到社会生产生活的各个方面。在高校,算力作为一种重要的基础设施,具有广泛的应用前景,其重要性和地位将不断彰显,为教育领域的数字化转型提供有力的支撑和保障。
人工智能之火点燃算力需求
日前,ChatGPT和GPT-4等以大型语言模型(LLM)为代表的通用人工智能工具爆火,表明人工智能到了一个新的发展阶段,可能成为推动社会发展和科研创新的颠覆性工具。无论是计算分析还是人工智能领域的研究,都依赖于高质量成规模的算力。
上海交通大学网络信息中心副主任林新华认为,GPT-4的出现引爆了算力危机,但也引起民众对算力的关注,让算力对人工智能的重要性成为一种共识。
“这些需求投射至高等学校,就体现在对高校计算中心或超算中心建设的要求。”西湖大学超算中心技术主任李南表示。
高校作为基础研究的主阵地,正扛起推进AI研发和应用的大旗,如何构建AI所需的超高算力并加速科研成果转化,也早已悄悄提上日程。北京大学高性能计算平台主任工程师樊春表示,当前有很多科研项目既需要超算算力,又需要智算算力,从应用的需求上看就需要将这两种算力融合。计算支撑部门则要顺应时代潮流,为学校人工智能发展提供更多的支撑服务。比起分别建设算力平台和人工智能平台,高校可以考虑建立人工智能和超算的融合平台。
进一步推动高校算力服务建设
面对未来,随着GPU等协处理器技术、大数据、人工智能技术的发展,高校将越来越依赖于算力,算力平台的建设也将越来越重要。下一步,高校算力服务建设应该从哪方面发力?在调查和采访中,我们总结出,进一步推动高校算力服务发展可以从以下几方面布局:
第一,计算团队建设。
超算的管理是非常专业的,需要专门的研究和管理团队。当前,很多高校在超算的硬件设备投入上并不差,但超算中心能够提供的服务往往受限于团队的规模和能力。
首先,除了计算机学科领域出身的人才,计算团队还需要应用行业领域出身的人才,才能在提供计算服务中更好地沟通交流。在这方面,上海交通大学组建了具有“学科融合”特色的计算团队,将计算思维培养融入专业课教学中,并让科研团队专注于科研创新,让算力服务充分支撑教学和科研。
其次,面对人才编制等方面的限制和要求,算力团队建设不应局限于计算中心的有限范围,要拓展思维,加强与其他部门的合作,设计好相应的体制机制,打造建设、运维、管理、宣传的全链条人才团队。
此外,由于算力人才在互联网和其他IT行业可能拥有广泛的职业选择和晋升机会,因而高校需要特别关注人才待遇和职业规划。在这方面,中国科学技术大学出台了技术支撑绩效管理办法。绩效以技术支撑学校科研的质量、贡献和影响以及人才培养成效为导向,综合考虑技术支撑工作者年度工作情况,建立了科学合理的评价标准。
第二,建设模式选择。
从校级算力平台的所属单位看,比起隶属院系,或隶属独立的计算中心,将校级算力平台放在网络中心/信息中心可以更加专注于服务,对各院系和学科更中立更公正。中国科学技术大学、上海交通大学的实践表明,这种模式是很多学校在建设模式选择时的最优解。作为非科研单位,网络中心工作人员的评价体系主要与建好平台服务好用户相关,而不是自己发表多少论文等,人员可安心做好技术支持服务,更好服务用户。同时,网络中心已经有行政、财务、技术等各种人员配置,可以对超算平台进行更好的统筹和管理。
第三,体制机制建设。
“高校建设超算,如果只是买机器、买设备是远远不够的。”林新华表示,“体制机制这种软性层面的东西往往是高校算力服务发展的重要保障。”学校建设了校级超算平台之后,是否还应该允许院系建自己的平台?就是体制机制问题的一种体现。院系分散建设有很多局限性,其计算资源难以共享,利用率低;运维人员往往没有岗位编制,水平也参差不齐。
在这方面,上海交通大学出台政策,不允许院系自行购买信息系统程序服务器。南京航空航天大学立项建设高性能计算平台后,已不再批准各单位自行建设高性能计算的相关采购,初步估算,节约建设经费累计约500万元,节约计算费累计近80万元。
第四,软件建设。
随着大量传统学科纷纷开始在研究中使用算力,在此情况下,传统的HPC软件接入就显得过于复杂,使用门槛过高。这就需要更多关注用户的科研环境,提供更加精准的科研环境和软件,提高算力资源使用效率。
在这方面,北京大学自主研制的开源算力中心门户和管理平台SCOW(Super Computing On Web)通过简化集群软件部署流程、统一平台管理模式、提供图形化操作界面、降低用户使用门槛,实现算力中心资源易管理、易使用的目标,提高算力资源使用效率。
“未来的一流大学,除了学科科研之外,谁对数字能力的把握更好,谁就能够脱颖而出。我们需要用更大的格局、更高的战略眼光来看待算力服务,它有可能成为未来整个大学变革的巨大源泉。”相关人士指出。
总而言之,面向未来,高校算力建设的持续投入很关键,而创新是持续发展的前提。高校要更多地探索、发展国产计算技术,在自主创新上更多“探路”,让算力建设持续发展,更好地服务于高校数字化转型。
[1]来源:赛尔网络《高校网络服务情况和教育信息化需求调研报告(2022 年度)》