“交我算”平台简介

上海交通大学“交我算”平台是校级计算公共服务平台,由网络信息中心负责建设与日常管理,全面支撑全校教学、科研、管理等多方面计算需求。在学校统筹部署下,网络信息中心秉承“普惠、融合”的建设理念,针对师生的各种计算与存储需求,打造公共计算服务平台底座。经过“十二五”、“十三五”的持续投入与建设,已将“交我算”建成为国内高校顶尖的算力基座,具体包括云平台、人工智能计算平台、高性能计算平台等五大计算平台和科学大数据平台;并打造聚合门户,提供统一用户入口,为师生提供“互联网”化的计算服务体验。

  • “思源一号”高性能计算集群总算力 6 PFLOPS,是目前国内高校第一的超算集群,2021年11月TOP500 榜单排名第132位。CPU 采用双路 Intel Xeon ICX Platinum 8358 32 核,主频 2.6GHz,共938个计算节点;GPU采用NVIDIA HGX A100,共92块GPU卡。计算节点之间使用Mellanox 100 Gbps Infiniband HDR 高速互联,并行存储的聚合存储能力达10 PB。

  • π2.0集群双精度理论峰值性能为2.1 PFLOPS,是国内高校和上海地区最快的超算之一。π2.0是国内最早使用Intel Cascade Lake CPU构建的超算,拥有656个计算节点,共计26240个CPU核,可支持大规模HPC应用。计算节点之间使用100 Gbps的Intel OmniPath互联。

  • 人工智能计算平台双精度计算能力达到1 PFLOPS,张量计算能力达到16 PFLOPS,其计算能力由8台NVIDIA DGX-2服务器提供。每台DGX-2配置16块Tesla V100 GPU加速卡,2颗Intel至强铂金8168 CPU,1.5 TB DDR4内存,30 TB NVMe SSD和512GB HBM2显存。

  • 云计算平台jCloud2.0是由上海交通大学创建与运维、基于OpenStack开发的基础设施即服务(IaaS)云计算服务平台,集中了弹性可扩展计算、分布式块存储和软件定义网络(SDN)等IaaS核心技术,并在此基础上提供了虚拟数据中心(VDC, Virtual Data Center)服务,为用户提供安全、可靠与隔离的基础设施云环境。拥有16000核Intel 6148,内存达150TB。

  • ARM超算平台是国内首台基于ARM处理器的校级超算集群。平台一共有100个计算节点,单节点配备128核(2.6 GHz)、256GB内存(16通道DDR4-2933)、240GB本地硬盘,节点间采用IB高速互联,挂载Lustre并行文件系统。

  • 科学大数据平台:当前存储容量已达35PB,位居国内高校前列。“十四五”期间将根据用户需求,逐步扩容到100PB以上。

    “交我算”平台服务学校高精尖科研创新。自2013年以来累计服务一级学科30多个,支撑用户发表高水平论文600多篇(其中CNS及其子刊47篇),为10多个学科提供了学科融合的计算服务。除服务交大科研之外,平台还持续免费为课程教学提供优质计算资源,帮助计算类实践课程内容模拟真实科研计算场景,提升课程实效。自2019年来,平台累计服务课程180余门次,受益师生超过1万人次。平台亦注重高性能计算人才培养。通过与计算机系联合培养高性能计算方向的学生,以竞赛培养学生对高性能计算的兴趣;同时也通过暑期课程、系列培训和专项奖学金等多种方式鼓励更多的学生来用超算。平台每年组织学生参加相关竞赛,代表上海交大在世界大学生超级计算机竞赛 (ASC) 等超算大赛上取得了一系列优异成绩,屡获大奖。

    提供优质的用户服务是“交我算”平台的重点目标。凭借国际化水准的运维和成熟的集群管理经验,计算平台用户数持续增长,运维实现自给自足。团队坚持“用好机器”的既定目标,深化代码优化服务,推广在线自助服务,加强用户培训,更新完善系统软件,大幅扩展存储容量,改进运行环境,不断提升用户满意度。随着计算能力、存储能力和服务能力的不断提升,“交我算”平台将为学校创建世界一流大学做出更大的贡献。