常见问题

Q: 高性能计算集群目前有多少计算资源?
A: 集群目前拥有332台CPU计算节点、69台GPU计算节点、20台大内存节点和4PB的存储容量。详见:
http://hpc.sjtu.edu.cn/info/1010/1001.htm

Q: 高性能计算集群是如何计费的呢?
A: 集群根据用户实际使用的计算资源计费,最小单位为1个计算核每小时,即机时费仅与所使用的处理器类型、核数与时间相关,具体参见:
https://pi.sjtu.edu.cn/doc/faq/

Q: 我怎么查看缴费是否成功呢?
A: 请登录π集群的计费系统查看账户剩余情况(
http://acct.hpc.sjtu.edu.cn

Q: 为什么我的测试账号第一次登陆就失败了?
A: 请仔细阅读账号邮件中所附信息,向管理员发送您所使用的固定IP地址。

Q: 我的账号被暂停了,数据是否会被立即删除?
A: 请放心,在清理账号之前我们都会提前通知用户,暂停的账号不会被立即删除。

Q: 能否帮我安装一下商用软件?
A: 高性能计算中心不提供对于任何商用软件的技术支持(包括Matlab、ANSYS等)。

Q: 单个作业的运行时间有限制吗?
A: 基于如下几个个主要理由,我们对单个作业运行时间做了最长运行7天的限制:1) 长时间作业运行不利于计算资源的使用和流转。可能出现的不好情况是,某个用户的作业长期占用计算资源,作业调度系统需要一个很长的周期(譬如20天)才能在用户之间进行机时平衡与分配;2) 长时间运行作业对故障诊断也很有挑战。作业意外中断后,要一直追溯很多天发生的软硬件状态进行分析,很难界定是哪一部分的问题——是软件本身,还是Pi集群的问题?决定是否应该返还作业机时变得很困难。3) 长时间运行作业也很容易产生巨额账单。作业只有在结束或退出时才会被计费,假期把作业丢上去不管,过后可能生成一个很吓人的账单。

Q: 我有技术问题,但在这里没有找到答案怎么办?
A: 请将问题通过邮件发送至
hpc [at] sjtu [dot] edu [dot] cn,高性能计算部的工程师们会回答你的问题。

Q: 是否允许将π集群上的软件授权共享给集群外的计算机?
A: 不允许。

Q: 队列上有空闲节点,SLURM为什么不加载作业?
A: SLURM使用基于优先级的调度,尽量确保每个课题组公平地分到机时。因此SLURM会为高优先级的大作业预留资源,暂停加载小作业。如果没有这样的机制,大作业在资源紧张时就永远没有足够资源启动了。

下一条:校内标准用户缴费指南

Copyright ©2013 SJTU Network & Information Center All rights reserved.