国家天文台
“老虎”GPU高性能计算集群
年度总结报告
(2012)
国家天文台信息与计算中心
2012年12月
1.背景介绍
中国科学院在财政部专项资金的支持下,成功打造了计算峰值超过三千万亿次的GPU高效能超级计算系统,部署在国家天文台、中科院过程工程研究所、地质与地球物理研究所、电工研究所、高能物理研究所、紫金山天文台、计算机网络信息中心等单位。通过院所共同出资方式承建百万亿次系统,并最终聚合成计算能力近六千万亿次的分布式GPU超级计算系统,形成院GPU中心及各所GPU 分中心的两级管理体制。
国家天文台GPU高性能计算集群称为“老虎”,配备有85个计算节点,通过Infiniband高速网络连接;每个节点安装了2个4核的Xeon E5520中央处理器,24GB内存,CPU理论峰值为1.5万亿次;每个节点安装了2块Nvidia C1060图形加速卡,理论单精度浮点计算峰值约为160万亿次。
国家天文台GPU高性能计算集群于2009年底安装完成,2010年4月完成项目中期验收,2010年11月通过国家级项目验收,开始为国内外用户提供计算服务。
老虎集群的建成使得国家天文台在高性能计算支撑服务业务上实现了零的突破。从2009年开始为我台广大科学用户提供高性能计算服务,也已取得了丰硕的成果。在国家天文台特聘外籍教授Spurzem R.带领的丝绸之路项目组的推动下,我台GPU集群在国际高性能计算领域取得广泛的影响,深化了我台与国际天文与数值计算领域的合作。借助2012年Spurzem R.入选“外专千人计划”的良好契机,丝绸之路项目组和信息与计算中心计划在2013年对老虎GPU集群进行升级改造,将GPU卡C1060换成最新一代的K20,使集群的计算能力达到千万亿次。系统升级后将更好地支持大规模天文数值模拟计算、海量数据处理等研究课题的开展。
2.总体运行情况
2012年以来,GPU集群总体运行稳定。截止到2012年12月初,实际完成作业数10412个,实际作业计算总时间2878689.25小时。科学用户涉及台内数十个课题组及台外高校及研究机构。
2012年,GPU集群管理团队通过采取以下措施,优化了集群的作业调度,使得集群所有用户都能够公平的获取到作业运行时间从而完成自己的计算任务,
简化了集群的使用,发展了许多的新用户。
1).完善LSF集群作业管理系统,充分发挥LSF的作业管理功能,建立多种作业队列,保证用户提交的作业能够公平的调度。
2).编制了GPU集群操作手册,使得新用户能够根据手册很快熟悉环境,提交与运行自己的任务。
3).自主研发了CPU/GPU异构环境的GPU资源调度系统,使得在我台GPU 超级计算系统环境下,CPU与GPU作业都能够稳定运行,互不干扰,完全避免了资源冲突造成的节点死机问题的出现。
4).自今年6月以来,每月发布集群运行报告,向所有用户通报集群总体运维,用户使用机时,课题总体机时等情况。
3.科学论文产出
自2010年以来,借助于GPU集群提供的计算能力,部分用户公开发表了自己的研究成果,详见表1、表2。
表1 以国家天文台为第一单位发表的文章列表第一作者其它作者文章标题单位文献索引号
Long, R. J Mao, Shude;
Shen, Juntai;
Wang, Yougang Made-to-measure
遥遥在望的意思galaxy models - III
Modelling with
Milky Way
obrvations
1. 国家天文台
2. 曼彻斯特大学
3. 上海天文台
2012MNRAS.t
mp..215L
Long, R. J Mao, Shude; Made-to-measure
galaxy models - II.
Elliptical and
lenticular galaxies 1. 国家天文台
2. 曼彻斯特大学
2012MNRAS.
421.2580L
Wang, Yougang Zhao,Hongshen
g; Mao, Shude;
Rich, R. M.
A new model for the
Milky Way bar
1. 国家天文台
2. 曼彻斯特大学
2012MNRAS.
427.1429W
Ali Taani Luca Naso,
Yingchun Wei,
Chengmin
Zhang
Yongheng Zhao Modeling the Spatial
Distribution of
Neutron Stars in the
Galaxy
国家天文台2012Ap&SS.3蓝莓山药怎么做
41..601T
Spurzem, R. Berczik, P.;
Zhong, S.;
Nitadori, K.;
Hamada, T.;
Berentzen, I.; Supermassive Black
Hole Binaries in
High Performance
Massively Parallel
Direct N-body
国家天文台2012ASPC..45
3..223S
Veles, A. Simulations on
Large GPU Clusters
Berczik, P. Nitadori, K.,
Zhong S.,
Spurzem, R.,
Hamada, T,
Wang, X.W.,
Berentzen, I.,
Veles, A., Ge,
W., High performance
massively parallel
direct N-body
simulations on large
GPU clusters
国家天文台2nd
电影读后感International
Conference on
High
Performance
Computing
2012, Kyiv,
Ukraine
李长华崔辰州,
Berczik,P.,
薛随健,
Spurzem,R. 一个基于共享内存
的GPU资源调度器
的设计与实现
国家天文台科研信息化技
术与应用,
2012,V3(5):
29-33
表2 以国家天文台为合作单位发表的文章列表
第一作者其它作者文章标题单位文献索引号
Li Shuo Liu, F. K.;
Berczik,Peter;
Chen, Xian;
Spurzem,Rainer Interaction of
Recoiling
Supermassive
Black Holes with
Stars in Galactic
小儿化痰止咳糖浆Nuclei
1. 北京大学天文系
2. 海德堡大学
3. 国家天文台
2012ApJ (74)
<65L
Wang, J. Hammer, F.;
Athanassoula,
E.; Puech, M.;
Yang, Y.;
Flores, H. Loops formed by
tidal tails as fossil
records of a major
merger
1. Univ. Paris-Diderot
2. 国家天文台
2012A&A (5)
38A.121W
Just, Andreas; Yurin, Denis;
绘声绘色的意思Makukov,Maxim;
Berczik, Peter;
Omarov,
Chingis;
Spurzem, Rainer;
Vilkoviskij,
Emmanuil Y.
Enhanced
Accretion Rates
of Stars on
Supermassive
Black Holes by
Star-Disk
Interactions in
Galactic Nuclei
1. University of
Heidelberg
2. Fenkov
Astrophysical Institute
3.国家天文台
4. Main Astronomical
Obrvatory, National
Academy of Sciences of
Ukraine
5. Peking University
2012ApJ (75)
<51J
Khan,Fazee l Mahmood Preto, Miguel;
Berczik, Peter;
Berentzen, Ingo;
Just, Andreas;
Spurzem, Rainer
Mergers of
Unequal-mass
Galaxies:
Supermassive
Black Hole
1. University of
Heidelberg
2. Department of
Physics, Government
College University
2012ApJ (74)
9..147K
Binary Evolution and Structure of Merger Remnants (GCU), Pakistan 3.国家天文台
Fiestas, J.; Porth, O.;
Berczik, P.;
Spurzem, R. Evolution of
growing black
holes in
axisymmetric
galaxy cores
1.University of
Heidelberg
2.国家天文台
2012MNRAS
.57F
Fiestas,Jo ; Spurzem, Rainer Dynamical
Evolution of
Rotating Globular
Clusters with
Embedded Black
Holes
1.University of
Heidelberg
2.国家天文台
2012scel.boo
k..235F
Shang-Fei Liu James
Guillochon,
Douglas N. C.
Lin, Enrico
Ramirez-Ruiz
On the
Survivability and
Metamorphism of
Tidally Disrupted
Giant Planets: the
Role of Den
官场言情小说
Cores
1.PeKing University 2012arXiv12
11.1971L
Umbreit,Ste fan Spurzem, Rainer;
Henning,
Thomas; Klahr,
Hubert; Mikkola,
Seppo
桩巴龙
Disks around
Brown Dwarfs in
the Ejection
Scenario. I. Disk
Collisions in
Triple Systems
1. Max-Planck-Institut
f¨ur Astronomie
Heidelberg
2.国家天文台
3. Universit¨at
Heidelberg
2011ApJ (74)
3..106U
Ernst, A. Just, A.; Berczik,
新手烤烧烤技巧P.; Olczak, C. Simulations of the
Hyades
1. Universit¨at
Heidelberg
2.国家天文台
2011A&A (5)
36A..64E
4.用户分布情况
目前,GPU集群真正计算的用户为38个。其中25个为国家天文台职工或博士、博士后。其它用户来自北大天文系、海德堡大学、台湾大学等合作院校。GPU 集群的用户使用机时信息如表3所示。
表3 2012年时机使用统计
用户名姓名单位课题组/首席使用总机时百分比jlwang 王建岭NAOC 赵永恒研究员455432.1 15.82% yanbin 杨彦宾NAOC 武向平院士434115.83 15.08% liusf 刘双飞KIAA 403563.64 14.02% peter Peter NAOC Rainer 300820.43 10.45% lishuo 李硕NAOC,PK Rainer 298342.57 10.36%