2022 03

计算:语言及语义

asc Supercomputer Competition

赛事简介

在ASC22初赛中，所有队伍需要完成两道极具挑战性的尖端应用赛题，分别是“源”AI语言大模型和AI+Science代表性软件DeePMD-kit。
2022年的AI赛题聚焦当前业界前沿AI大模型。“源”是2021年发布的一个面向中文的巨量语言模型，参数量达2457亿，刷新了业界多个中文榜单的记录，且在众多的语言处理任务场景中表现出了广阔的应用前景。AI大模型的训练面临着计算量和并行策略设计的双重挑战，因此也是参赛队展示超算性能优化能力的绝佳试验场。ASC22组委会提供了100GB的高质量中文数据集，要求参赛队基于这一数据集实现一个47亿参数的小号“源”模型。值得一提的是，组委会并没有提供模型设计的参考代码，这意味着参赛队需要自行完成模型结构构建和全部训练过程，并合理设计模型训练策略，以期得到最佳的计算性能。

DeePMD-kit赛题将引导大学生进行一场人工智能+科学研究(AI+Science)的前沿探索。科学研究与人工智能结合被视为当前最值得期待的创新趋势之一，机器学习分子动力学DeePMD-kit的出现成功推动了相关领域的跨越式发展。而高性能计算的加入将机器学习分子动力学的潜力持续释放：DeePMD-kit在超级计算机顶点（Summit）上达到了双精度91P的峰值性能，到解时间快于之前基线水平1000倍以上，相关成果获得了2020年戈登·贝尔奖。可以说DeePMD-kit的出现定义了科学研究+机器学习+高性能计算的新范式。本次赛题聚焦DeePMD-kit的训练效率优化，通过高性能优化提升训练速度对于用户来说至关重要。参赛选手将对DeePMD-kit的模型构建过程有一个直观认识，并可以使用高性能优化的手段优化整个训练过程。

ASC 世界大学生超级计算机竞赛是由中国发起组织，并得到亚洲及欧美相关专家和机构支持，旨在通过大赛平台推动各国及地区间超算青年人才交流和培养，提升超算应用水平和研发能力，发挥超算的科技驱动力，促进科技与产业创新。ASC超算大赛迄今已举行至第十届，吸引超过万名世界各国大学生参赛，是全球最大规模的超算竞赛。

时间
2022 03
人员 JGQ. DJ. JCH. RXY

竞赛官网 asc-events.org

节点配置与HCG性能测试

使用单个CPU节点，该节点的配置如下：
Intel(R) Xeon(R) Platinum 9242 CPU@2.30GHz，96个核心, 384GB DDR4 ECC REG内存;
InfiniBand QDR 100Gbps高速网络;

经过数次调整和优化，测试节点的最佳性能为4167.0 GFlops

详细硬件配置如下表所示:

Hardware resources
Item	Name	Configuration	Num
Server	Inspur NF5280M5	Intel® Xeon® Silver 4215 Processor 2.5GHz 8 cores x 2 Memory: 32G x 4，DDR4，2933Mhz Hard disk: 480G SSD SATA x 1 Power consumption estimation: 4215 TDP 85W, memory 12W, hard disk 7.5W	5
HCA card	InfiniBand/VPI Card	ConnectX®-5 VPI adapter card, FDR/EDR IB (100Gb/s) and 40/50/100GbE dual-port QSFP28 PCIe3.0 x16, tall bracket Power consumption estimation: 18W	5
Switch	GbE switch	10/100/1000Mb/s，24 ports Ethernet switch Power consumption estimation: 30W	1
Switch	EDR InfiniBand Switch	SB7800 InfiniBand EDR 100Gb/s Switch System 36 QSFP28 non-blocking ports 136W typical power consumption	1
Cable	Gigabit CAT6 cables	CAT6 copper cable, blue, 3m	5
Cable	InfiniBand cable	Mellanox® MCP1600 -E0xxEyy direct attach copper (DAC) cables, 100Gb/s QSFP28 port IB EDR, 3m, Black, 26AWG	5
GPU	NVIDIA V100 SXM2	NVIDIA NVLink 600 GB/s** PCIe Gen3.0 MEMORY:16GB HBM2 BANDWIDTH:1,133 GB/s Max TDP Power:250W	8

软件配置:

Software resources
Item	Name	Version
Operating system	Ubuntu	18.04
cluster workload manager	Slurm	20.11.2
Translater	mpicc, mpic++, nvcc	(Corresponding to the version of the package)
Translater	icc	2017.5.239
Math library	Intel mkl	2017.0
Math library	Fftw	3.3.8
MPI	OpenMPI	4.0.2
MPI	intel-mpi	17.0.5
GPU-accelerated application	CUDA toolkit	10.1
Message Passing libraries	ucx	1.8
GPU memory copy library	gdrcopy	2.0

功耗:

Name	Power consumption
Inspur NF5280M5	(85w * 2+ 12w + 7.5w) * 3
NVIDIA V100 SXM2	250w * 8
GbE switch	30w
EDR InfiniBand Switch	136w
InfiniBand/VPI Card	18w * 4
Total:2807w

赛事简介

集群搭建

节点配置与HCG性能测试

HPCG&HPL性能测试

Yuan大语言模型

个人总结

下一篇

计算:癌症与病理