diff --git a/README.md b/README.md index 99db2dc7ca01afce07ca3cc2ae716b0fb5198a3b..149f1fcd425f1389a9ee52beb2ad73de65872995 100644 --- a/README.md +++ b/README.md @@ -94,3 +94,41 @@ would be related to number of MPI ranks. Thus the more processes you used in `mp | node3 | 16 | 0.5 GB | 0.352 | | node[1,2] | 8 \* 2 | 0.5 GB | 0.430 | | node[3,4] | 8 \* 2 | 0.5 GB | 1.935 | + +## Tuyy's Test of NAMD-EPC + +Source on [GitHub](https://github.com/vtzf/MPI_Comm_Test) + +### 根据 Alltoall/Alltoallv 16 核测试结果: + +1. 系统更新后,大规模通信(>=1GB)效率明显提升: + + - h3c 节点内通信效率提升 4 倍,sugon 节点内通信效率提升 3 倍 + - h3c 节点间通信效率提升 1.3 倍,sugon 节点间通信效率提升 4 倍 + - h3c 节点间通信效率在更新前后均优于节点内通信,不符合常理,仍需测试 + +2. 中等规模通信(64-512MB)效率上: + + - h3c 节点内通信效率略有下降,sugon 节点内通信效率变化不大 + - h3c 节点间通信效率变化不大,sugon 节点间通信效率提升 10-15 倍 + +3. 小规模通信(<=64MB)效率上: + - h3c 节点内通信效率变化不大,sugon 节点内通信效率变化不大 + - h3c 节点间通信效率提升 2 倍,sugon 节点间通信效率提升 30-50 倍 + +### 根据 NAMD-EPC 32 核测试结果: + +系统更新后, +Transpose 模块与一次 `MPI_Alltoallv` 大规模通信和多层 for 循环计算相关, +TimeProp 模块与 mkl 计算库和中等次数 `MPI_Iallgatherv` 的小规模通信相关, +SurfHop 模块与中等次数 `MPI_Allgather` 和大量次数 `MPI_Isend`/`Irecv` 的小规模通信相关, + +1. Transpose 模块上, + - h3c 单节点计算效率基本不变,跨节点计算效率提升 1.5-2 倍, + - sugon 跨节点计算效率大大提升 20-30 倍 +2. TimeProp 模块上, + - h3c 单节点和跨节点计算效率基本不变 + - sugon 跨节点计算效率提升数倍 +3. SurfHop 模块上, + - h3c 单节点和跨节点计算效率基本不变 + - sugon 跨节点计算效率大大提升 50-100 倍