感觉应该是和内核有关的? 谢谢
我们的高性能计算机是:cluster,每个node上有4个cpu,总共有16个node
1. 并行的时候在linux下必须要加上下面几句话,不知道为什么?
export LD_ASSUME_KERNEL=2.4.1 (知道这个语句是设置环境变量,但是为什么是2.4.1,怎么查找这个参数)
ulimit -s 102400 (必须加上这个语句,不然不能并行,为什么?好像有的机子上不用这个命令的)
2.并行的时候感觉无法使用多个cpu,具体的情况如下。
当设置export OMP_NUM_THREADS=2的时候,用top查看,每个cpu的使用率大概是100%
当设置export OMP_NUM_THREADS=4的时候,每个cpu的使用率大概是50%
当设置export OMP_NUM_THREADS=8的时候,每个cpu的使用率大概是25%
想让export OMP_NUM_THREADS=8(或者更多)的时候,cpu的使用率也是100%如何设置呢?还是说机器的性能就这样呢?
非常谢谢