解算粒子量较大时,CPU使用率上不去

粒子量,到大几千万的时候,cpu占用率多数时间在5-7%,解算粒子量在1.5亿左右的时候,解算一帧的时间在13分钟左右.
场景只设置了 一个cube的发射源,以及一个obj的模型,转换成sdf,输入成静态碰撞体。和一个大小为200 130 300 cube作为解算区域。解算精度为0.35。
解算结果是正常的,场景没有出现粒子爆炸的问题.
(硬件为cpu:5950x 已经设置了固态硬盘缓存,内存 ddr4 128g 显卡 3080ti)

我想了解,这个cpu占用率较低以及解算时长是正常的么?以及有办法看解算哪一部分比较耗时么?
如果有需要我可以提供我的工程.谢谢.