1. 去掉 parent_indices索引和child_indices,改用 8*i+1,8*i+8来索引child 2.改变叶节点查找,使用层级遍历方式查找更新叶节点的方式。(为了利用torch的并行计算功能)