是否可以使用CPU上的单个核心运行Tensorflow?

问题描述:

有没有办法强制Tensorflow使用单个CPU内核而不是分布式CPU内核?是否可以使用CPU上的单个核心运行Tensorflow?

我问,因为在多个CPU上分配BLAS功能的回报通常是递减的,至少在我尝试过使用OpenBLAS和Julia的情况下。

我想要超参数搜索运行32个CPU核心,几百个模型培训。我认为在单个CPU内核上并行训练32个模型要比使用分布式BLAS训练32个模型系列要高效得多(我已经在Mocha Framework/Julia上展示了这些,这些变化很漂亮易于实现)。

您应该可以使用常规numctl --physcpubind以及with tf.device()