软件优化的原理与实践系列之一向量化计算

向量化计算

软件优化的原理与实践系列之一

前言

用过MATLAB仿真语言的同学，都有这样的经验。要尽量多用向量化运算，而不要自己手写循环语句，否则代码的执行效率会相当低下。如果你熟悉python，涉及到数值计算的时候，也要尽量的调用成熟的数值计算的库，比如numpy，而不是自己用循环去实现。一个众所周知的理由是，别人成熟的库已经经过了高度的优化，我们没有必要重复造轮子。

事实上，还有另外一个根本性的原因是，向量化计算，就即使没有经过任何优化的代码，也会比非向量化运算要快。本篇博文将试图解释其根本性原因。

背景

现代计算机大都采用了分层的存储器结构：寄存器，cache，主存，磁盘。CPU的计算单元直接和寄存器交换信息，计算时需要把数据逐级传递到寄存器，计算得到的结果也要将结果逐级放回存储器。基于这种存储体系结构，程序员在编制软件的时候，要尽量的减少和cache，主存，磁盘这些存储器交换数据。我们把整个软件的执行实行划分为两部分，CPU真正执行运算的时间和寄存器与存储器交换数据的时间，即：

软件优化的原理与实践系列之一向量化计算

常见线性代数运算操作的q值

小结

把计算流程用向量，矩阵的数学语言重新描述，在此基础上实施的计算，总是比标量计算的效率高，即使代码没有经过任何优化。

软件优化的原理与实践系列之一向量化计算

前言

背景

小结

相关推荐