1 缩写 & 引用

TPPS: total partial pixel summation
TPS: total pixels summation
BWN: binary weights network
TWN: ternary weights network
PPS: binary activations and weights

2 abstract & introduction

本文的三个主要创新点：

total partial pixel summation
kernel transformation data reconstruction
hybrid load balancing mechanism

对于low-bit权重网络，会存在的可以优化的地方是：

相同的操作
冗余的操作
负载不平衡

最后流片的结果是BNN可以实现765.6TOPS/W

3 overall architecture

主要包括计算单元、configurable interfere、控制器、片上存储
计算单元一共有32个PE，分成16组，每组的两个PE可以交换输入权重和输出activation来平衡负载，32个PE可以同时计算32个输入和32个权重的卷积
控制器可以通过配置工作模式S0-S4针对不同位宽的情况，如果TPPS更省计算量，就用TPPS的方式计算；如果KTDR更省计算量，就按照KTDR的方式计算；如果稀疏性不够，TPPS和KTDR都不能节省计算开销，就按照以前的original的方式计算
文献阅读（49）