barrel_shift二分法设计实现
关注我的微信公众号:全栈芯片工程师
最简单的barrel shift如下:
其综合出来的电路如下,纯组合逻辑即可实现。假设我们需要在一个bus总线中根据idx动态选择一部分数据输出,若继续采用上图代码实现方式的话,有如下缺点:
1、大位宽的BUS总线MUX选择非常多,代码行很多;
2、MUX级数非常大,资源大,影响Area;
3、MUX级数非常大,延时大,影响Performance;
barrel_shift的经典案例,假设我们需要从256组数据单元中选择124个数据单元输出:
input din [256*dw-1:0]; input idx [8-1:0];// 0~132 output dout [124*dw-1:0];
输出的起始位置为idx(取值只能爱0~132,如果取值超过132,比如是140,那么140~255不够124个数据,输出中会出现重复的数据)
reg [dw-1:0] s0[124]; // wid = 124 + 2^0 - 1 reg [dw-1:0] s1[125]; // wid = 124 + 2^1 - 1 reg [dw-1:0] s2[127]; // wid = 124 + 2^2 - 1 reg [dw-1:0] s3[131]; // wid = 124 + 2^3 - 1 reg [dw-1:0] s4[139]; // wid = 124 + 2^4 - 1 reg [dw-1:0] s5[155]; // wid = 124 + 2^5 - 1 reg [dw-1:0] s6[187]; // wid = 124 + 2^6 - 1 reg [dw-1:0] s7[251]; // wid = 124 + 2^7 - 1 reg [dw-1:0] s8[256]; //input width
首先需要对输入的数据进行分块,以dw位宽为一个块,用二位数组缓存起来。
generate for(i=0;i<256;i=i+1)begin:REFORM_INPUT [email protected](*)begin s8[i][0+:dw] = din[i*dw +: dw]; end end endgenerate
先开始进行idx的最高位进行译码,将din的数据分为两部分,输出的数据的起点就会在这两部分数据中,假设起点在前一部分,即起点为din[0*dw],din[1*dw]....din[127*dw],如果起点是din[127*dw]那么输出数据会是din[127*dw:(127+124-1)*dw],这部分数据包括了后半部分是数据。考虑完备,根据idx[7]的选择,需要输出128+124-1个数据(使用的2分法译码)。
generate for(i=0;i<251;i=i+1)begin:SEL7 if(i<128)begin [email protected](*)begin if(idx[7]==1'b0)begin s7[i] = s8[i]; end else begin s7[i] = s8[i+128]; end end end else begin [email protected](*)begin s7[i] = s8[i];//只有在idx[7]==1'b0的时候才有意义,idx[7]==1'b1的时候会出现一部分重复数据。 end end end endgenerate
根据判断idx[7]从256中选择出251个数据,接下来要判断idx[6]选择出124 + 2^6 -1 = 187个数据
generate for(i=0;i<187;i=i+1)begin:SEL6 [email protected](*)begin if(idx[6]==1'b0)begin s6[i] = s7[i]; end else begin s6[i] = s7[i+64]; end end end endgenerate
接下来的每判断idx[k]就可以去除2^k个数据,最后只剩下124个数据
generate for(i=0;i<155;i=i+1)begin:SEL5 [email protected](*)begin if(idx[5]==1'b0)begin s5[i] = s6[i]; end else begin s5[i] = s6[i+32]; end end end endgenerate generate for(i=0;i<139;i=i+1)begin:SEL4 [email protected](*)begin if(idx[4]==1'b0)begin s4[i] = s5[i]; end else begin s4[i] = s5[i+16]; end end end endgenerate generate for(i=0;i<131;i=i+1)begin:SEL3 [email protected](*)begin if(idx[3]==1'b0)begin s3[i] = s4[i]; end else begin s3[i] = s4[i+8]; end end end endgenerate generate for(i=0;i<127;i=i+1)begin:SEL2 [email protected](*)begin if(idx[2]==1'b0)begin s2[i] = s3[i]; end else begin s2[i] = s3[i+4]; end end end endgenerate generate for(i=0;i<125;i=i+1)begin:SEL1 [email protected](*)begin if(idx[1]==1'b0)begin s1[i] = s2[i]; end else begin s1[i] = s2[i+2]; end end end endgenerate generate for(i=0;i<124;i=i+1)begin:SEL0 [email protected](*)begin if(idx[0]==1'b0)begin s0[i] = s1[i]; end else begin s0[i] = s1[i+1]; end end end endgenerate
最后将s0数组中的数据转成输出数据的格式:
generate for(i=0;i<124;i=i+1)begin:GET_OUT [email protected](*)begin dout[i*dw +: dw] = s0[i]; end end endgenerate