V.SHFL.BFLY¶
说明¶
跨通道·蝶型搬移(Butterfly Shuffle)
将源通道SrcLane内源寄存器中的数据搬移到当前通道CurLane的目的寄存器中。源通道的ID由当前通道ID与一个掩码异或计算得到。
汇编语法¶
汇编符号¶
- SrcL:存储shuffle源数据的寄存器,可以索引的寄存器类型请见向量指令介绍。
- SrcP:存储shuffle掩码的寄存器,可以索引的寄存器类型请见向量指令介绍。
- reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
- T:指定操作数的数据类型,可选类型包括sb,sh,sw,sd,ub,uh,uw,ud等。
- ->:用于指示目的寄存器。
- RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍。
- W:目的寄存器的位宽标识,包括b,h,w,d等。
编码格式¶
执行方式¶
integer {m, srcwidth0} = DecodeINT(SrcL);
integer {k, srcwidth1} = DecodeINT(SrcP);
integer {d, dstwidth} = DecodeDst(RegDst);
bits(srcwidth1) mask = V[k, srcwidth1];
bits(64) pmask = P; // lane掩码
// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
if (pmask[laneid] == 1) {
integer src_id = laneid ^ mask; // 源数据所在lane的ID
bits(srcwidth0) data = V[m, srcwidth0, src_id]; //lane[src_id]对应的SrcL值
V[d, dstwidth, laneid] = data;
}
else {
V[d, dstwidth, laneid] = 0;
}
}

备注¶
本指令属于超长指令扩展,可用于向量数据块或访存数据块中。