跳转至

V.SHFLI.UP

说明

跨通道·向上搬移(Shuffle Up with Immediate)
源通道SrcLane内源寄存器中的数据搬移到当前通道CurLane的目的寄存器中。源通道的ID由当前通道ID减去偏移值计算得到。

汇编语法

    v.shfli.up SrcL<.reuse>.{T}, SrcR<.reuse>.{T}, imm, ->RegDst.{W}

汇编符号

  • SrcL:存储shuffle源数据的寄存器,可以索引的寄存器类型请见向量指令介绍
  • SrcR:存储shuffle范围的寄存器,可以索引的寄存器类型请见向量指令介绍
  • imm:表达shuffle偏移量的立即数,范围是[16383, 0]。
  • reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
  • T:指定操作数的数据类型,可选类型包括sb,sh,sw,sd,ub,uh,uw,ud等。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍
  • W:目的寄存器的位宽标识,包括b,h,w,d等。

编码格式

V.SHFLI.UP

执行方式

integer {m, srcwidth0} = DecodeINT(SrcL);
integer {n, srcwidth1} = DecodeINT(SrcR);
integer {d, dstwidth} = DecodeDst(RegDst);

bits(srcwidth0) data;
bits(srcwidth1) range = V[n, srcwidth1];
bits(64) offset = ZeroExtend(imm);;

if range == 0 then range = Groupsize;
bits(64) pmask = P;   // lane掩码
integer delt = offset % range;

// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
    integer src_id = cur_id - delt;    // 源数据所在lane的ID

    if ((cur_id % range) - delt) >= 0 then
        data = V[m, srcwidth0, src_id];  //lane[src_id]对应的SrcL值
    else
        data = V[m, srcwidth0, cur_id];  //lane[cur_id]对应的SrcL值

    V[d, dstwidth, cur_id] = data;
}

shfl.up

备注

本指令属于超长指令扩展,可用于向量数据块或访存数据块中。