跳转至

V.LWI

说明

立即数偏移·字加载(Load Word with Immediate Offset)
本指令用于从内存或Tile寄存器中读取 四个字节 的数据写入目的寄存器,并且支持Group内地址连续访问和不连续访问两种寻址方式:

  1. 不保证地址连续:由 基址寄存器左移两位的有符号立即数偏移 计算得到地址。
  2. 保证地址连续:由 基址寄存器左移两位的有符号立即数偏移左移两位的LC0寄存器 计算得到地址,并且要求基址寄存器必须是标量寄存器或者Tile类型的形参寄存器。

汇编语法

v.lwi<.local> [SrcL<.reuse><.ud>, <lc0<<2,> simm], ->RegDst.{W}

汇编符号

  • local:表示访问Tile寄存器的空间,缺省表示访问内存空间。
  • SrcL:基址寄存器,可以索引的寄存器类型请见向量指令介绍
  • lc0:块内私有的Lane Counter 0寄存器。可选,地址连续时使用。
  • reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
  • simm:有符号立即数偏移,该参数在simm24字段中的编码为simm/4。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍
  • W:寄存器的位宽标识,包括w,d等。

编码格式

V.LWI

其中,C和L标志位含义如下:

C(Continuous) 含义 L(local) 含义
0 Group内所有lane的地址不一定连续 0 访问内存空间
1 Group内所有lane的地址一定是连续的 1 访问Tile寄存器空间

执行方式

bits(64) pmask = P;   // lane掩码
// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
    integer {m, srctype}  = DecodeINT(SrcL);
    integer {d, dstwidth} = DecodeDst(RegDst); 

    if dstwidth < 32 then undefined;

    if (pmask[laneid] == 1) {
        bits(64) base = V[m, srctype, laneid];
        bits(64) offset = SignExtend(simm24);
        bits(64) address = base + (offset << 2);

        if C == 1 then
            bits(64) laneoffset = V[lc0, laneid];
            address += laneoffset << 2;

        bits(32) data = Mem[address][31:0];
        V[d, dstwidth, laneid] = SignExtend(data, dstwidth);
    }
    else {
        V[d, dstwidth, laneid] = 0;  // 无效lane中默认写0
    }
}

指令约束

对于同一个Group内地址连续的使用场景,有如下约束:

  • 基址寄存器必须是标量寄存器或Tile形参寄存器,否则报非法指令异常。
  • 应保证该指令在多维模式分组的数据块内使用。

continuels

备注

  1. 本指令支持地址非对齐访问。
  2. 本指令属于超长指令扩展,可用于向量数据块或访存数据块中。