跳转至

V.LW.MIN

说明

内存加载字·取最小值(Load Word, Signed Minimum)
本指令执行如下的原子操作:从左源寄存器指向的内存位置原子性地加载 32 位数据,将其与右源操作数的低 32 位进行最小值比较,将结果原地写回内存,并将加载的原始数据写到目的寄存器中。

本指令可以选择带有 Load-AcquireStore-Release 语义。

汇编语法

v.lw.min<.{aq, rl, f, aqrl, aqf, rlf, aqrlf}> [SrcL<.reuse><.ud>], SrcR<.reuse>.{T}, ->RegDst.{W}

汇编符号

  • 指令可以带有如下可选后缀:
    • .aq:表示带有Load-Acquire的同步语义。
    • .rl:表示带有Store-Release的同步语义。
    • .f:表示内存访问发生在远端Cache中。
    • 其他后缀(例如.aqrl)为以上基础后缀的组合形式。
  • SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍
  • .ud: 左源寄存器后缀,表示其作为 64 位地址。
  • SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍
  • T:操作数的类型标识,可选类型包括sw,sd,uw,ud。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引vt/vu/vm/vn等向量寄存器。
  • W:目的寄存器的位宽标识,可选类型包括w,d等。

编码格式

V.LW.MIN

寄存器字段的编解码方式请见长指令编码小节。

执行方式

bits(64) pmask = P;   // lane掩码
integer {m, srcWidth1} = DecodeINT(SrcL);
integer {n, srcWidth2} = DecodeINT(SrcR); 
integer {d, dstWidth} = DecodeDst(RegDst);

// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
    Atomic {
        bits(64) address = SREG[m, srcWidth1];
        bits(32) operand = SREG[n, srcWidth2];

        bits(32) oldValue = Mem[address][31:0];
        bits(32) newValue;

        if sign2 == 0 then
            newValue = (operand <(u) oldValue ? operand : oldValue);  // 无符号比较
        else 
            newValue = (operand <(s) oldValue ? operand : oldValue);  // 有符号比较

        Mem[address] = newValue;
        SREG[d, dstWidth] = SignExtend(oldValue, 64);    
    }
}

注意事项

  1. 默认内存加载的数据与右源操作数的符号性相同。
  2. 如果寄存器位宽不满足本指令的要求,那么硬件不保证执行结果的正确性(执行结果不可知)。

备注

  1. 本指令属于超长指令扩展,可用于向量数据块或访存数据块的块体内。
  2. 本指令的标量版本请见L.LW.MIN