跳转至

V.LD.XOR

说明

内存加载双字·取异或(Load Doubleword Xor)
本指令执行如下的原子操作:从左源寄存器指向的内存位置原子性地加载 64 位数据,与右源寄存器的 64 位数据按位异或,将结果原地写回内存,并将加载的原始数据写到目的寄存器中。

本指令可以选择带有 Load-AcquireStore-Release 语义。

汇编语法

v.ld.xor<.{aq, rl, f, aqrl, aqf, rlf, aqrlf}> [SrcL<.reuse><.ud>], SrcL<.reuse>.{T}, ->Dst.d

汇编符号

  • 指令可以带有如下可选后缀:
    • .aq:表示带有Load-Acquire的同步语义。
    • .rl:表示带有Store-Release的同步语义。
    • .f:表示内存访问发生在远端Cache中。
    • 其他后缀(例如.aqrl)为以上基础后缀的组合形式。
  • SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍
  • .ud: 左源寄存器后缀,表示其作为 64 位操作数。
  • SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍
  • reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
  • T:操作数的数据类型,可选类型包括sd,ud等。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引vt/vu/vm/vn等向量寄存器。
  • .d:目的寄存器的位宽标识(d表示64-bit)。

编码格式

V.LD.XOR

寄存器字段的编解码方式请见长指令编码小节。

执行方式

bits(64) pmask = P;   // lane掩码
integer {m, srcWidth1} = DecodeINT(SrcL);
integer {n, srcWidth2} = DecodeINT(SrcR); 
integer {d, dstWidth} = DecodeDst(RegDst);

// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
    Atomic {
        bits(64) address = V[m, srcWidth1, laneid];
        bits(64) operand = V[n, srcWidth2, laneid];

        bits(64) oldValue = Mem[address][63:0];
        bits(64) newValue = oldValue & operand;  // 按位异或

        Mem[address] = newValue;
        V[d, dstWidth, laneid] = oldValue;
    }
}

注意事项

如果寄存器位宽不满足本指令的要求,那么硬件不保证执行结果的正确性(执行结果不可知)。

备注

  1. 本指令属于超长指令扩展,可用于向量数据块或访存数据块的块体内。
  2. 本指令的标量版本请见L.LD.XOR