V.LW.MIN¶
说明¶
内存加载字·取最小值(Load Word, Signed Minimum)
本指令执行如下的原子操作:从左源寄存器指向的内存位置原子性地加载 32 位数据,将其与右源操作数的低 32 位进行最小值比较,将结果原地写回内存,并将加载的原始数据写到目的寄存器中。
本指令可以选择带有 Load-Acquire,Store-Release 语义。
汇编语法¶
汇编符号¶
- 指令可以带有如下可选后缀:
- .aq:表示带有Load-Acquire的同步语义。
- .rl:表示带有Store-Release的同步语义。
- .f:表示内存访问发生在远端Cache中。
- 其他后缀(例如.aqrl)为以上基础后缀的组合形式。
- SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍。
- .ud: 左源寄存器后缀,表示其作为 64 位地址。
- SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍。
- T:操作数的类型标识,可选类型包括sw,sd,uw,ud。
- ->:用于指示目的寄存器。
- RegDst: 目的寄存器,可以索引vt/vu/vm/vn等向量寄存器。
- W:目的寄存器的位宽标识,可选类型包括w,d等。
编码格式¶
寄存器字段的编解码方式请见长指令编码小节。
执行方式¶
- 解码输入参数:DecodeINT
- 解码输出参数:DecodeDst
- 通用寄存器读写:V[]
- 将数据符号扩展:SignExtend()
bits(64) pmask = P; // lane掩码
integer {m, srcWidth1} = DecodeINT(SrcL);
integer {n, srcWidth2} = DecodeINT(SrcR);
integer {d, dstWidth} = DecodeDst(RegDst);
// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
Atomic {
bits(64) address = SREG[m, srcWidth1];
bits(32) operand = SREG[n, srcWidth2];
bits(32) oldValue = Mem[address][31:0];
bits(32) newValue;
if sign2 == 0 then
newValue = (operand <(u) oldValue ? operand : oldValue); // 无符号比较
else
newValue = (operand <(s) oldValue ? operand : oldValue); // 有符号比较
Mem[address] = newValue;
SREG[d, dstWidth] = SignExtend(oldValue, 64);
}
}
注意事项¶
- 默认内存加载的数据与右源操作数的符号性相同。
- 如果寄存器位宽不满足本指令的要求,那么硬件不保证执行结果的正确性(执行结果不可知)。