跳转至

V.FMUL

说明

浮点乘(Floating-point Multiply)
左源寄存器和右源寄存器的浮点数相乘,将舍入后的结果写入目的寄存器。

汇编语法

    v.fmul SrcL<.reuse>.{T}, SrcR<.reuse>.{T}, ->RegDst.{W}, rm, sat

汇编符号

  • SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍
  • SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍
  • reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
  • T:指定操作数的数据类型,可选类型包括fb, fh, fs, fd等。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍
  • W:目的寄存器的位宽标识,包括b,h,w,d等。
  • rm(rounding mode):舍入模式的标记符。
  • sat(saturation):支持饱和计算的标志。

编码格式

V.FMUL

舍入模式rm字段编码:

编码 舍入模式 含义
0 RNONE No Rounding(不指定舍入模式,由硬件/实现决定默认行为)可缺省
1 RNE Round to Nearest, ties to Even(向最近偶数舍入;最常见)
2 RTZ Round Toward Zero(向零舍入,截断小数部分)
3 RDN Round Down(向负无穷舍入)
4 RUP Round Up(向正无穷舍入)
5 RNA Round to Nearest, ties Away from Zero(远离零)
6 RTO Round to Odd(向最近奇数舍入)
7 RHB Hybrid Rounding(混合舍入模式)
>7 reserve 保留

饱和计算sat位编码:

sat 含义
0 无饱和计算(默认)
1 启用饱和计算

执行方式

  • 解码源寄存器域:DecodeFP
  • 解码输出参数:DecodeDst
  • 通用寄存器读写:V[]
    bits(64) pmask = P;   // lane掩码
    // lanenum表示当前Group内lane的数量
    for (laneid = 0; laneid < lanenum; laneid++)
    {
        integer {m, srctype1} = DecodeFP(SrcL);
        integer {n, srctype2} = DecodeFP(SrcR); 
        integer {d, dstwidth} = DecodeDst(RegDst); 
    
        if srctype1 != srctype2 then undefined;
    
        if (pmask[laneid] == 1) {
            srctype1 operand1 = V[m, srctype1, laneid];
            srctype2 operand2 = V[n, srctype2, laneid];
    
            bits(64) result = operand1 * operand2;
    
            if (sat == 1) {
                if (result >= MaxValue) result = MaxValue;
                if (result <= MinValue) result = MinValue;
            }
            V[d, dstwidth, laneid] = result;  // 根据输出寄存器位宽对结果进行截断
        }
        else {
            V[d, dstwidth, laneid] = 0;  // 无效lane中默认写0
        }
    }
    

备注

本指令属于超长指令扩展,可用于向量数据块或访存数据块中。