跳转至

V.ICVTF

说明

整型向浮点型转换(Integer Convert to Floating-point)
将源寄存器的指定类型的整数转换为目标类型的浮点数,并将转换结果写入目的寄存器中。

汇编语法

    v.icvtf.{st2dt} SrcL<.reuse>.{T}, SrcR<.reuse>.{T}, ->RegDst.{W}, rm, sat

汇编符号

  • srcT:表达源操作数的数据类型,编码于SrcType字段。
  • dstT:表达目标操作数的数据类型,编码于DstType字段。
  • SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍
  • SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍
  • reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
  • T:指定操作数的数据类型,可选类型包括sb,sh,sw,sd,ub,uh,uw,ud等。
  • ->:用于指示目的寄存器。
  • RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍
  • W:目的寄存器的位宽标识,包括b,h,w,d等。
  • rm(rounding mode):舍入模式的标记符。
  • sat(saturation):支持饱和计算的标志。

编码格式

V.ICVTF

SrcType和DstType字段编码方式如下:

编码 原格式(SrcType) 目标格式(DstType) 编码 原格式(SrcType) 目标格式(DstType)
5'b00000 u64 fp64 5'b10000 reserve fp16x2
5'b00001 u32 fp32 5'b10001 reserve bf16x2
5'b00010 u16 tf32 5'b10010 reserve e4m3x4
5'b00011 u8 hf32 5'b10011 reserve e5m2x4
5'b00100 u4x2 fp16 5'b10100 reserve e4m3x2
5'b00101 u16x2 bf16 5'b10101 reserve e5m2x2
5'b00110 u8x4 hif8 5'b10110 reserve e6m2x2
5'b00111 reserve e4m3 5'b10111 reserve reserve
5'b01000 s64 e5m2 5'b11000 reserve reserve
5'b01001 s32 e3m2 5'b11001 reserve reserve
5'b01010 s16 e2m3 5'b11010 reserve reserve
5'b01011 s8 e2m1x2 5'b11011 reserve reserve
5'b01100 s4x2 e1m2x2 5'b11100 reserve reserve
5'b01101 s16x2 hif4x2 5'b11101 reserve reserve
5'b01110 s8x4 e8m0 5'b11110 reserve reserve
5'b01111 reserve e6m2 5'b11111 reserve reserve

舍入模式rm字段编码:

编码 舍入模式 含义
0 RNONE No Rounding(不指定舍入模式,由硬件/实现决定默认行为)可缺省
1 RNE Round to Nearest, ties to Even(向最近偶数舍入;最常见)
2 RTZ Round Toward Zero(向零舍入,截断小数部分)
3 RDN Round Down(向负无穷舍入)
4 RUP Round Up(向正无穷舍入)
5 RNA Round to Nearest, ties Away from Zero(远离零)
6 RTO Round to Odd(向最近奇数舍入)
7 RHB Hybrid Rounding(混合舍入模式)
>7 reserve 保留

饱和计算sat位编码:

sat 含义
0 无饱和计算(默认)
1 启用饱和计算

执行方式

enum SrcDataType {
    U64, U32, U16, U8, U4x2, U16x2, U8x4,
    S64, S32, S16, S8, S4x2, S16x2, S8x4
};
enum DstDataType {
    FP64, FP32, TF32, HF32, FP16, BF16, HiF8, E4M3, 
    E5M2, E3M2, E2M3, E2M1x2, E1M2x2, HIF4x2, E8M0, E6M2,
    FP16x2, BF16x2, E4M3x4, E5M2x4, E4M3x2, E5M2x2, E6M2x2
};

bits(64) pmask = P;   // lane掩码
// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
    integer {m, srcwidth} = DecodeFP(SrcL);
    integer {n, srcwidth} = DecodeFP(SrcR);
    integer {d, dstwidth} = DecodeDst(RegDst); 

    if (pmask[laneid] == 1) {
        DataType srcT = SrcType;
        DataType dstT = DstType;

        bits(srcwidth) operand0 = V[m, srcwidth, laneid];
        bits(srcwidth) operand1 = V[n, srcwidth, laneid];
        bits(dstwidth) result;
        result[dstwidth/2-1, 0]        = FPConvert((srcT)operand0, dstT);
        result[dstwidth-1, dstwidth/2] = FPConvert((srcT)operand1, dstT);

        V[d, dstwidth, laneid] = result;
    }
    else {
        V[d, dstwidth, laneid] = 0;  // 无效lane中默认写0
    }
}

转换模式

  1. 单元素->单元素 转换示例:

    v.icvtf.u82e5m2 vt#1.ub, ->vt.b
    

  2. 双元素->双元素 转换示例:

    v.icvtf.u16x22bf16x2 vt#1.uw, ->vt.w
    

  3. 四元素->四元素 转换示例:

    v.icvtf.u8x42e5m2x4 vt#1.uw, ->vt.w
    

  4. 单元素 + 单元素 ->双元素 转换示例:

    v.icvtf.u162fp16x2 vt#1.uh, vt#2.uh, ->vt.w
    

  5. 双元素 + 双元素 ->四元素 转换示例:

    v.icvtf.u16x22e5m2x4 vt#1.uw, vt#1.uw, ->vt.w
    

注意事项

  • st与T表达的数据位宽必须保持一致,T表达输入的主格式,st表达具体格式。
  • dt与W表达的数据位宽必须保持一致。

备注

本指令属于超长指令扩展,可用于向量数据块或访存数据块中。