V.FCVT¶
说明¶
浮点型之间转换(Floating-point Convert to each other)
把源寄存器中的浮点数从原类型转换为目标类型,并将结果写入目的寄存器中。
汇编语法¶
汇编符号¶
- st:表达源操作数的数据类型,编码于SrcType字段。
- dt:表达目的操作数的数据类型,编码于DstType字段。
- SrcL:左源寄存器,可以索引的寄存器类型请见向量指令介绍。
- SrcR:右源寄存器,可以索引的寄存器类型请见向量指令介绍。
- reuse:当源寄存器为向量寄存器时可增加本后缀,用于指示当前指令提交后本寄存器不允许被释放。如无此标识,则表示允许硬件释放本寄存器。
- T:指定操作数的数据类型,可选类型包括fb, fh, fs, fd等。
- ->:用于指示目的寄存器。
- RegDst: 目的寄存器,可以索引的寄存器类型请见向量指令介绍。
- W:目的寄存器的位宽标识,包括b,h,w,d等。
- rm(rounding mode):舍入模式的标记符。
- sat(saturation):支持饱和计算的标志。
编码格式¶
SrcType和DstType字段编码方式如下:
| 编码 | 原格式(SrcType) | 目标格式(DstType) | 编码 | 原格式(SrcType) | 目标格式(DstType) |
|---|---|---|---|---|---|
| 5'b00000 | fp64 | fp64 | 5'b10000 | fp16x2 | fp16x2 |
| 5'b00001 | fp32 | fp32 | 5'b10001 | bf16x2 | bf16x2 |
| 5'b00010 | tf32 | tf32 | 5'b10010 | e4m3x4 | e4m3x4 |
| 5'b00011 | hf32 | hf32 | 5'b10011 | e5m2x4 | e5m2x4 |
| 5'b00100 | fp16 | fp16 | 5'b10100 | e4m3x2 | e4m3x2 |
| 5'b00101 | bf16 | bf16 | 5'b10101 | e5m2x2 | e5m2x2 |
| 5'b00110 | hif8 | hif8 | 5'b10110 | e6m2x2 | e6m2x2 |
| 5'b00111 | e4m3 | e4m3 | 5'b10111 | reserve | reserve |
| 5'b01000 | e5m2 | e5m2 | 5'b11000 | reserve | reserve |
| 5'b01001 | e3m2 | e3m2 | 5'b11001 | reserve | reserve |
| 5'b01010 | e2m3 | e2m3 | 5'b11010 | reserve | reserve |
| 5'b01011 | e2m1x2 | e2m1x2 | 5'b11011 | reserve | reserve |
| 5'b01100 | e1m2x2 | e1m2x2 | 5'b11100 | reserve | reserve |
| 5'b01101 | hif4x2 | hif4x2 | 5'b11101 | reserve | reserve |
| 5'b01110 | e8m0 | e8m0 | 5'b11110 | reserve | reserve |
| 5'b01111 | e6m2 | e6m2 | 5'b11111 | reserve | reserve |
舍入模式rm字段编码:
| 编码 | 舍入模式 | 含义 |
|---|---|---|
| 0 | RNONE | No Rounding(不指定舍入模式,由硬件/实现决定默认行为)可缺省 |
| 1 | RNE | Round to Nearest, ties to Even(向最近偶数舍入;最常见) |
| 2 | RTZ | Round Toward Zero(向零舍入,截断小数部分) |
| 3 | RDN | Round Down(向负无穷舍入) |
| 4 | RUP | Round Up(向正无穷舍入) |
| 5 | RNA | Round to Nearest, ties Away from Zero(远离零) |
| 6 | RTO | Round to Odd(向最近奇数舍入) |
| 7 | RHB | Hybrid Rounding(混合舍入模式) |
| >7 | reserve | 保留 |
饱和计算sat位编码:
| sat | 含义 |
|---|---|
| 0 | 无饱和计算(默认) |
| 1 | 启用饱和计算 |
执行方式¶
- 解码源寄存器域:DecodeFP
- 解码输出参数:DecodeDst
- 通用寄存器读写:V[]
- 数据类型转换:FPConvert()
enum DataType {
FP64, FP32, TF32, HF32, FP16, BF16, HiF8, E4M3,
E5M2, E3M2, E2M3, E2M1x2, E1M2x2, HIF4x2, E8M0, E6M2,
FP16x2, BF16x2, E4M3x4, E5M2x4, E4M3x2, E5M2x2, E6M2x2
};
bits(64) pmask = P; // lane掩码
// lanenum表示当前Group内lane的数量
for (laneid = 0; laneid < lanenum; laneid++)
{
integer {m, srcwidth} = DecodeFP(SrcL);
integer {n, srcwidth} = DecodeFP(SrcR);
integer {d, dstwidth} = DecodeDst(RegDst);
if (pmask[laneid] == 1) {
DataType srcT = SrcType;
DataType dstT = DstType;
bits(srcwidth) operand0 = V[m, srcwidth, laneid];
bits(srcwidth) operand1 = V[n, srcwidth, laneid];
bits(dstwidth) result;
result[dstwidth/2-1, 0] = FPConvert((srcT)operand0, dstT);
result[dstwidth-1, dstwidth/2] = FPConvert((srcT)operand1, dstT);
V[d, dstwidth, laneid] = result;
}
else {
V[d, dstwidth, laneid] = 0; // 无效lane中默认写0
}
}
转换模式¶
-
单元素->单元素转换示例: -
双元素->双元素转换示例: -
四元素->四元素转换示例: -
单元素 + 单元素 ->双元素转换示例: -
双元素 + 双元素 ->四元素转换示例:
注意事项¶
- st与T表达的数据位宽必须保持一致,T表达输入的主格式,st表达具体格式。
- dt与W表达的数据位宽必须保持一致。
备注¶
本指令属于超长指令扩展,可用于向量数据块或访存数据块中。