跳转至

HL.CCAT

拼接(Concatenate)
左源操作数左移64位与右源操作数相加,然后循环左移 shamt 位后将结果的高64位写到第一个目的寄存器,低64位写到第二个目的寄存器。

汇编语法

    hl.ccat SrcL, SrcR, shamt, ->Dst0, Dst1

汇编符号

  • SrcL:左源寄存器,可以索引全局寄存器R0-R23和前序1-4条输出至T队列或U队列的指令结果。
  • SrcR:右源寄存器,可以索引全局寄存器R0-R23和前序1-4条输出至T队列或U队列的指令结果。
  • shamt:对操作数左移位数,范围[0, 127]。
  • ->:用于指示目的寄存器。
  • Dst0:第一个目的寄存器,可以索引块内T队列和U队列寄存器或者全局寄存器R1-R23。
  • Dst1:第二个目的寄存器,可以索引块内T队列和U队列寄存器或者全局寄存器R1-R23。

编码格式

  • 低16bit编码:

HL.CCAT

  • 高32bit编码:

HL.CCAT

执行方式

  • 转换为十进制数:UInt()
  • 通用寄存器读写:R[]
    integer d0 = UInt(RegDst0);
    integer d1 = UInt(RegDst1);
    integer m = UInt(SrcL);
    integer n = UInt(SrcR);
    integer shrt = 128 - shamt;

    bits(64) operand1 = R[m, 64];
    bits(64) operand2 = R[n, 64];

    bits(128) data = (operand1 << 64) | operand2;
    bits(128) result = (data << shamt) | (data >>(u) shrt);

    R[d0, 64] = result[127:64];
    R[d1, 64] = result[63:0];

shamt小于64:

concat1

shamt大于64:

concat2

汇编示例

当两个源寄存器相同,hl.ccat指令相当于对源操作数做了循环移位。

hl.ccat指令实现循环移位的方式如下:

  • 实现循环左移16位

    hl.ccat a0, a0, 16, ->t, u
    
    此时需将 shamt 设置为循环左移的位数。

  • 实现循环右移16位

    hl.ccat a0, a0, 48, ->t, u
    
    此时需将 shamt 设置为XLEN(即64)减去循环右移位数后的值。

汇编索引模式

输入输出可选组合如下:

输入组合 输出组合
a1, a2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
a1, t#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
a1, u#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
t#1, a2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
t#1, t#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
t#1, u#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
u#1, a2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
u#1, t#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4
u#1, u#2 t, t;t, u;t, a3;u, t;u, u;u, a3;a3, t;a3, u;a3, a4

注意事项

  • 如果两个目的寄存器相同,那么执行结果不可知(硬件决定保留哪个结果)。
  • 本指令允许只有一个目的寄存器,此时输出为第一个目的寄存器的结果。

备注

本指令属于增强指令扩展,且仅允许在标量块内使用