[AMDGPU] add s_incperflevel/s_decperflevel intrinsics.
authorValery Pykhtin <Valery.Pykhtin@amd.com>
Thu, 18 Aug 2016 18:06:20 +0000 (18:06 +0000)
committerValery Pykhtin <Valery.Pykhtin@amd.com>
Thu, 18 Aug 2016 18:06:20 +0000 (18:06 +0000)
Differential revision: https://reviews.llvm.org/D23666

llvm-svn: 279106

llvm/include/llvm/IR/IntrinsicsAMDGPU.td
llvm/lib/Target/AMDGPU/SIInstructions.td
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.decperflevel.ll [new file with mode: 0644]
llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.incperflevel.ll [new file with mode: 0644]

index d4cb8ff..f69da2d 100644 (file)
@@ -457,6 +457,16 @@ def int_amdgcn_s_sleep :
   Intrinsic<[], [llvm_i32_ty], []> {
 }
 
+def int_amdgcn_s_incperflevel :
+  GCCBuiltin<"__builtin_amdgcn_s_incperflevel">,
+  Intrinsic<[], [llvm_i32_ty], []> {
+}
+
+def int_amdgcn_s_decperflevel :
+  GCCBuiltin<"__builtin_amdgcn_s_decperflevel">,
+  Intrinsic<[], [llvm_i32_ty], []> {
+}
+
 def int_amdgcn_s_getreg :
   GCCBuiltin<"__builtin_amdgcn_s_getreg">,
   Intrinsic<[llvm_i32_ty], [llvm_i32_ty], [IntrReadMem]>;
index 1670396..15d161f 100644 (file)
@@ -515,8 +515,18 @@ def S_TRAP : SOPP <0x00000012, (ins i16imm:$simm16), "s_trap $simm16">;
 def S_ICACHE_INV : SOPP <0x00000013, (ins), "s_icache_inv"> {
        let simm16 = 0;
 }
-def S_INCPERFLEVEL : SOPP <0x00000014, (ins i16imm:$simm16), "s_incperflevel $simm16">;
-def S_DECPERFLEVEL : SOPP <0x00000015, (ins i16imm:$simm16), "s_decperflevel $simm16">;
+def S_INCPERFLEVEL : SOPP <0x00000014, (ins i32imm:$simm16), "s_incperflevel $simm16", 
+  [(int_amdgcn_s_incperflevel SIMM16bit:$simm16)]> {
+  let hasSideEffects = 1;
+  let mayLoad = 1;
+  let mayStore = 1;
+}
+def S_DECPERFLEVEL : SOPP <0x00000015, (ins i32imm:$simm16), "s_decperflevel $simm16",
+  [(int_amdgcn_s_decperflevel SIMM16bit:$simm16)]> {
+  let hasSideEffects = 1;
+  let mayLoad = 1;
+  let mayStore = 1;
+}
 def S_TTRACEDATA : SOPP <0x00000016, (ins), "s_ttracedata"> {
   let simm16 = 0;
 }
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.decperflevel.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.decperflevel.ll
new file mode 100644 (file)
index 0000000..72513fc
--- /dev/null
@@ -0,0 +1,43 @@
+; RUN: llc -march=amdgcn -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
+; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
+
+declare void @llvm.amdgcn.s.decperflevel(i32) #0
+
+; GCN-LABEL: {{^}}test_s_decperflevel:
+; GCN: s_decperflevel 0{{$}}
+; GCN: s_decperflevel 1{{$}}
+; GCN: s_decperflevel 2{{$}}
+; GCN: s_decperflevel 3{{$}}
+; GCN: s_decperflevel 4{{$}}
+; GCN: s_decperflevel 5{{$}}
+; GCN: s_decperflevel 6{{$}}
+; GCN: s_decperflevel 7{{$}}
+; GCN: s_decperflevel 8{{$}}
+; GCN: s_decperflevel 9{{$}}
+; GCN: s_decperflevel 10{{$}}
+; GCN: s_decperflevel 11{{$}}
+; GCN: s_decperflevel 12{{$}}
+; GCN: s_decperflevel 13{{$}}
+; GCN: s_decperflevel 14{{$}}
+; GCN: s_decperflevel 15{{$}}
+define void @test_s_decperflevel(i32 %x) #0 {
+  call void @llvm.amdgcn.s.decperflevel(i32 0)
+  call void @llvm.amdgcn.s.decperflevel(i32 1)
+  call void @llvm.amdgcn.s.decperflevel(i32 2)
+  call void @llvm.amdgcn.s.decperflevel(i32 3)
+  call void @llvm.amdgcn.s.decperflevel(i32 4)
+  call void @llvm.amdgcn.s.decperflevel(i32 5)
+  call void @llvm.amdgcn.s.decperflevel(i32 6)
+  call void @llvm.amdgcn.s.decperflevel(i32 7)
+  call void @llvm.amdgcn.s.decperflevel(i32 8)
+  call void @llvm.amdgcn.s.decperflevel(i32 9)
+  call void @llvm.amdgcn.s.decperflevel(i32 10)
+  call void @llvm.amdgcn.s.decperflevel(i32 11)
+  call void @llvm.amdgcn.s.decperflevel(i32 12)
+  call void @llvm.amdgcn.s.decperflevel(i32 13)
+  call void @llvm.amdgcn.s.decperflevel(i32 14)
+  call void @llvm.amdgcn.s.decperflevel(i32 15)
+  ret void
+}
+
+attributes #0 = { nounwind }
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.incperflevel.ll b/llvm/test/CodeGen/AMDGPU/llvm.amdgcn.s.incperflevel.ll
new file mode 100644 (file)
index 0000000..2ae4fc4
--- /dev/null
@@ -0,0 +1,43 @@
+; RUN: llc -march=amdgcn -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
+; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s | FileCheck -check-prefix=GCN %s
+
+declare void @llvm.amdgcn.s.incperflevel(i32) #0
+
+; GCN-LABEL: {{^}}test_s_incperflevel:
+; GCN: s_incperflevel 0{{$}}
+; GCN: s_incperflevel 1{{$}}
+; GCN: s_incperflevel 2{{$}}
+; GCN: s_incperflevel 3{{$}}
+; GCN: s_incperflevel 4{{$}}
+; GCN: s_incperflevel 5{{$}}
+; GCN: s_incperflevel 6{{$}}
+; GCN: s_incperflevel 7{{$}}
+; GCN: s_incperflevel 8{{$}}
+; GCN: s_incperflevel 9{{$}}
+; GCN: s_incperflevel 10{{$}}
+; GCN: s_incperflevel 11{{$}}
+; GCN: s_incperflevel 12{{$}}
+; GCN: s_incperflevel 13{{$}}
+; GCN: s_incperflevel 14{{$}}
+; GCN: s_incperflevel 15{{$}}
+define void @test_s_incperflevel(i32 %x) #0 {
+  call void @llvm.amdgcn.s.incperflevel(i32 0)
+  call void @llvm.amdgcn.s.incperflevel(i32 1)
+  call void @llvm.amdgcn.s.incperflevel(i32 2)
+  call void @llvm.amdgcn.s.incperflevel(i32 3)
+  call void @llvm.amdgcn.s.incperflevel(i32 4)
+  call void @llvm.amdgcn.s.incperflevel(i32 5)
+  call void @llvm.amdgcn.s.incperflevel(i32 6)
+  call void @llvm.amdgcn.s.incperflevel(i32 7)
+  call void @llvm.amdgcn.s.incperflevel(i32 8)
+  call void @llvm.amdgcn.s.incperflevel(i32 9)
+  call void @llvm.amdgcn.s.incperflevel(i32 10)
+  call void @llvm.amdgcn.s.incperflevel(i32 11)
+  call void @llvm.amdgcn.s.incperflevel(i32 12)
+  call void @llvm.amdgcn.s.incperflevel(i32 13)
+  call void @llvm.amdgcn.s.incperflevel(i32 14)
+  call void @llvm.amdgcn.s.incperflevel(i32 15)
+  ret void
+}
+
+attributes #0 = { nounwind }