radeon/llvm: Fix lowering of vbuild

author Tom Stellard <thomas.stellard@amd.com>

Tue, 11 Sep 2012 19:24:32 +0000 (15:24 -0400)

committer Tom Stellard <thomas.stellard@amd.com>

Thu, 13 Sep 2012 14:38:02 +0000 (10:38 -0400)
author Tom Stellard <thomas.stellard@amd.com>
Tue, 11 Sep 2012 19:24:32 +0000 (15:24 -0400)
committer Tom Stellard <thomas.stellard@amd.com>
Thu, 13 Sep 2012 14:38:02 +0000 (10:38 -0400)
diff --git a/src/gallium/drivers/radeon/AMDGPUISelLowering.cpp b/src/gallium/drivers/radeon/AMDGPUISelLowering.cpp

index 0a70164fcbf73aff5d620e31d25a4942c0f4889d..59daf77503ec870fe71b781786909983abc99ef4 100644 (file)
--- a/src/gallium/drivers/radeon/AMDGPUISelLowering.cpp
+++ b/src/gallium/drivers/radeon/AMDGPUISelLowering.cpp
@@ -88,7 +88,6 @@ SDValue AMDGPUTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG)
    // AMDIL DAG lowering
    case ISD::SDIV: return LowerSDIV(Op, DAG);
    case ISD::SREM: return LowerSREM(Op, DAG);
-  case ISD::BUILD_VECTOR: return LowerBUILD_VECTOR(Op, DAG);
    case ISD::SIGN_EXTEND_INREG: return LowerSIGN_EXTEND_INREG(Op, DAG);
    case ISD::BRCOND: return LowerBRCOND(Op, DAG);
    // AMDGPU DAG lowering
@@ -336,7 +335,6 @@ const char* AMDGPUTargetLowering::getTargetNodeName(unsigned Opcode) const
    NODE_NAME_CASE(CALL);
    NODE_NAME_CASE(UMUL);
    NODE_NAME_CASE(DIV_INF);
-  NODE_NAME_CASE(VBUILD);
    NODE_NAME_CASE(RET_FLAG);
    NODE_NAME_CASE(BRANCH_COND);
  
diff --git a/src/gallium/drivers/radeon/AMDGPUISelLowering.h b/src/gallium/drivers/radeon/AMDGPUISelLowering.h

index 4c100da969033863d79003f58cd2a63b1114dee0..a6d2a50d11bb8938b0641e2f949bcbfd287d8336 100644 (file)
--- a/src/gallium/drivers/radeon/AMDGPUISelLowering.h
+++ b/src/gallium/drivers/radeon/AMDGPUISelLowering.h
@@ -90,7 +90,6 @@ private:
    SDValue LowerSDIV24(SDValue Op, SelectionDAG &DAG) const;
    SDValue LowerSDIV32(SDValue Op, SelectionDAG &DAG) const;
    SDValue LowerSDIV64(SDValue Op, SelectionDAG &DAG) const;
-  SDValue LowerBUILD_VECTOR(SDValue Op, SelectionDAG &DAG) const;
    SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;
    EVT genIntType(uint32_t size = 32, uint32_t numEle = 1) const;
    SDValue LowerBRCOND(SDValue Op, SelectionDAG &DAG) const;
@@ -105,7 +104,6 @@ enum
    // AMDIL ISD Opcodes
    FIRST_NUMBER = ISD::BUILTIN_OP_END,
    MAD,         // 32bit Fused Multiply Add instruction
-  VBUILD,      // scalar to vector mov instruction
    CALL,        // Function call based on a single integer
    UMUL,        // 32bit unsigned multiplication
    DIV_INF,      // Divide with infinity returned on zero divisor
diff --git a/src/gallium/drivers/radeon/AMDGPUInstructions.td b/src/gallium/drivers/radeon/AMDGPUInstructions.td

index 6f47445b07cd3aa1f2fd0f7897a654775334907a..3e850ebe184312905e72407991cbaae55063e8aa 100644 (file)
--- a/src/gallium/drivers/radeon/AMDGPUInstructions.td
+++ b/src/gallium/drivers/radeon/AMDGPUInstructions.td
@@ -154,9 +154,13 @@ class Insert_Element <ValueType elem_type, ValueType vec_type,
  >;
  
  // Vector Build pattern
-class Vector_Build <ValueType vecType, RegisterClass elemClass> : Pat <
-  (IL_vbuild elemClass:$src),
-  (INSERT_SUBREG (vecType (IMPLICIT_DEF)), elemClass:$src, sel_x)
+class Vector_Build <ValueType vecType, RegisterClass vectorClass,
+                    ValueType elemType, RegisterClass elemClass> : Pat <
+  (vecType (build_vector (elemType elemClass:$x), (elemType elemClass:$y),
+                         (elemType elemClass:$z), (elemType elemClass:$w))),
+  (INSERT_SUBREG (INSERT_SUBREG (INSERT_SUBREG (INSERT_SUBREG
+  (vecType (IMPLICIT_DEF)), elemClass:$x, sel_x), elemClass:$y, sel_y),
+                            elemClass:$z, sel_z), elemClass:$w, sel_w)
  >;
  
  // bitconvert pattern
diff --git a/src/gallium/drivers/radeon/AMDILISelLowering.cpp b/src/gallium/drivers/radeon/AMDILISelLowering.cpp

index 6983b40a780e7abe1ffa5d97fea01e06321ba62a..993025c3d47c33cd0a18a20ba85a41dcef0a37de 100644 (file)
--- a/src/gallium/drivers/radeon/AMDILISelLowering.cpp
+++ b/src/gallium/drivers/radeon/AMDILISelLowering.cpp
@@ -162,7 +162,6 @@ void AMDGPUTargetLowering::InitAMDILLowering()
    {
      MVT::SimpleValueType VT = (MVT::SimpleValueType)VectorTypes[ii];
  
-    setOperationAction(ISD::BUILD_VECTOR, VT, Custom);
      setOperationAction(ISD::VECTOR_SHUFFLE, VT, Expand);
      setOperationAction(ISD::SDIVREM, VT, Expand);
      setOperationAction(ISD::SMUL_LOHI, VT, Expand);
@@ -217,7 +216,6 @@ void AMDGPUTargetLowering::InitAMDILLowering()
    setOperationAction(ISD::BRIND, MVT::Other, Expand);
    setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::Other, Expand);
  
-  setOperationAction(ISD::BUILD_VECTOR, MVT::Other, Custom);
  
    // Use the default implementation.
    setOperationAction(ISD::ConstantFP        , MVT::f32    , Legal);
@@ -350,72 +348,6 @@ AMDGPUTargetLowering::LowerSREM(SDValue Op, SelectionDAG &DAG) const
    return DST;
  }
  
-SDValue
-AMDGPUTargetLowering::LowerBUILD_VECTOR( SDValue Op, SelectionDAG &DAG ) const
-{
-  EVT VT = Op.getValueType();
-  SDValue Nodes1;
-  SDValue second;
-  SDValue third;
-  SDValue fourth;
-  DebugLoc DL = Op.getDebugLoc();
-  Nodes1 = DAG.getNode(AMDGPUISD::VBUILD,
-      DL,
-      VT, Op.getOperand(0));
-#if 0
-  bool allEqual = true;
-  for (unsigned x = 1, y = Op.getNumOperands(); x < y; ++x) {
-    if (Op.getOperand(0) != Op.getOperand(x)) {
-      allEqual = false;
-      break;
-    }
-  }
-  if (allEqual) {
-    return Nodes1;
-  }
-#endif
-  switch(Op.getNumOperands()) {
-    default:
-    case 1:
-      break;
-    case 4:
-      fourth = Op.getOperand(3);
-      if (fourth.getOpcode() != ISD::UNDEF) {
-        Nodes1 = DAG.getNode(
-            ISD::INSERT_VECTOR_ELT,
-            DL,
-            Op.getValueType(),
-            Nodes1,
-            fourth,
-            DAG.getConstant(7, MVT::i32));
-      }
-    case 3:
-      third = Op.getOperand(2);
-      if (third.getOpcode() != ISD::UNDEF) {
-        Nodes1 = DAG.getNode(
-            ISD::INSERT_VECTOR_ELT,
-            DL,
-            Op.getValueType(),
-            Nodes1,
-            third,
-            DAG.getConstant(6, MVT::i32));
-      }
-    case 2:
-      second = Op.getOperand(1);
-      if (second.getOpcode() != ISD::UNDEF) {
-        Nodes1 = DAG.getNode(
-            ISD::INSERT_VECTOR_ELT,
-            DL,
-            Op.getValueType(),
-            Nodes1,
-            second,
-            DAG.getConstant(5, MVT::i32));
-      }
-      break;
-  };
-  return Nodes1;
-}
-
  SDValue
  AMDGPUTargetLowering::LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const
  {
diff --git a/src/gallium/drivers/radeon/AMDILInstrInfo.td b/src/gallium/drivers/radeon/AMDILInstrInfo.td

index 779566d4bf37a366e58249e6ba1482947d3e5a73..f8771afa180e6a4cfc2de5ec31f11c05590e14e7 100644 (file)
--- a/src/gallium/drivers/radeon/AMDILInstrInfo.td
+++ b/src/gallium/drivers/radeon/AMDILInstrInfo.td
@@ -124,12 +124,6 @@ def IL_mad          : SDNode<"AMDGPUISD::MAD", SDTIL_GenTernaryOp>;
  def IL_umul        : SDNode<"AMDGPUISD::UMUL"    , SDTIntBinOp,
      [SDNPCommutative, SDNPAssociative]>;
  
-//===----------------------------------------------------------------------===//
-// Vector functions
-//===----------------------------------------------------------------------===//
-def IL_vbuild     : SDNode<"AMDGPUISD::VBUILD", SDTIL_GenVecBuild,
-    []>;
-
  //===--------------------------------------------------------------------===//
  // Custom Pattern DAG Nodes
  //===--------------------------------------------------------------------===//
diff --git a/src/gallium/drivers/radeon/R600Instructions.td b/src/gallium/drivers/radeon/R600Instructions.td

index 7e2deac8b00dbf17cf8db3d65b6943e201f117b1..8d2f137434c202c0306b67dadf8c275dd340f3c9 100644 (file)
--- a/src/gallium/drivers/radeon/R600Instructions.td
+++ b/src/gallium/drivers/radeon/R600Instructions.td
@@ -1239,23 +1239,23 @@ def : Extract_Element <f32, v4f32, R600_Reg128, 1, sel_y>;
  def : Extract_Element <f32, v4f32, R600_Reg128, 2, sel_z>;
  def : Extract_Element <f32, v4f32, R600_Reg128, 3, sel_w>;
  
-def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 4, sel_x>;
-def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 5, sel_y>;
-def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 6, sel_z>;
-def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 7, sel_w>;
+def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 0, sel_x>;
+def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 1, sel_y>;
+def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 2, sel_z>;
+def : Insert_Element <f32, v4f32, R600_Reg32, R600_Reg128, 3, sel_w>;
  
  def : Extract_Element <i32, v4i32, R600_Reg128, 0, sel_x>;
  def : Extract_Element <i32, v4i32, R600_Reg128, 1, sel_y>;
  def : Extract_Element <i32, v4i32, R600_Reg128, 2, sel_z>;
  def : Extract_Element <i32, v4i32, R600_Reg128, 3, sel_w>;
  
-def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 4, sel_x>;
-def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 5, sel_y>;
-def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 6, sel_z>;
-def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 7, sel_w>;
+def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 0, sel_x>;
+def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 1, sel_y>;
+def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 2, sel_z>;
+def : Insert_Element <i32, v4i32, R600_Reg32, R600_Reg128, 3, sel_w>;
  
-def : Vector_Build <v4f32, R600_Reg32>;
-def : Vector_Build <v4i32, R600_Reg32>;
+def : Vector_Build <v4f32, R600_Reg128, f32, R600_Reg32>;
+def : Vector_Build <v4i32, R600_Reg128, i32, R600_Reg32>;
  
  // bitconvert patterns
  
diff --git a/src/gallium/drivers/radeon/SIInstructions.td b/src/gallium/drivers/radeon/SIInstructions.td

index 1f3b92de6b301b89fbd4a9ec0667560c33e4ac52..05665629428ac6f5d8422a3e86d5a485aa74acd4 100644 (file)
--- a/src/gallium/drivers/radeon/SIInstructions.td
+++ b/src/gallium/drivers/radeon/SIInstructions.td
@@ -1058,8 +1058,8 @@ def : Insert_Element <f32, v4f32, VReg_32, VReg_128, 5, sel_y>;
  def : Insert_Element <f32, v4f32, VReg_32, VReg_128, 6, sel_z>;
  def : Insert_Element <f32, v4f32, VReg_32, VReg_128, 7, sel_w>;
  
-def : Vector_Build <v4f32, VReg_32>;
-def : Vector_Build <v4i32, SReg_32>;
+def : Vector_Build <v4f32, VReg_128, f32, VReg_32>;
+def : Vector_Build <v4i32, SReg_128, i32, SReg_32>;
  
  def : BitConvert <i32, f32, SReg_32>;
  def : BitConvert <i32, f32, VReg_32>;
author	Tom Stellard <thomas.stellard@amd.com>
	Tue, 11 Sep 2012 19:24:32 +0000 (15:24 -0400)
committer	Tom Stellard <thomas.stellard@amd.com>
	Thu, 13 Sep 2012 14:38:02 +0000 (10:38 -0400)
src/gallium/drivers/radeon/AMDGPUISelLowering.cpp		patch \| blob \| history
src/gallium/drivers/radeon/AMDGPUISelLowering.h		patch \| blob \| history
src/gallium/drivers/radeon/AMDGPUInstructions.td		patch \| blob \| history
src/gallium/drivers/radeon/AMDILISelLowering.cpp		patch \| blob \| history
src/gallium/drivers/radeon/AMDILInstrInfo.td		patch \| blob \| history
src/gallium/drivers/radeon/R600Instructions.td		patch \| blob \| history
src/gallium/drivers/radeon/SIInstructions.td		patch \| blob \| history