doxygen/AMDGPURegBankLegalizeRules_8cpp_source.html

//===-- AMDGPURegBankLegalizeRules.cpp ------------------------------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

/// Definitions of RegBankLegalize Rules for all opcodes.

/// Implementation of container for all the Rules and search.

/// Fast search for most common case when Rule.Predicate checks LLT and

/// uniformity of register in operand 0.

//

//===----------------------------------------------------------------------===//


#include "AMDGPURegBankLegalizeRules.h"

#include "AMDGPUInstrInfo.h"

#include "GCNSubtarget.h"

#include "llvm/CodeGen/GlobalISel/GenericMachineInstrs.h"

#include "llvm/CodeGen/MachineUniformityAnalysis.h"

#include "llvm/IR/IntrinsicsAMDGPU.h"

#include "llvm/Support/AMDGPUAddrSpace.h"


#define DEBUG_TYPE "amdgpu-regbanklegalize"


using namespace llvm;

using namespace AMDGPU;


bool AMDGPU::isAnyPtr(LLT Ty, unsigned Width) {

  return Ty.isPointer() && Ty.getSizeInBits() == Width;

}


RegBankLLTMapping::RegBankLLTMapping(

    std::initializer_list<RegBankLLTMappingApplyID> DstOpMappingList,

    std::initializer_list<RegBankLLTMappingApplyID> SrcOpMappingList,

    LoweringMethodID LoweringMethod)

    : DstOpMapping(DstOpMappingList), SrcOpMapping(SrcOpMappingList),

      LoweringMethod(LoweringMethod) {}


PredicateMapping::PredicateMapping(

    std::initializer_list<UniformityLLTOpPredicateID> OpList,

    std::function<bool(const MachineInstr &)> TestFunc)

    : OpUniformityAndTypes(OpList), TestFunc(TestFunc) {}


bool matchUniformityAndLLT(Register Reg, UniformityLLTOpPredicateID UniID,

                           const MachineUniformityInfo &MUI,

                           const MachineRegisterInfo &MRI) {

  switch (UniID) {

  case S1:

    return MRI.getType(Reg) == LLT::scalar(1);

  case S16:

    return MRI.getType(Reg) == LLT::scalar(16);

  case S32:

    return MRI.getType(Reg) == LLT::scalar(32);

  case S64:

    return MRI.getType(Reg) == LLT::scalar(64);

  case S128:

    return MRI.getType(Reg) == LLT::scalar(128);

  case P0:

    return MRI.getType(Reg) == LLT::pointer(0, 64);

  case P1:

    return MRI.getType(Reg) == LLT::pointer(1, 64);

  case P3:

    return MRI.getType(Reg) == LLT::pointer(3, 32);

  case P4:

    return MRI.getType(Reg) == LLT::pointer(4, 64);

  case P5:

    return MRI.getType(Reg) == LLT::pointer(5, 32);

  case Ptr32:

    return isAnyPtr(MRI.getType(Reg), 32);

  case Ptr64:

    return isAnyPtr(MRI.getType(Reg), 64);

  case Ptr128:

    return isAnyPtr(MRI.getType(Reg), 128);

  case V2S32:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 32);

  case V4S32:

    return MRI.getType(Reg) == LLT::fixed_vector(4, 32);

  case B32:

    return MRI.getType(Reg).getSizeInBits() == 32;

  case B64:

    return MRI.getType(Reg).getSizeInBits() == 64;

  case B96:

    return MRI.getType(Reg).getSizeInBits() == 96;

  case B128:

    return MRI.getType(Reg).getSizeInBits() == 128;

  case B256:

    return MRI.getType(Reg).getSizeInBits() == 256;

  case B512:

    return MRI.getType(Reg).getSizeInBits() == 512;

  case UniS1:

    return MRI.getType(Reg) == LLT::scalar(1) && MUI.isUniform(Reg);

  case UniS16:

    return MRI.getType(Reg) == LLT::scalar(16) && MUI.isUniform(Reg);

  case UniS32:

    return MRI.getType(Reg) == LLT::scalar(32) && MUI.isUniform(Reg);

  case UniS64:

    return MRI.getType(Reg) == LLT::scalar(64) && MUI.isUniform(Reg);

  case UniS128:

    return MRI.getType(Reg) == LLT::scalar(128) && MUI.isUniform(Reg);

  case UniP0:

    return MRI.getType(Reg) == LLT::pointer(0, 64) && MUI.isUniform(Reg);

  case UniP1:

    return MRI.getType(Reg) == LLT::pointer(1, 64) && MUI.isUniform(Reg);

  case UniP3:

    return MRI.getType(Reg) == LLT::pointer(3, 32) && MUI.isUniform(Reg);

  case UniP4:

    return MRI.getType(Reg) == LLT::pointer(4, 64) && MUI.isUniform(Reg);

  case UniP5:

    return MRI.getType(Reg) == LLT::pointer(5, 32) && MUI.isUniform(Reg);

  case UniPtr32:

    return isAnyPtr(MRI.getType(Reg), 32) && MUI.isUniform(Reg);

  case UniPtr64:

    return isAnyPtr(MRI.getType(Reg), 64) && MUI.isUniform(Reg);

  case UniPtr128:

    return isAnyPtr(MRI.getType(Reg), 128) && MUI.isUniform(Reg);

  case UniV2S16:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 16) && MUI.isUniform(Reg);

  case UniB32:

    return MRI.getType(Reg).getSizeInBits() == 32 && MUI.isUniform(Reg);

  case UniB64:

    return MRI.getType(Reg).getSizeInBits() == 64 && MUI.isUniform(Reg);

  case UniB96:

    return MRI.getType(Reg).getSizeInBits() == 96 && MUI.isUniform(Reg);

  case UniB128:

    return MRI.getType(Reg).getSizeInBits() == 128 && MUI.isUniform(Reg);

  case UniB256:

    return MRI.getType(Reg).getSizeInBits() == 256 && MUI.isUniform(Reg);

  case UniB512:

    return MRI.getType(Reg).getSizeInBits() == 512 && MUI.isUniform(Reg);

  case DivS1:

    return MRI.getType(Reg) == LLT::scalar(1) && MUI.isDivergent(Reg);

  case DivS16:

    return MRI.getType(Reg) == LLT::scalar(16) && MUI.isDivergent(Reg);

  case DivS32:

    return MRI.getType(Reg) == LLT::scalar(32) && MUI.isDivergent(Reg);

  case DivS64:

    return MRI.getType(Reg) == LLT::scalar(64) && MUI.isDivergent(Reg);

  case DivS128:

    return MRI.getType(Reg) == LLT::scalar(128) && MUI.isDivergent(Reg);

  case DivP0:

    return MRI.getType(Reg) == LLT::pointer(0, 64) && MUI.isDivergent(Reg);

  case DivP1:

    return MRI.getType(Reg) == LLT::pointer(1, 64) && MUI.isDivergent(Reg);

  case DivP3:

    return MRI.getType(Reg) == LLT::pointer(3, 32) && MUI.isDivergent(Reg);

  case DivP4:

    return MRI.getType(Reg) == LLT::pointer(4, 64) && MUI.isDivergent(Reg);

  case DivP5:

    return MRI.getType(Reg) == LLT::pointer(5, 32) && MUI.isDivergent(Reg);

  case DivPtr32:

    return isAnyPtr(MRI.getType(Reg), 32) && MUI.isDivergent(Reg);

  case DivPtr64:

    return isAnyPtr(MRI.getType(Reg), 64) && MUI.isDivergent(Reg);

  case DivPtr128:

    return isAnyPtr(MRI.getType(Reg), 128) && MUI.isDivergent(Reg);

  case DivV2S16:

    return MRI.getType(Reg) == LLT::fixed_vector(2, 16) && MUI.isDivergent(Reg);

  case DivB32:

    return MRI.getType(Reg).getSizeInBits() == 32 && MUI.isDivergent(Reg);

  case DivB64:

    return MRI.getType(Reg).getSizeInBits() == 64 && MUI.isDivergent(Reg);

  case DivB96:

    return MRI.getType(Reg).getSizeInBits() == 96 && MUI.isDivergent(Reg);

  case DivB128:

    return MRI.getType(Reg).getSizeInBits() == 128 && MUI.isDivergent(Reg);

  case DivB256:

    return MRI.getType(Reg).getSizeInBits() == 256 && MUI.isDivergent(Reg);

  case DivB512:

    return MRI.getType(Reg).getSizeInBits() == 512 && MUI.isDivergent(Reg);

  case _:

    return true;

  default:

    llvm_unreachable("missing matchUniformityAndLLT");

  }

}


bool PredicateMapping::match(const MachineInstr &MI,

                             const MachineUniformityInfo &MUI,

                             const MachineRegisterInfo &MRI) const {

  // Check LLT signature.

  for (unsigned i = 0; i < OpUniformityAndTypes.size(); ++i) {

    if (OpUniformityAndTypes[i] == _) {

      if (MI.getOperand(i).isReg())

        return false;

      continue;

    }


    // Remaining IDs check registers.

    if (!MI.getOperand(i).isReg())

      return false;


    if (!matchUniformityAndLLT(MI.getOperand(i).getReg(),

                               OpUniformityAndTypes[i], MUI, MRI))

      return false;

  }


  // More complex check.

  if (TestFunc)

    return TestFunc(MI);


  return true;

}


SetOfRulesForOpcode::SetOfRulesForOpcode() {}


SetOfRulesForOpcode::SetOfRulesForOpcode(FastRulesTypes FastTypes)

    : FastTypes(FastTypes) {}


UniformityLLTOpPredicateID LLTToId(LLT Ty) {

  if (Ty == LLT::scalar(16))

    return S16;

  if (Ty == LLT::scalar(32))

    return S32;

  if (Ty == LLT::scalar(64))

    return S64;

  if (Ty == LLT::fixed_vector(2, 16))

    return V2S16;

  if (Ty == LLT::fixed_vector(2, 32))

    return V2S32;

  if (Ty == LLT::fixed_vector(3, 32))

    return V3S32;

  if (Ty == LLT::fixed_vector(4, 32))

    return V4S32;

  return _;

}


UniformityLLTOpPredicateID LLTToBId(LLT Ty) {

  if (Ty == LLT::scalar(32) || Ty == LLT::fixed_vector(2, 16) ||

      isAnyPtr(Ty, 32))

    return B32;

  if (Ty == LLT::scalar(64) || Ty == LLT::fixed_vector(2, 32) ||

      Ty == LLT::fixed_vector(4, 16) || isAnyPtr(Ty, 64))

    return B64;

  if (Ty == LLT::fixed_vector(3, 32))

    return B96;

  if (Ty == LLT::fixed_vector(4, 32) || isAnyPtr(Ty, 128))

    return B128;

  return _;

}


const RegBankLLTMapping &


SetOfRulesForOpcode::findMappingForMI(const MachineInstr &MI,

                                      const MachineRegisterInfo &MRI,

                                      const MachineUniformityInfo &MUI) const {

  // Search in "Fast Rules".

  // Note: if fast rules are enabled, RegBankLLTMapping must be added in each

  // slot that could "match fast Predicate". If not, InvalidMapping is

  // returned which results in failure, does not search "Slow Rules".

  if (FastTypes != NoFastRules) {

    Register Reg = MI.getOperand(0).getReg();

    int Slot;

    if (FastTypes == StandardB)

      Slot = getFastPredicateSlot(LLTToBId(MRI.getType(Reg)));

    else

      Slot = getFastPredicateSlot(LLTToId(MRI.getType(Reg)));


    if (Slot != -1)

      return MUI.isUniform(Reg) ? Uni[Slot] : Div[Slot];

  }


  // Slow search for more complex rules.

  for (const RegBankLegalizeRule &Rule : Rules) {

    if (Rule.Predicate.match(MI, MUI, MRI))

      return Rule.OperandMapping;

  }


  LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

  llvm_unreachable("None of the rules defined for MI's opcode matched MI");

}


void SetOfRulesForOpcode::addRule(RegBankLegalizeRule Rule) {

  Rules.push_back(Rule);

}


void SetOfRulesForOpcode::addFastRuleDivergent(UniformityLLTOpPredicateID Ty,

                                               RegBankLLTMapping RuleApplyIDs) {

  int Slot = getFastPredicateSlot(Ty);

  assert(Slot != -1 && "Ty unsupported in this FastRulesTypes");

  Div[Slot] = RuleApplyIDs;

}


void SetOfRulesForOpcode::addFastRuleUniform(UniformityLLTOpPredicateID Ty,

                                             RegBankLLTMapping RuleApplyIDs) {

  int Slot = getFastPredicateSlot(Ty);

  assert(Slot != -1 && "Ty unsupported in this FastRulesTypes");

  Uni[Slot] = RuleApplyIDs;

}


int SetOfRulesForOpcode::getFastPredicateSlot(

    UniformityLLTOpPredicateID Ty) const {

  switch (FastTypes) {

  case Standard: {

    switch (Ty) {

    case S32:

      return 0;

    case S16:

      return 1;

    case S64:

      return 2;

    case V2S16:

      return 3;

    default:

      return -1;

    }

  }

  case StandardB: {

    switch (Ty) {

    case B32:

      return 0;

    case B64:

      return 1;

    case B96:

      return 2;

    case B128:

      return 3;

    default:

      return -1;

    }

  }

  case Vector: {

    switch (Ty) {

    case S32:

      return 0;

    case V2S32:

      return 1;

    case V3S32:

      return 2;

    case V4S32:

      return 3;

    default:

      return -1;

    }

  }

  default:

    return -1;

  }

}


RegBankLegalizeRules::RuleSetInitializer

RegBankLegalizeRules::addRulesForGOpcs(std::initializer_list<unsigned> OpcList,

                                       FastRulesTypes FastTypes) {

  return RuleSetInitializer(OpcList, GRulesAlias, GRules, FastTypes);

}


RegBankLegalizeRules::RuleSetInitializer

RegBankLegalizeRules::addRulesForIOpcs(std::initializer_list<unsigned> OpcList,

                                       FastRulesTypes FastTypes) {

  return RuleSetInitializer(OpcList, IRulesAlias, IRules, FastTypes);

}


const SetOfRulesForOpcode &


RegBankLegalizeRules::getRulesForOpc(MachineInstr &MI) const {

  unsigned Opc = MI.getOpcode();

  if (Opc == AMDGPU::G_INTRINSIC || Opc == AMDGPU::G_INTRINSIC_CONVERGENT ||

      Opc == AMDGPU::G_INTRINSIC_W_SIDE_EFFECTS ||

      Opc == AMDGPU::G_INTRINSIC_CONVERGENT_W_SIDE_EFFECTS) {

    unsigned IntrID = cast<GIntrinsic>(MI).getIntrinsicID();

    auto IRAIt = IRulesAlias.find(IntrID);

    if (IRAIt == IRulesAlias.end()) {

      LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

      llvm_unreachable("No rules defined for intrinsic opcode");

    }

    return IRules.at(IRAIt->second);

  }


  auto GRAIt = GRulesAlias.find(Opc);

  if (GRAIt == GRulesAlias.end()) {

    LLVM_DEBUG(dbgs() << "MI: "; MI.dump(););

    llvm_unreachable("No rules defined for generic opcode");

  }

  return GRules.at(GRAIt->second);

}


// Syntactic sugar wrapper for predicate lambda that enables '&&', '||' and '!'.


class Predicate {

private:

  struct Elt {

    // Save formula composed of Pred, '&&', '||' and '!' as a jump table.

    // Sink ! to Pred. For example !((A && !B) || C) -> (!A || B) && !C

    // Sequences of && and || will be represented by jumps, for example:

    // (A && B && ... X) or (A && B && ... X) || Y

    //   A == true jump to B

    //   A == false jump to end or Y, result is A(false) or Y

    // (A || B || ... X) or (A || B || ... X) && Y

    //   A == true jump to end or Y, result is A(true) or Y

    //   A == false jump to B

    // Notice that when negating expression, we simply flip Neg on each Pred

    // and swap TJumpOffset and FJumpOffset (&& becomes ||, || becomes &&).

    std::function<bool(const MachineInstr &)> Pred;

    bool Neg; // Neg of Pred is calculated before jump

    unsigned TJumpOffset;

    unsigned FJumpOffset;

  };


  SmallVector<Elt, 8> Expression;


  Predicate(SmallVectorImpl<Elt> &&Expr) { Expression.swap(Expr); };


public:


  Predicate(std::function<bool(const MachineInstr &)> Pred) {

    Expression.push_back({Pred, false, 1, 1});

  };


  bool operator()(const MachineInstr &MI) const {

    unsigned Idx = 0;

    unsigned ResultIdx = Expression.size();

    bool Result;

    do {

      Result = Expression[Idx].Pred(MI);

      Result = Expression[Idx].Neg ? !Result : Result;

      if (Result) {

        Idx += Expression[Idx].TJumpOffset;

      } else {

        Idx += Expression[Idx].FJumpOffset;

      }

    } while ((Idx != ResultIdx));


    return Result;

  };


  Predicate operator!() const {

    SmallVector<Elt, 8> NegExpression;

    for (const Elt &ExprElt : Expression) {

      NegExpression.push_back({ExprElt.Pred, !ExprElt.Neg, ExprElt.FJumpOffset,

                               ExprElt.TJumpOffset});

    }

    return Predicate(std::move(NegExpression));

  };


  Predicate operator&&(const Predicate &RHS) const {

    SmallVector<Elt, 8> AndExpression = Expression;


    unsigned RHSSize = RHS.Expression.size();

    unsigned ResultIdx = Expression.size();

    for (unsigned i = 0; i < ResultIdx; ++i) {

      // LHS results in false, whole expression results in false.

      if (i + AndExpression[i].FJumpOffset == ResultIdx)

        AndExpression[i].FJumpOffset += RHSSize;

    }


    AndExpression.append(RHS.Expression);


    return Predicate(std::move(AndExpression));

  }


  Predicate operator||(const Predicate &RHS) const {

    SmallVector<Elt, 8> OrExpression = Expression;


    unsigned RHSSize = RHS.Expression.size();

    unsigned ResultIdx = Expression.size();

    for (unsigned i = 0; i < ResultIdx; ++i) {

      // LHS results in true, whole expression results in true.

      if (i + OrExpression[i].TJumpOffset == ResultIdx)

        OrExpression[i].TJumpOffset += RHSSize;

    }


    OrExpression.append(RHS.Expression);


    return Predicate(std::move(OrExpression));

  }


};


// Initialize rules


RegBankLegalizeRules::RegBankLegalizeRules(const GCNSubtarget &_ST,

                                           MachineRegisterInfo &_MRI)

    : ST(&_ST), MRI(&_MRI) {


  addRulesForGOpcs({G_ADD, G_SUB}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32AExt, Sgpr32AExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_MUL}, Standard).Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_XOR, G_OR, G_AND}, StandardB)

      .Any({{UniS1}, {{Sgpr32Trunc}, {Sgpr32AExt, Sgpr32AExt}}})

      .Any({{DivS1}, {{Vcc}, {Vcc, Vcc}}})

      .Any({{UniS16}, {{Sgpr16}, {Sgpr16, Sgpr16}}})

      .Any({{DivS16}, {{Vgpr16}, {Vgpr16, Vgpr16}}})

      .Uni(B32, {{SgprB32}, {SgprB32, SgprB32}})

      .Div(B32, {{VgprB32}, {VgprB32, VgprB32}})

      .Uni(B64, {{SgprB64}, {SgprB64, SgprB64}})

      .Div(B64, {{VgprB64}, {VgprB64, VgprB64}, SplitTo32});


  addRulesForGOpcs({G_SHL}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32AExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_LSHR}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32ZExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_ASHR}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32SExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackBitShift})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32}});


  addRulesForGOpcs({G_FRAME_INDEX}).Any({{UniP5, _}, {{SgprP5}, {None}}});


  addRulesForGOpcs({G_UBFX, G_SBFX}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32, Sgpr32}, S_BFE})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32, Vgpr32}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Sgpr32, Sgpr32}, S_BFE})

      .Div(S64, {{Vgpr64}, {Vgpr64, Vgpr32, Vgpr32}, V_BFE});


  addRulesForGOpcs({G_SMIN, G_SMAX}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32SExt, Sgpr32SExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackMinMax})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}});


  addRulesForGOpcs({G_UMIN, G_UMAX}, Standard)

      .Uni(S16, {{Sgpr32Trunc}, {Sgpr32ZExt, Sgpr32ZExt}})

      .Div(S16, {{Vgpr16}, {Vgpr16, Vgpr16}})

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}})

      .Uni(V2S16, {{SgprV2S16}, {SgprV2S16, SgprV2S16}, UnpackMinMax})

      .Div(V2S16, {{VgprV2S16}, {VgprV2S16, VgprV2S16}});


  // Note: we only write S1 rules for G_IMPLICIT_DEF, G_CONSTANT, G_FCONSTANT

  // and G_FREEZE here, rest is trivially regbankselected earlier

  addRulesForGOpcs({G_IMPLICIT_DEF}).Any({{UniS1}, {{Sgpr32Trunc}, {}}});

  addRulesForGOpcs({G_CONSTANT})

      .Any({{UniS1, _}, {{Sgpr32Trunc}, {None}, UniCstExt}});

  addRulesForGOpcs({G_FREEZE}).Any({{DivS1}, {{Vcc}, {Vcc}}});


  addRulesForGOpcs({G_ICMP})

      .Any({{UniS1, _, S32}, {{Sgpr32Trunc}, {None, Sgpr32, Sgpr32}}})

      .Any({{DivS1, _, S32}, {{Vcc}, {None, Vgpr32, Vgpr32}}})

      .Any({{DivS1, _, S64}, {{Vcc}, {None, Vgpr64, Vgpr64}}});


  addRulesForGOpcs({G_FCMP})

      .Any({{UniS1, _, S32}, {{UniInVcc}, {None, Vgpr32, Vgpr32}}})

      .Any({{DivS1, _, S32}, {{Vcc}, {None, Vgpr32, Vgpr32}}});


  addRulesForGOpcs({G_BRCOND})

      .Any({{UniS1}, {{}, {Sgpr32AExtBoolInReg}}})

      .Any({{DivS1}, {{}, {Vcc}}});


  addRulesForGOpcs({G_BR}).Any({{_}, {{}, {None}}});


  addRulesForGOpcs({G_SELECT}, StandardB)

      .Any({{DivS16}, {{Vgpr16}, {Vcc, Vgpr16, Vgpr16}}})

      .Any({{UniS16}, {{Sgpr16}, {Sgpr32AExtBoolInReg, Sgpr16, Sgpr16}}})

      .Div(B32, {{VgprB32}, {Vcc, VgprB32, VgprB32}})

      .Uni(B32, {{SgprB32}, {Sgpr32AExtBoolInReg, SgprB32, SgprB32}})

      .Div(B64, {{VgprB64}, {Vcc, VgprB64, VgprB64}, SplitTo32Select})

      .Uni(B64, {{SgprB64}, {Sgpr32AExtBoolInReg, SgprB64, SgprB64}});


  addRulesForGOpcs({G_ANYEXT})

      .Any({{UniS16, S1}, {{None}, {None}}}) // should be combined away

      .Any({{UniS32, S1}, {{None}, {None}}}) // should be combined away

      .Any({{UniS64, S1}, {{None}, {None}}}) // should be combined away

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  // In global-isel G_TRUNC in-reg is treated as no-op, inst selected into COPY.

  // It is up to user to deal with truncated bits.

  addRulesForGOpcs({G_TRUNC})

      .Any({{UniS1, UniS16}, {{None}, {None}}}) // should be combined away

      .Any({{UniS1, UniS32}, {{None}, {None}}}) // should be combined away

      .Any({{UniS1, UniS64}, {{None}, {None}}}) // should be combined away

      .Any({{UniS16, S32}, {{Sgpr16}, {Sgpr32}}})

      .Any({{DivS16, S32}, {{Vgpr16}, {Vgpr32}}})

      .Any({{UniS32, S64}, {{Sgpr32}, {Sgpr64}}})

      .Any({{DivS32, S64}, {{Vgpr32}, {Vgpr64}}})

      .Any({{UniV2S16, V2S32}, {{SgprV2S16}, {SgprV2S32}}})

      .Any({{DivV2S16, V2S32}, {{VgprV2S16}, {VgprV2S32}}})

      // This is non-trivial. VgprToVccCopy is done using compare instruction.

      .Any({{DivS1, DivS16}, {{Vcc}, {Vgpr16}, VgprToVccCopy}})

      .Any({{DivS1, DivS32}, {{Vcc}, {Vgpr32}, VgprToVccCopy}})

      .Any({{DivS1, DivS64}, {{Vcc}, {Vgpr64}, VgprToVccCopy}});


  addRulesForGOpcs({G_ZEXT})

      .Any({{UniS16, S1}, {{Sgpr32Trunc}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS32, S1}, {{Sgpr32}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS64, S1}, {{Sgpr64}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      // not extending S16 to S32 is questionable.

      .Any({{UniS64, S16}, {{Sgpr64}, {Sgpr32ZExt}, Ext32To64}})

      .Any({{DivS64, S16}, {{Vgpr64}, {Vgpr32ZExt}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  addRulesForGOpcs({G_SEXT})

      .Any({{UniS16, S1}, {{Sgpr32Trunc}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS32, S1}, {{Sgpr32}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{UniS64, S1}, {{Sgpr64}, {Sgpr32AExtBoolInReg}, UniExtToSel}})

      .Any({{DivS16, S1}, {{Vgpr16}, {Vcc}, VccExtToSel}})

      .Any({{DivS32, S1}, {{Vgpr32}, {Vcc}, VccExtToSel}})

      .Any({{DivS64, S1}, {{Vgpr64}, {Vcc}, VccExtToSel}})

      .Any({{UniS64, S32}, {{Sgpr64}, {Sgpr32}, Ext32To64}})

      .Any({{DivS64, S32}, {{Vgpr64}, {Vgpr32}, Ext32To64}})

      // not extending S16 to S32 is questionable.

      .Any({{UniS64, S16}, {{Sgpr64}, {Sgpr32SExt}, Ext32To64}})

      .Any({{DivS64, S16}, {{Vgpr64}, {Vgpr32SExt}, Ext32To64}})

      .Any({{UniS32, S16}, {{Sgpr32}, {Sgpr16}}})

      .Any({{DivS32, S16}, {{Vgpr32}, {Vgpr16}}});


  addRulesForGOpcs({G_SEXT_INREG})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}})

      .Any({{DivS32, S32}, {{Vgpr32}, {Vgpr32}}})

      .Any({{UniS64, S64}, {{Sgpr64}, {Sgpr64}}})

      .Any({{DivS64, S64}, {{Vgpr64}, {Vgpr64}, SplitTo32SExtInReg}});


  addRulesForGOpcs({G_ASSERT_ZEXT, G_ASSERT_SEXT}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Imm}})

      .Div(S32, {{Vgpr32}, {Vgpr32, Imm}})

      .Uni(S64, {{Sgpr64}, {Sgpr64, Imm}})

      .Div(S64, {{Vgpr64}, {Vgpr64, Imm}});


  bool hasSMRDx3 = ST->hasScalarDwordx3Loads();

  bool hasSMRDSmall = ST->hasScalarSubwordLoads();

  bool usesTrue16 = ST->useRealTrue16Insts();


  Predicate isAlign16([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getAlign() >= Align(16);

  });


  Predicate isAlign4([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getAlign() >= Align(4);

  });


  Predicate isAtomicMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isAtomic();

  });


  Predicate isUniMMO([](const MachineInstr &MI) -> bool {

    return AMDGPU::isUniformMMO(*MI.memoperands_begin());

  });


  Predicate isConst([](const MachineInstr &MI) -> bool {

    // Address space in MMO be different then address space on pointer.

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    const unsigned AS = MMO->getAddrSpace();

    return AS == AMDGPUAS::CONSTANT_ADDRESS ||

           AS == AMDGPUAS::CONSTANT_ADDRESS_32BIT;

  });


  Predicate isVolatileMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isVolatile();

  });


  Predicate isInvMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->isInvariant();

  });


  Predicate isNoClobberMMO([](const MachineInstr &MI) -> bool {

    return (*MI.memoperands_begin())->getFlags() & MONoClobber;

  });


  Predicate isNaturalAligned([](const MachineInstr &MI) -> bool {

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    return MMO->getAlign() >= Align(MMO->getSize().getValue());

  });


  Predicate is8Or16BitMMO([](const MachineInstr &MI) -> bool {

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    const unsigned MemSize = 8 * MMO->getSize().getValue();

    return MemSize == 16 || MemSize == 8;

  });


  Predicate is32BitMMO([](const MachineInstr &MI) -> bool {

    const MachineMemOperand *MMO = *MI.memoperands_begin();

    return 8 * MMO->getSize().getValue() == 32;

  });


  auto isUL = !isAtomicMMO && isUniMMO && (isConst || !isVolatileMMO) &&

              (isConst || isInvMMO || isNoClobberMMO);


  // clang-format off

  // TODO: S32Dst, 16-bit any-extending load should not appear on True16 targets

  addRulesForGOpcs({G_LOAD})

      // flat, addrspace(0), never uniform - flat_load

      .Any({{DivS16, P0}, {{Vgpr16}, {VgprP0}}}, usesTrue16)

      .Any({{DivB32, P0}, {{VgprB32}, {VgprP0}}}) // 32-bit load, 8-bit and 16-bit any-extending load

      .Any({{DivB64, P0}, {{VgprB64}, {VgprP0}}})

      .Any({{DivB96, P0}, {{VgprB96}, {VgprP0}}})

      .Any({{DivB128, P0}, {{VgprB128}, {VgprP0}}})


       // global, addrspace(1)

       // divergent - global_load

      .Any({{DivS16, P1}, {{Vgpr16}, {VgprP1}}}, usesTrue16)

      .Any({{DivB32, P1}, {{VgprB32}, {VgprP1}}}) //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{DivB64, P1}, {{VgprB64}, {VgprP1}}})

      .Any({{DivB96, P1}, {{VgprB96}, {VgprP1}}})

      .Any({{DivB128, P1}, {{VgprB128}, {VgprP1}}})

      .Any({{DivB256, P1}, {{VgprB256}, {VgprP1}, SplitLoad}})

      .Any({{DivB512, P1}, {{VgprB512}, {VgprP1}, SplitLoad}})


       // uniform - s_load

      .Any({{{UniS16, P1}, isNaturalAligned && isUL}, {{Sgpr32Trunc}, {SgprP1}}}, usesTrue16 && hasSMRDSmall) // s16 load

      .Any({{{UniS16, P1}, isAlign4 && isUL}, {{Sgpr32Trunc}, {SgprP1}, WidenMMOToS32}}, usesTrue16 && !hasSMRDSmall) // s16 load to 32-bit load

      .Any({{{UniB32, P1}, isNaturalAligned && isUL}, {{SgprB32}, {SgprP1}}}, hasSMRDSmall) //32-bit load, 8-bit and 16-bit any-extending load

       // TODO: SplitLoad when !isNaturalAligned && isUL and target hasSMRDSmall

      .Any({{{UniB32, P1}, is8Or16BitMMO && isAlign4 && isUL}, {{SgprB32}, {SgprP1}, WidenMMOToS32}}, !hasSMRDSmall)  //8-bit and 16-bit any-extending load to 32-bit load

      .Any({{{UniB32, P1}, is32BitMMO && isAlign4 && isUL}, {{SgprB32}, {SgprP1}}}) //32-bit load

      .Any({{{UniB64, P1}, isAlign4 && isUL}, {{SgprB64}, {SgprP1}}})

      .Any({{{UniB96, P1}, isAlign16 && isUL}, {{SgprB96}, {SgprP1}, WidenLoad}}, !hasSMRDx3)

      .Any({{{UniB96, P1}, isAlign4 && !isAlign16 && isUL}, {{SgprB96}, {SgprP1}, SplitLoad}}, !hasSMRDx3)

      .Any({{{UniB96, P1}, isAlign4 && isUL}, {{SgprB96}, {SgprP1}}}, hasSMRDx3)

      .Any({{{UniB128, P1}, isAlign4 && isUL}, {{SgprB128}, {SgprP1}}})

      .Any({{{UniB256, P1}, isAlign4 && isUL}, {{SgprB256}, {SgprP1}}})

      .Any({{{UniB512, P1}, isAlign4 && isUL}, {{SgprB512}, {SgprP1}}})


      // Uniform via global or buffer load, for example volatile or non-aligned

      // uniform load. Not using standard {{UniInVgprTy}, {VgprP1}} since it is

      // selected as global_load, use SgprP1 for pointer instead to match

      // patterns without flat-for-global, default for GFX7 and older.

      // -> +flat-for-global + {{UniInVgprTy}, {SgprP1}} - global_load

      // -> -flat-for-global + {{UniInVgprTy}, {SgprP1}} - buffer_load

      .Any({{{UniS16, P1}, !isNaturalAligned || !isUL}, {{UniInVgprS16}, {SgprP1}}}, usesTrue16 && hasSMRDSmall) // s16 load

      .Any({{{UniS16, P1}, !isAlign4 || !isUL}, {{UniInVgprS16}, {SgprP1}}}, usesTrue16 && !hasSMRDSmall) // s16 load

      .Any({{{UniB32, P1}, !isNaturalAligned || !isUL}, {{UniInVgprB32}, {SgprP1}}}, hasSMRDSmall) //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{{UniB32, P1}, !isAlign4 || !isUL}, {{UniInVgprB32}, {SgprP1}}}, !hasSMRDSmall)  //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{{UniB64, P1}, !isAlign4 || !isUL}, {{UniInVgprB64}, {SgprP1}}})

      .Any({{{UniB96, P1}, !isAlign4 || !isUL}, {{UniInVgprB96}, {SgprP1}}})

      .Any({{{UniB128, P1}, !isAlign4 || !isUL}, {{UniInVgprB128}, {SgprP1}}})

      .Any({{{UniB256, P1}, !isAlign4 || !isUL}, {{UniInVgprB256}, {SgprP1}, SplitLoad}})

      .Any({{{UniB512, P1}, !isAlign4 || !isUL}, {{UniInVgprB512}, {SgprP1}, SplitLoad}})


      // local, addrspace(3) - ds_load

      .Any({{DivS16, P3}, {{Vgpr16}, {VgprP3}}}, usesTrue16)

      .Any({{DivB32, P3}, {{VgprB32}, {VgprP3}}}) // 32-bit load, 8-bit and 16-bit any-extending load

      .Any({{DivB64, P3}, {{VgprB64}, {VgprP3}}})

      .Any({{DivB96, P3}, {{VgprB96}, {VgprP3}}})

      .Any({{DivB128, P3}, {{VgprB128}, {VgprP3}}})


      .Any({{UniS16, P3}, {{UniInVgprS16}, {SgprP3}}}, usesTrue16) // 16-bit load

      .Any({{UniB32, P3}, {{UniInVgprB32}, {VgprP3}}}) // 32-bit load, 8-bit and 16-bit any-extending load

      .Any({{UniB64, P3}, {{UniInVgprB64}, {VgprP3}}})

      .Any({{UniB96, P3}, {{UniInVgprB96}, {VgprP3}}})

      .Any({{UniB128, P3}, {{UniInVgprB128}, {VgprP3}}})


      // constant, addrspace(4)

      // divergent - global_load

      .Any({{DivS16, P4}, {{Vgpr16}, {VgprP4}}}, usesTrue16)

      .Any({{DivB32, P4}, {{VgprB32}, {VgprP4}}}) //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{DivB64, P4}, {{VgprB64}, {VgprP4}}})

      .Any({{DivB96, P4}, {{VgprB96}, {VgprP4}}})

      .Any({{DivB128, P4}, {{VgprB128}, {VgprP4}}})

      .Any({{DivB256, P4}, {{VgprB256}, {VgprP4}, SplitLoad}})

      .Any({{DivB512, P4}, {{VgprB512}, {VgprP4}, SplitLoad}})


       // uniform - s_load

      .Any({{{UniS16, P4}, isNaturalAligned && isUL}, {{Sgpr32Trunc}, {SgprP4}}}, usesTrue16 && hasSMRDSmall) // s16 load

      .Any({{{UniS16, P4}, isAlign4 && isUL}, {{Sgpr32Trunc}, {SgprP4}, WidenMMOToS32}}, usesTrue16 && !hasSMRDSmall) // s16 load to 32-bit load

      .Any({{{UniB32, P4}, isNaturalAligned && isUL}, {{SgprB32}, {SgprP4}}}, hasSMRDSmall) //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{{UniB32, P4}, is8Or16BitMMO && isAlign4 && isUL}, {{SgprB32}, {SgprP4}, WidenMMOToS32}}, !hasSMRDSmall)  //8-bit and 16-bit any-extending load to 32-bit load

      .Any({{{UniB32, P4}, is32BitMMO && isAlign4 && isUL}, {{SgprB32}, {SgprP4}}}) //32-bit load

      .Any({{{UniB64, P4}, isAlign4 && isUL}, {{SgprB64}, {SgprP4}}})

      .Any({{{UniB96, P4}, isAlign16 && isUL}, {{SgprB96}, {SgprP4}, WidenLoad}}, !hasSMRDx3)

      .Any({{{UniB96, P4}, isAlign4 && !isAlign16 && isUL}, {{SgprB96}, {SgprP4}, SplitLoad}}, !hasSMRDx3)

      .Any({{{UniB96, P4}, isAlign4 && isUL}, {{SgprB96}, {SgprP4}}}, hasSMRDx3)

      .Any({{{UniB128, P4}, isAlign4 && isUL}, {{SgprB128}, {SgprP4}}})

      .Any({{{UniB256, P4}, isAlign4 && isUL}, {{SgprB256}, {SgprP4}}})

      .Any({{{UniB512, P4}, isAlign4 && isUL}, {{SgprB512}, {SgprP4}}})


      // uniform in vgpr - global_load or buffer_load

      .Any({{{UniS16, P4}, !isNaturalAligned || !isUL}, {{UniInVgprS16}, {SgprP4}}}, usesTrue16 && hasSMRDSmall) // s16 load

      .Any({{{UniS16, P4}, !isAlign4 || !isUL}, {{UniInVgprS16}, {SgprP4}}}, usesTrue16 && !hasSMRDSmall) // s16 load

      .Any({{{UniB32, P4}, !isNaturalAligned || !isUL}, {{UniInVgprB32}, {SgprP4}}}, hasSMRDSmall) //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{{UniB32, P4}, !isAlign4 || !isUL}, {{UniInVgprB32}, {SgprP4}}}, !hasSMRDSmall)  //32-bit load, 8-bit and 16-bit any-extending load

      .Any({{{UniB64, P4}, !isAlign4 || !isUL}, {{UniInVgprB64}, {SgprP4}}})

      .Any({{{UniB96, P4}, !isAlign4 || !isUL}, {{UniInVgprB96}, {SgprP4}}})

      .Any({{{UniB128, P4}, !isAlign4 || !isUL}, {{UniInVgprB128}, {SgprP4}}})

      .Any({{{UniB256, P4}, !isAlign4 || !isUL}, {{UniInVgprB256}, {SgprP4}, SplitLoad}})

      .Any({{{UniB512, P4}, !isAlign4 || !isUL}, {{UniInVgprB512}, {SgprP4}, SplitLoad}})


      // private, addrspace(5), never uniform - scratch_load

      .Any({{DivS16, P5}, {{Vgpr16}, {VgprP5}}}, usesTrue16)

      .Any({{DivB32, P5}, {{VgprB32}, {VgprP5}}}) // 32-bit load, 8-bit and 16-bit any-extending load

      .Any({{DivB64, P5}, {{VgprB64}, {VgprP5}}})

      .Any({{DivB96, P5}, {{VgprB96}, {VgprP5}}})

      .Any({{DivB128, P5}, {{VgprB128}, {VgprP5}}})


      .Any({{DivS32, Ptr128}, {{Vgpr32}, {VgprPtr128}}});


  addRulesForGOpcs({G_ZEXTLOAD, G_SEXTLOAD}) // i8 and i16 zeroextending loads

      .Any({{DivS32, P0}, {{Vgpr32}, {VgprP0}}})


      .Any({{DivS32, P1}, {{Vgpr32}, {VgprP1}}})

      .Any({{{UniS32, P1}, isAlign4 && isUL}, {{Sgpr32}, {SgprP1}, WidenMMOToS32}}, !hasSMRDSmall)

      .Any({{{UniS32, P1}, isNaturalAligned && isUL}, {{Sgpr32}, {SgprP1}}}, hasSMRDSmall)

      .Any({{{UniS32, P1}, !isAlign4 || !isUL}, {{UniInVgprS32}, {SgprP1}}}, !hasSMRDSmall)

      .Any({{{UniS32, P1}, !isNaturalAligned || !isUL}, {{UniInVgprS32}, {SgprP1}}}, hasSMRDSmall)


      .Any({{DivS32, P3}, {{Vgpr32}, {VgprP3}}})

      .Any({{UniS32, P3}, {{UniInVgprS32}, {VgprP3}}})


      .Any({{DivS32, P4}, {{Vgpr32}, {VgprP4}}})

      .Any({{{UniS32, P4}, isAlign4 && isUL}, {{Sgpr32}, {SgprP4}, WidenMMOToS32}}, !hasSMRDSmall)

      .Any({{{UniS32, P4}, isNaturalAligned && isUL}, {{Sgpr32}, {SgprP4}}}, hasSMRDSmall)

      .Any({{{UniS32, P4}, !isAlign4 || !isUL}, {{UniInVgprS32}, {SgprP4}}}, !hasSMRDSmall)

      .Any({{{UniS32, P4}, !isNaturalAligned || !isUL}, {{UniInVgprS32}, {SgprP4}}}, hasSMRDSmall)


      .Any({{DivS32, P5}, {{Vgpr32}, {VgprP5}}});


  addRulesForGOpcs({G_STORE})

      // addrspace(0)

      .Any({{S16, P0}, {{}, {Vgpr16, VgprP0}}}, usesTrue16) // 16-bit store

      .Any({{B32, P0}, {{}, {VgprB32, VgprP0}}}) // 32-bit store, 8-bit and 16-bit truncating store

      .Any({{B64, P0}, {{}, {VgprB64, VgprP0}}})

      .Any({{B96, P0}, {{}, {VgprB96, VgprP0}}})

      .Any({{B128, P0}, {{}, {VgprB128, VgprP0}}})


       // addrspace(1), there are no stores to addrspace(4)

       // For targets:

       // - with "+flat-for-global" - global_store

       // - without(-flat-for-global) - buffer_store addr64

      .Any({{S16, DivP1}, {{}, {Vgpr16, VgprP1}}}, usesTrue16) // 16-bit store

      .Any({{B32, DivP1}, {{}, {VgprB32, VgprP1}}}) // 32-bit store, 8-bit and 16-bit truncating store

      .Any({{B64, DivP1}, {{}, {VgprB64, VgprP1}}})

      .Any({{B96, DivP1}, {{}, {VgprB96, VgprP1}}})

      .Any({{B128, DivP1}, {{}, {VgprB128, VgprP1}}})


       // For UniP1, use sgpr ptr to match flat-for-global patterns. Targets:

       // - with "+flat-for-global" - global_store for both sgpr and vgpr ptr

       // - without(-flat-for-global) - need sgpr ptr to select buffer_store

      .Any({{S16, UniP1}, {{}, {Vgpr16, SgprP1}}}, usesTrue16) // 16-bit store

      .Any({{B32, UniP1}, {{}, {VgprB32, SgprP1}}}) // 32-bit store, 8-bit and 16-bit truncating store

      .Any({{B64, UniP1}, {{}, {VgprB64, SgprP1}}})

      .Any({{B96, UniP1}, {{}, {VgprB96, SgprP1}}})

      .Any({{B128, UniP1}, {{}, {VgprB128, SgprP1}}})


      // addrspace(3) and addrspace(5)

      .Any({{S16, Ptr32}, {{}, {Vgpr16, VgprPtr32}}}, usesTrue16) // 16-bit store

      .Any({{B32, Ptr32}, {{}, {VgprB32, VgprPtr32}}}) // 32-bit store, 8-bit and 16-bit truncating store

      .Any({{B64, Ptr32}, {{}, {VgprB64, VgprPtr32}}})

      .Any({{B96, Ptr32}, {{}, {VgprB96, VgprPtr32}}})

      .Any({{B128, Ptr32}, {{}, {VgprB128, VgprPtr32}}});

  // clang-format on


  addRulesForGOpcs({G_AMDGPU_BUFFER_LOAD, G_AMDGPU_BUFFER_LOAD_FORMAT,

                    G_AMDGPU_TBUFFER_LOAD_FORMAT},

                   StandardB)

      .Div(B32, {{VgprB32}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B32, {{UniInVgprB32}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B64, {{VgprB64}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B64, {{UniInVgprB64}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B96, {{VgprB96}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B96, {{UniInVgprB96}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Div(B128, {{VgprB128}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}})

      .Uni(B128, {{UniInVgprB128}, {SgprV4S32_WF, Vgpr32, Vgpr32, Sgpr32_WF}});


  addRulesForGOpcs({G_AMDGPU_BUFFER_STORE})

      .Any({{S32}, {{}, {Vgpr32, SgprV4S32, Vgpr32, Vgpr32, Sgpr32}}});


  addRulesForGOpcs({G_PTR_ADD})

      .Any({{UniPtr32}, {{SgprPtr32}, {SgprPtr32, Sgpr32}}})

      .Any({{DivPtr32}, {{VgprPtr32}, {VgprPtr32, Vgpr32}}})

      .Any({{UniPtr64}, {{SgprPtr64}, {SgprPtr64, Sgpr64}}})

      .Any({{DivPtr64}, {{VgprPtr64}, {VgprPtr64, Vgpr64}}});


  addRulesForGOpcs({G_INTTOPTR})

      .Any({{UniPtr32}, {{SgprPtr32}, {Sgpr32}}})

      .Any({{DivPtr32}, {{VgprPtr32}, {Vgpr32}}})

      .Any({{UniPtr64}, {{SgprPtr64}, {Sgpr64}}})

      .Any({{DivPtr64}, {{VgprPtr64}, {Vgpr64}}})

      .Any({{UniPtr128}, {{SgprPtr128}, {Sgpr128}}})

      .Any({{DivPtr128}, {{VgprPtr128}, {Vgpr128}}});


  addRulesForGOpcs({G_PTRTOINT})

      .Any({{UniS32}, {{Sgpr32}, {SgprPtr32}}})

      .Any({{DivS32}, {{Vgpr32}, {VgprPtr32}}})

      .Any({{UniS64}, {{Sgpr64}, {SgprPtr64}}})

      .Any({{DivS64}, {{Vgpr64}, {VgprPtr64}}})

      .Any({{UniS128}, {{Sgpr128}, {SgprPtr128}}})

      .Any({{DivS128}, {{Vgpr128}, {VgprPtr128}}});


  addRulesForGOpcs({G_ABS}, Standard).Uni(S16, {{Sgpr32Trunc}, {Sgpr32SExt}});


  addRulesForGOpcs({G_READSTEADYCOUNTER}, Standard).Uni(S64, {{Sgpr64}, {}});


  bool hasSALUFloat = ST->hasSALUFloatInsts();


  addRulesForGOpcs({G_FADD}, Standard)

      .Uni(S32, {{Sgpr32}, {Sgpr32, Sgpr32}}, hasSALUFloat)

      .Uni(S32, {{UniInVgprS32}, {Vgpr32, Vgpr32}}, !hasSALUFloat)

      .Div(S32, {{Vgpr32}, {Vgpr32, Vgpr32}});


  addRulesForGOpcs({G_FPTOUI})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}}, hasSALUFloat)

      .Any({{UniS32, S32}, {{UniInVgprS32}, {Vgpr32}}}, !hasSALUFloat);


  addRulesForGOpcs({G_UITOFP})

      .Any({{DivS32, S32}, {{Vgpr32}, {Vgpr32}}})

      .Any({{UniS32, S32}, {{Sgpr32}, {Sgpr32}}}, hasSALUFloat)

      .Any({{UniS32, S32}, {{UniInVgprS32}, {Vgpr32}}}, !hasSALUFloat);


  using namespace Intrinsic;


  addRulesForIOpcs({amdgcn_s_getpc}).Any({{UniS64, _}, {{Sgpr64}, {None}}});


  // This is "intrinsic lane mask" it was set to i32/i64 in llvm-ir.

  addRulesForIOpcs({amdgcn_end_cf}).Any({{_, S32}, {{}, {None, Sgpr32}}});


  addRulesForIOpcs({amdgcn_if_break}, Standard)

      .Uni(S32, {{Sgpr32}, {IntrId, Vcc, Sgpr32}});


  addRulesForIOpcs({amdgcn_mbcnt_lo, amdgcn_mbcnt_hi}, Standard)

      .Div(S32, {{}, {Vgpr32, None, Vgpr32, Vgpr32}});


  addRulesForIOpcs({amdgcn_readfirstlane})

      .Any({{UniS32, _, DivS32}, {{}, {Sgpr32, None, Vgpr32}}})

      // this should not exist in the first place, it is from call lowering

      // readfirstlaning just in case register is not in sgpr.

      .Any({{UniS32, _, UniS32}, {{}, {Sgpr32, None, Vgpr32}}});


} // end initialize rules


MRI
unsigned const MachineRegisterInfo * MRI
Definition AArch64AdvSIMDScalarPass.cpp:103

assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

AMDGPUAddrSpace.h
AMDGPU address space definition.

AMDGPUInstrInfo.h
Contains the definition of a TargetInstrInfo class that is common to all AMD GPUs.

S16
constexpr LLT S16
Definition AMDGPULegalizerInfo.cpp:296

S1
constexpr LLT S1
Definition AMDGPULegalizerInfo.cpp:294

V2S16
constexpr LLT V2S16
Definition AMDGPULegalizerInfo.cpp:312

S32
constexpr LLT S32
Definition AMDGPULegalizerInfo.cpp:297

V4S32
constexpr LLT V4S32
Definition AMDGPULegalizerInfo.cpp:325

V3S32
constexpr LLT V3S32
Definition AMDGPULegalizerInfo.cpp:324

S64
constexpr LLT S64
Definition AMDGPULegalizerInfo.cpp:299

V2S32
constexpr LLT V2S32
Definition AMDGPULegalizerInfo.cpp:323

S128
constexpr LLT S128
Definition AMDGPULegalizerInfo.cpp:302

LLTToBId
UniformityLLTOpPredicateID LLTToBId(LLT Ty)
Definition AMDGPURegBankLegalizeRules.cpp:228

matchUniformityAndLLT
bool matchUniformityAndLLT(Register Reg, UniformityLLTOpPredicateID UniID, const MachineUniformityInfo &MUI, const MachineRegisterInfo &MRI)
Definition AMDGPURegBankLegalizeRules.cpp:45

LLTToId
UniformityLLTOpPredicateID LLTToId(LLT Ty)
Definition AMDGPURegBankLegalizeRules.cpp:210

AMDGPURegBankLegalizeRules.h

GCNSubtarget.h
AMD GCN specific subclass of TargetSubtarget.

GenericMachineInstrs.h
Declares convenience wrapper classes for interpreting MachineInstr instances as specific generic oper...

_
#define _
Definition HexagonMCCodeEmitter.cpp:46

MI
IRTranslator LLVM IR MI
Definition IRTranslator.cpp:110

Reg
Register Reg
Definition MachineSink.cpp:2117

MachineUniformityAnalysis.h
Machine IR instance of the generic uniformity analysis.

Opc
auto Opc
Definition RISCVRedundantCopyElimination.cpp:75

LLVM_DEBUG
#define LLVM_DEBUG(...)
Definition Debug.h:114

Predicate::operator()
bool operator()(const MachineInstr &MI) const
Definition AMDGPURegBankLegalizeRules.cpp:405

Predicate::operator||
Predicate operator||(const Predicate &RHS) const
Definition AMDGPURegBankLegalizeRules.cpp:447

Predicate::operator&&
Predicate operator&&(const Predicate &RHS) const
Definition AMDGPURegBankLegalizeRules.cpp:431

Predicate::Predicate
Predicate(std::function< bool(const MachineInstr &)> Pred)
Definition AMDGPURegBankLegalizeRules.cpp:401

Predicate::operator!
Predicate operator!() const
Definition AMDGPURegBankLegalizeRules.cpp:422

bool

llvm::AMDGPU::RegBankLegalizeRules::RegBankLegalizeRules
RegBankLegalizeRules(const GCNSubtarget &ST, MachineRegisterInfo &MRI)
Definition AMDGPURegBankLegalizeRules.cpp:465

llvm::AMDGPU::RegBankLegalizeRules::getRulesForOpc
const SetOfRulesForOpcode & getRulesForOpc(MachineInstr &MI) const
Definition AMDGPURegBankLegalizeRules.cpp:353

llvm::AMDGPU::SetOfRulesForOpcode
Definition AMDGPURegBankLegalizeRules.h:262

llvm::AMDGPU::SetOfRulesForOpcode::SetOfRulesForOpcode
SetOfRulesForOpcode()
Definition AMDGPURegBankLegalizeRules.cpp:205

llvm::AMDGPU::SetOfRulesForOpcode::addRule
void addRule(RegBankLegalizeRule Rule)
Definition AMDGPURegBankLegalizeRules.cpp:272

llvm::AMDGPU::SetOfRulesForOpcode::findMappingForMI
const RegBankLLTMapping & findMappingForMI(const MachineInstr &MI, const MachineRegisterInfo &MRI, const MachineUniformityInfo &MUI) const
Definition AMDGPURegBankLegalizeRules.cpp:243

llvm::AMDGPU::SetOfRulesForOpcode::addFastRuleDivergent
void addFastRuleDivergent(UniformityLLTOpPredicateID Ty, RegBankLLTMapping RuleApplyIDs)
Definition AMDGPURegBankLegalizeRules.cpp:276

llvm::AMDGPU::SetOfRulesForOpcode::addFastRuleUniform
void addFastRuleUniform(UniformityLLTOpPredicateID Ty, RegBankLLTMapping RuleApplyIDs)
Definition AMDGPURegBankLegalizeRules.cpp:283

llvm::Any
Definition Any.h:28

llvm::GCNSubtarget
Definition GCNSubtarget.h:34

llvm::GenericUniformityInfo::isDivergent
bool isDivergent(ConstValueRefT V) const
Whether V is divergent at its definition.
Definition GenericUniformityImpl.h:1260

llvm::GenericUniformityInfo::isUniform
bool isUniform(ConstValueRefT V) const
Whether V is uniform/non-divergent.
Definition GenericUniformityInfo.h:67

llvm::LLT
Definition LowLevelType.h:40

llvm::LLT::scalar
static constexpr LLT scalar(unsigned SizeInBits)
Get a low-level scalar or aggregate "bag of bits".
Definition LowLevelType.h:43

llvm::LLT::pointer
static constexpr LLT pointer(unsigned AddressSpace, unsigned SizeInBits)
Get a low-level pointer in the given address space.
Definition LowLevelType.h:58

llvm::LLT::fixed_vector
static constexpr LLT fixed_vector(unsigned NumElements, unsigned ScalarSizeInBits)
Get a low-level fixed-width vector of some number of elements and element width.
Definition LowLevelType.h:101

llvm::LocationSize::getValue
TypeSize getValue() const
Definition MemoryLocation.h:158

llvm::MachineInstr
Representation of each machine instruction.
Definition MachineInstr.h:72

llvm::MachineMemOperand
A description of a memory reference used in the backend.
Definition MachineMemOperand.h:130

llvm::MachineMemOperand::getSize
LocationSize getSize() const
Return the size in bytes of the memory reference.
Definition MachineMemOperand.h:243

llvm::MachineMemOperand::getAddrSpace
unsigned getAddrSpace() const
Definition MachineMemOperand.h:236

llvm::MachineMemOperand::getAlign
LLVM_ABI Align getAlign() const
Return the minimum known alignment in bytes of the actual memory reference.
Definition MachineOperand.cpp:1151

llvm::MachineRegisterInfo
MachineRegisterInfo - Keep track of information for virtual and physical registers,...
Definition MachineRegisterInfo.h:53

llvm::Register
Wrapper class representing virtual and physical registers.
Definition Register.h:19

llvm::SmallVectorImpl
This class consists of common code factored out of the SmallVector class to reduce code duplication b...
Definition SmallVector.h:573

llvm::SmallVectorImpl::append
void append(ItTy in_start, ItTy in_end)
Add the specified range to the end of the SmallVector.
Definition SmallVector.h:683

llvm::SmallVectorImpl::swap
void swap(SmallVectorImpl &RHS)
Definition SmallVector.h:974

llvm::SmallVectorTemplateBase::push_back
void push_back(const T &Elt)
Definition SmallVector.h:416

llvm::SmallVectorTemplateCommon::size
size_t size() const
Definition SmallVector.h:79

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition SmallVector.h:1202

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition ErrorHandling.h:164

llvm::AMDGPUAS::CONSTANT_ADDRESS_32BIT
@ CONSTANT_ADDRESS_32BIT
Address space for 32-bit constant memory.
Definition AMDGPUAddrSpace.h:38

llvm::AMDGPUAS::CONSTANT_ADDRESS
@ CONSTANT_ADDRESS
Address space for constant memory (VTX2).
Definition AMDGPUAddrSpace.h:35

llvm::AMDGPU
Definition AMDGPUMetadataVerifier.h:34

llvm::AMDGPU::Sgpr32Trunc
@ Sgpr32Trunc
Definition AMDGPURegBankLegalizeRules.h:190

llvm::AMDGPU::Vgpr64
@ Vgpr64
Definition AMDGPURegBankLegalizeRules.h:157

llvm::AMDGPU::Sgpr16
@ Sgpr16
Definition AMDGPURegBankLegalizeRules.h:133

llvm::AMDGPU::UniInVgprB128
@ UniInVgprB128
Definition AMDGPURegBankLegalizeRules.h:186

llvm::AMDGPU::Vgpr32
@ Vgpr32
Definition AMDGPURegBankLegalizeRules.h:156

llvm::AMDGPU::VgprB512
@ VgprB512
Definition AMDGPURegBankLegalizeRules.h:174

llvm::AMDGPU::VgprV2S32
@ VgprV2S32
Definition AMDGPURegBankLegalizeRules.h:168

llvm::AMDGPU::IntrId
@ IntrId
Definition AMDGPURegBankLegalizeRules.h:128

llvm::AMDGPU::SgprV2S32
@ SgprV2S32
Definition AMDGPURegBankLegalizeRules.h:146

llvm::AMDGPU::VgprV2S16
@ VgprV2S16
Definition AMDGPURegBankLegalizeRules.h:167

llvm::AMDGPU::VgprPtr64
@ VgprPtr64
Definition AMDGPURegBankLegalizeRules.h:165

llvm::AMDGPU::VgprB64
@ VgprB64
Definition AMDGPURegBankLegalizeRules.h:170

llvm::AMDGPU::SgprPtr32
@ SgprPtr32
Definition AMDGPURegBankLegalizeRules.h:141

llvm::AMDGPU::UniInVgprB32
@ UniInVgprB32
Definition AMDGPURegBankLegalizeRules.h:183

llvm::AMDGPU::VgprP1
@ VgprP1
Definition AMDGPURegBankLegalizeRules.h:160

llvm::AMDGPU::SgprPtr128
@ SgprPtr128
Definition AMDGPURegBankLegalizeRules.h:143

llvm::AMDGPU::UniInVgprB96
@ UniInVgprB96
Definition AMDGPURegBankLegalizeRules.h:185

llvm::AMDGPU::SgprB64
@ SgprB64
Definition AMDGPURegBankLegalizeRules.h:148

llvm::AMDGPU::Vgpr32ZExt
@ Vgpr32ZExt
Definition AMDGPURegBankLegalizeRules.h:202

llvm::AMDGPU::SgprB512
@ SgprB512
Definition AMDGPURegBankLegalizeRules.h:152

llvm::AMDGPU::UniInVgprB512
@ UniInVgprB512
Definition AMDGPURegBankLegalizeRules.h:188

llvm::AMDGPU::Vgpr16
@ Vgpr16
Definition AMDGPURegBankLegalizeRules.h:155

llvm::AMDGPU::VgprB96
@ VgprB96
Definition AMDGPURegBankLegalizeRules.h:171

llvm::AMDGPU::Sgpr32AExtBoolInReg
@ Sgpr32AExtBoolInReg
Definition AMDGPURegBankLegalizeRules.h:198

llvm::AMDGPU::UniInVgprS16
@ UniInVgprS16
Definition AMDGPURegBankLegalizeRules.h:179

llvm::AMDGPU::Vcc
@ Vcc
Definition AMDGPURegBankLegalizeRules.h:130

llvm::AMDGPU::SgprV4S32_WF
@ SgprV4S32_WF
Definition AMDGPURegBankLegalizeRules.h:194

llvm::AMDGPU::UniInVgprB256
@ UniInVgprB256
Definition AMDGPURegBankLegalizeRules.h:187

llvm::AMDGPU::SgprP1
@ SgprP1
Definition AMDGPURegBankLegalizeRules.h:137

llvm::AMDGPU::SgprB96
@ SgprB96
Definition AMDGPURegBankLegalizeRules.h:149

llvm::AMDGPU::Sgpr32AExt
@ Sgpr32AExt
Definition AMDGPURegBankLegalizeRules.h:197

llvm::AMDGPU::UniInVgprB64
@ UniInVgprB64
Definition AMDGPURegBankLegalizeRules.h:184

llvm::AMDGPU::Sgpr32ZExt
@ Sgpr32ZExt
Definition AMDGPURegBankLegalizeRules.h:200

llvm::AMDGPU::SgprP5
@ SgprP5
Definition AMDGPURegBankLegalizeRules.h:140

llvm::AMDGPU::SgprB256
@ SgprB256
Definition AMDGPURegBankLegalizeRules.h:151

llvm::AMDGPU::VgprP5
@ VgprP5
Definition AMDGPURegBankLegalizeRules.h:163

llvm::AMDGPU::SgprP4
@ SgprP4
Definition AMDGPURegBankLegalizeRules.h:139

llvm::AMDGPU::SgprV4S32
@ SgprV4S32
Definition AMDGPURegBankLegalizeRules.h:145

llvm::AMDGPU::Sgpr128
@ Sgpr128
Definition AMDGPURegBankLegalizeRules.h:136

llvm::AMDGPU::VgprB128
@ VgprB128
Definition AMDGPURegBankLegalizeRules.h:172

llvm::AMDGPU::UniInVgprS32
@ UniInVgprS32
Definition AMDGPURegBankLegalizeRules.h:180

llvm::AMDGPU::VgprB256
@ VgprB256
Definition AMDGPURegBankLegalizeRules.h:173

llvm::AMDGPU::Sgpr64
@ Sgpr64
Definition AMDGPURegBankLegalizeRules.h:135

llvm::AMDGPU::VgprPtr32
@ VgprPtr32
Definition AMDGPURegBankLegalizeRules.h:164

llvm::AMDGPU::SgprPtr64
@ SgprPtr64
Definition AMDGPURegBankLegalizeRules.h:142

llvm::AMDGPU::Sgpr32SExt
@ Sgpr32SExt
Definition AMDGPURegBankLegalizeRules.h:199

llvm::AMDGPU::None
@ None
Definition AMDGPURegBankLegalizeRules.h:127

llvm::AMDGPU::VgprP3
@ VgprP3
Definition AMDGPURegBankLegalizeRules.h:161

llvm::AMDGPU::Vgpr128
@ Vgpr128
Definition AMDGPURegBankLegalizeRules.h:158

llvm::AMDGPU::SgprB128
@ SgprB128
Definition AMDGPURegBankLegalizeRules.h:150

llvm::AMDGPU::SgprV2S16
@ SgprV2S16
Definition AMDGPURegBankLegalizeRules.h:144

llvm::AMDGPU::SgprP3
@ SgprP3
Definition AMDGPURegBankLegalizeRules.h:138

llvm::AMDGPU::VgprP4
@ VgprP4
Definition AMDGPURegBankLegalizeRules.h:162

llvm::AMDGPU::Imm
@ Imm
Definition AMDGPURegBankLegalizeRules.h:129

llvm::AMDGPU::VgprB32
@ VgprB32
Definition AMDGPURegBankLegalizeRules.h:169

llvm::AMDGPU::SgprB32
@ SgprB32
Definition AMDGPURegBankLegalizeRules.h:147

llvm::AMDGPU::VgprP0
@ VgprP0
Definition AMDGPURegBankLegalizeRules.h:159

llvm::AMDGPU::Sgpr32
@ Sgpr32
Definition AMDGPURegBankLegalizeRules.h:134

llvm::AMDGPU::Sgpr32_WF
@ Sgpr32_WF
Definition AMDGPURegBankLegalizeRules.h:193

llvm::AMDGPU::UniInVcc
@ UniInVcc
Definition AMDGPURegBankLegalizeRules.h:178

llvm::AMDGPU::VgprPtr128
@ VgprPtr128
Definition AMDGPURegBankLegalizeRules.h:166

llvm::AMDGPU::Vgpr32SExt
@ Vgpr32SExt
Definition AMDGPURegBankLegalizeRules.h:201

llvm::AMDGPU::isAnyPtr
bool isAnyPtr(LLT Ty, unsigned Width)
Definition AMDGPURegBankLegalizeRules.cpp:29

llvm::AMDGPU::UniformityLLTOpPredicateID
UniformityLLTOpPredicateID
Definition AMDGPURegBankLegalizeRules.h:39

llvm::AMDGPU::UniS128
@ UniS128
Definition AMDGPURegBankLegalizeRules.h:52

llvm::AMDGPU::DivP3
@ DivP3
Definition AMDGPURegBankLegalizeRules.h:81

llvm::AMDGPU::DivB128
@ DivB128
Definition AMDGPURegBankLegalizeRules.h:116

llvm::AMDGPU::P1
@ P1
Definition AMDGPURegBankLegalizeRules.h:62

llvm::AMDGPU::DivS128
@ DivS128
Definition AMDGPURegBankLegalizeRules.h:58

llvm::AMDGPU::Ptr128
@ Ptr128
Definition AMDGPURegBankLegalizeRules.h:68

llvm::AMDGPU::V3S32
@ V3S32
Definition AMDGPURegBankLegalizeRules.h:91

llvm::AMDGPU::Ptr32
@ Ptr32
Definition AMDGPURegBankLegalizeRules.h:66

llvm::AMDGPU::DivV2S16
@ DivV2S16
Definition AMDGPURegBankLegalizeRules.h:96

llvm::AMDGPU::S64
@ S64
Definition AMDGPURegBankLegalizeRules.h:45

llvm::AMDGPU::DivPtr128
@ DivPtr128
Definition AMDGPURegBankLegalizeRules.h:86

llvm::AMDGPU::DivS16
@ DivS16
Definition AMDGPURegBankLegalizeRules.h:55

llvm::AMDGPU::UniS32
@ UniS32
Definition AMDGPURegBankLegalizeRules.h:50

llvm::AMDGPU::DivP1
@ DivP1
Definition AMDGPURegBankLegalizeRules.h:80

llvm::AMDGPU::B512
@ B512
Definition AMDGPURegBankLegalizeRules.h:104

llvm::AMDGPU::S16
@ S16
Definition AMDGPURegBankLegalizeRules.h:43

llvm::AMDGPU::UniB512
@ UniB512
Definition AMDGPURegBankLegalizeRules.h:111

llvm::AMDGPU::DivB512
@ DivB512
Definition AMDGPURegBankLegalizeRules.h:118

llvm::AMDGPU::UniV2S16
@ UniV2S16
Definition AMDGPURegBankLegalizeRules.h:94

llvm::AMDGPU::P5
@ P5
Definition AMDGPURegBankLegalizeRules.h:65

llvm::AMDGPU::UniB64
@ UniB64
Definition AMDGPURegBankLegalizeRules.h:107

llvm::AMDGPU::DivS64
@ DivS64
Definition AMDGPURegBankLegalizeRules.h:57

llvm::AMDGPU::UniS64
@ UniS64
Definition AMDGPURegBankLegalizeRules.h:51

llvm::AMDGPU::UniB32
@ UniB32
Definition AMDGPURegBankLegalizeRules.h:106

llvm::AMDGPU::UniB128
@ UniB128
Definition AMDGPURegBankLegalizeRules.h:109

llvm::AMDGPU::V2S32
@ V2S32
Definition AMDGPURegBankLegalizeRules.h:90

llvm::AMDGPU::V2S16
@ V2S16
Definition AMDGPURegBankLegalizeRules.h:89

llvm::AMDGPU::B64
@ B64
Definition AMDGPURegBankLegalizeRules.h:100

llvm::AMDGPU::S32
@ S32
Definition AMDGPURegBankLegalizeRules.h:44

llvm::AMDGPU::DivP0
@ DivP0
Definition AMDGPURegBankLegalizeRules.h:79

llvm::AMDGPU::DivB64
@ DivB64
Definition AMDGPURegBankLegalizeRules.h:114

llvm::AMDGPU::P0
@ P0
Definition AMDGPURegBankLegalizeRules.h:61

llvm::AMDGPU::UniS1
@ UniS1
Definition AMDGPURegBankLegalizeRules.h:48

llvm::AMDGPU::P4
@ P4
Definition AMDGPURegBankLegalizeRules.h:64

llvm::AMDGPU::B128
@ B128
Definition AMDGPURegBankLegalizeRules.h:102

llvm::AMDGPU::UniPtr128
@ UniPtr128
Definition AMDGPURegBankLegalizeRules.h:77

llvm::AMDGPU::UniPtr32
@ UniPtr32
Definition AMDGPURegBankLegalizeRules.h:75

llvm::AMDGPU::UniP1
@ UniP1
Definition AMDGPURegBankLegalizeRules.h:71

llvm::AMDGPU::DivB32
@ DivB32
Definition AMDGPURegBankLegalizeRules.h:113

llvm::AMDGPU::DivS32
@ DivS32
Definition AMDGPURegBankLegalizeRules.h:56

llvm::AMDGPU::UniB96
@ UniB96
Definition AMDGPURegBankLegalizeRules.h:108

llvm::AMDGPU::S1
@ S1
Definition AMDGPURegBankLegalizeRules.h:42

llvm::AMDGPU::B32
@ B32
Definition AMDGPURegBankLegalizeRules.h:99

llvm::AMDGPU::DivPtr32
@ DivPtr32
Definition AMDGPURegBankLegalizeRules.h:84

llvm::AMDGPU::_
@ _
Definition AMDGPURegBankLegalizeRules.h:40

llvm::AMDGPU::B256
@ B256
Definition AMDGPURegBankLegalizeRules.h:103

llvm::AMDGPU::V4S32
@ V4S32
Definition AMDGPURegBankLegalizeRules.h:92

llvm::AMDGPU::UniPtr64
@ UniPtr64
Definition AMDGPURegBankLegalizeRules.h:76

llvm::AMDGPU::DivP4
@ DivP4
Definition AMDGPURegBankLegalizeRules.h:82

llvm::AMDGPU::DivB256
@ DivB256
Definition AMDGPURegBankLegalizeRules.h:117

llvm::AMDGPU::Ptr64
@ Ptr64
Definition AMDGPURegBankLegalizeRules.h:67

llvm::AMDGPU::DivPtr64
@ DivPtr64
Definition AMDGPURegBankLegalizeRules.h:85

llvm::AMDGPU::UniP0
@ UniP0
Definition AMDGPURegBankLegalizeRules.h:70

llvm::AMDGPU::UniP5
@ UniP5
Definition AMDGPURegBankLegalizeRules.h:74

llvm::AMDGPU::UniS16
@ UniS16
Definition AMDGPURegBankLegalizeRules.h:49

llvm::AMDGPU::B96
@ B96
Definition AMDGPURegBankLegalizeRules.h:101

llvm::AMDGPU::DivP5
@ DivP5
Definition AMDGPURegBankLegalizeRules.h:83

llvm::AMDGPU::UniP3
@ UniP3
Definition AMDGPURegBankLegalizeRules.h:72

llvm::AMDGPU::UniP4
@ UniP4
Definition AMDGPURegBankLegalizeRules.h:73

llvm::AMDGPU::DivB96
@ DivB96
Definition AMDGPURegBankLegalizeRules.h:115

llvm::AMDGPU::UniB256
@ UniB256
Definition AMDGPURegBankLegalizeRules.h:110

llvm::AMDGPU::P3
@ P3
Definition AMDGPURegBankLegalizeRules.h:63

llvm::AMDGPU::DivS1
@ DivS1
Definition AMDGPURegBankLegalizeRules.h:54

llvm::AMDGPU::isUniformMMO
bool isUniformMMO(const MachineMemOperand *MMO)
Definition AMDGPUInstrInfo.cpp:30

llvm::AMDGPU::FastRulesTypes
FastRulesTypes
Definition AMDGPURegBankLegalizeRules.h:229

llvm::AMDGPU::StandardB
@ StandardB
Definition AMDGPURegBankLegalizeRules.h:232

llvm::AMDGPU::Vector
@ Vector
Definition AMDGPURegBankLegalizeRules.h:233

llvm::AMDGPU::NoFastRules
@ NoFastRules
Definition AMDGPURegBankLegalizeRules.h:230

llvm::AMDGPU::Standard
@ Standard
Definition AMDGPURegBankLegalizeRules.h:231

llvm::AMDGPU::LoweringMethodID
LoweringMethodID
Definition AMDGPURegBankLegalizeRules.h:210

llvm::AMDGPU::SplitTo32SExtInReg
@ SplitTo32SExtInReg
Definition AMDGPURegBankLegalizeRules.h:221

llvm::AMDGPU::WidenLoad
@ WidenLoad
Definition AMDGPURegBankLegalizeRules.h:225

llvm::AMDGPU::S_BFE
@ S_BFE
Definition AMDGPURegBankLegalizeRules.h:216

llvm::AMDGPU::Ext32To64
@ Ext32To64
Definition AMDGPURegBankLegalizeRules.h:222

llvm::AMDGPU::SplitLoad
@ SplitLoad
Definition AMDGPURegBankLegalizeRules.h:224

llvm::AMDGPU::SplitTo32Select
@ SplitTo32Select
Definition AMDGPURegBankLegalizeRules.h:220

llvm::AMDGPU::VgprToVccCopy
@ VgprToVccCopy
Definition AMDGPURegBankLegalizeRules.h:218

llvm::AMDGPU::UnpackMinMax
@ UnpackMinMax
Definition AMDGPURegBankLegalizeRules.h:215

llvm::AMDGPU::UniCstExt
@ UniCstExt
Definition AMDGPURegBankLegalizeRules.h:223

llvm::AMDGPU::UnpackBitShift
@ UnpackBitShift
Definition AMDGPURegBankLegalizeRules.h:214

llvm::AMDGPU::SplitTo32
@ SplitTo32
Definition AMDGPURegBankLegalizeRules.h:219

llvm::AMDGPU::VccExtToSel
@ VccExtToSel
Definition AMDGPURegBankLegalizeRules.h:212

llvm::AMDGPU::V_BFE
@ V_BFE
Definition AMDGPURegBankLegalizeRules.h:217

llvm::AMDGPU::WidenMMOToS32
@ WidenMMOToS32
Definition AMDGPURegBankLegalizeRules.h:226

llvm::AMDGPU::UniExtToSel
@ UniExtToSel
Definition AMDGPURegBankLegalizeRules.h:213

llvm::Intrinsic
This namespace contains an enum with a value for every intrinsic/builtin function known by LLVM.
Definition GenericSSAContext.h:27

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition AddressRanges.h:18

llvm::MachineUniformityInfo
GenericUniformityInfo< MachineSSAContext > MachineUniformityInfo
Definition MachineUniformityAnalysis.h:26

llvm::MONoClobber
static const MachineMemOperand::Flags MONoClobber
Mark the MMO of a uniform load if there are no potentially clobbering stores on any path from the sta...
Definition SIInstrInfo.h:44

llvm::dbgs
LLVM_ABI raw_ostream & dbgs()
dbgs() - This returns a reference to a raw_ostream for debugging messages.
Definition Debug.cpp:207

llvm::cast
decltype(auto) cast(const From &Val)
cast<X> - Return the argument parameter cast to the specified type.
Definition Casting.h:559

llvm::AMDGPU::PredicateMapping::OpUniformityAndTypes
SmallVector< UniformityLLTOpPredicateID, 4 > OpUniformityAndTypes
Definition AMDGPURegBankLegalizeRules.h:247

llvm::AMDGPU::PredicateMapping::PredicateMapping
PredicateMapping(std::initializer_list< UniformityLLTOpPredicateID > OpList, std::function< bool(const MachineInstr &)> TestFunc=nullptr)
Definition AMDGPURegBankLegalizeRules.cpp:40

llvm::AMDGPU::PredicateMapping::match
bool match(const MachineInstr &MI, const MachineUniformityInfo &MUI, const MachineRegisterInfo &MRI) const
Definition AMDGPURegBankLegalizeRules.cpp:178

llvm::AMDGPU::PredicateMapping::TestFunc
std::function< bool(const MachineInstr &)> TestFunc
Definition AMDGPURegBankLegalizeRules.h:248

llvm::AMDGPU::RegBankLLTMapping
Definition AMDGPURegBankLegalizeRules.h:236

llvm::AMDGPU::RegBankLLTMapping::LoweringMethod
LoweringMethodID LoweringMethod
Definition AMDGPURegBankLegalizeRules.h:239

llvm::AMDGPU::RegBankLLTMapping::RegBankLLTMapping
RegBankLLTMapping(std::initializer_list< RegBankLLTMappingApplyID > DstOpMappingList, std::initializer_list< RegBankLLTMappingApplyID > SrcOpMappingList, LoweringMethodID LoweringMethod=DoNotLower)
Definition AMDGPURegBankLegalizeRules.cpp:33

llvm::AMDGPU::RegBankLLTMapping::DstOpMapping
SmallVector< RegBankLLTMappingApplyID, 2 > DstOpMapping
Definition AMDGPURegBankLegalizeRules.h:237

llvm::AMDGPU::RegBankLLTMapping::SrcOpMapping
SmallVector< RegBankLLTMappingApplyID, 4 > SrcOpMapping
Definition AMDGPURegBankLegalizeRules.h:238

llvm::AMDGPU::RegBankLegalizeRule
Definition AMDGPURegBankLegalizeRules.h:257

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition Alignment.h:39