docs/doxygen/X86InstructionSelector_8cpp_source.html

//===- X86InstructionSelector.cpp -----------------------------------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

/// \file

/// This file implements the targeting of the InstructionSelector class for

/// X86.

/// \todo This should be generated by TableGen.

//===----------------------------------------------------------------------===//


#include "MCTargetDesc/X86BaseInfo.h"

#include "X86.h"

#include "X86InstrBuilder.h"

#include "X86InstrInfo.h"

#include "X86RegisterBankInfo.h"

#include "X86RegisterInfo.h"

#include "X86Subtarget.h"

#include "X86TargetMachine.h"

#include "llvm/CodeGen/GlobalISel/GIMatchTableExecutorImpl.h"

#include "llvm/CodeGen/GlobalISel/GenericMachineInstrs.h"

#include "llvm/CodeGen/GlobalISel/InstructionSelector.h"

#include "llvm/CodeGen/GlobalISel/Utils.h"

#include "llvm/CodeGen/MachineBasicBlock.h"

#include "llvm/CodeGen/MachineConstantPool.h"

#include "llvm/CodeGen/MachineFunction.h"

#include "llvm/CodeGen/MachineInstr.h"

#include "llvm/CodeGen/MachineInstrBuilder.h"

#include "llvm/CodeGen/MachineMemOperand.h"

#include "llvm/CodeGen/MachineOperand.h"

#include "llvm/CodeGen/MachineRegisterInfo.h"

#include "llvm/CodeGen/RegisterBank.h"

#include "llvm/CodeGen/TargetOpcodes.h"

#include "llvm/CodeGen/TargetRegisterInfo.h"

#include "llvm/CodeGenTypes/LowLevelType.h"

#include "llvm/IR/DataLayout.h"

#include "llvm/IR/InstrTypes.h"

#include "llvm/IR/IntrinsicsX86.h"

#include "llvm/Support/CodeGen.h"

#include "llvm/Support/Debug.h"

#include "llvm/Support/ErrorHandling.h"

#include "llvm/Support/MathExtras.h"

#include "llvm/Support/raw_ostream.h"

#include <cassert>

#include <cstdint>

#include <tuple>


#define DEBUG_TYPE "X86-isel"


using namespace llvm;


namespace {


#define GET_GLOBALISEL_PREDICATE_BITSET

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_PREDICATE_BITSET


class X86InstructionSelector : public InstructionSelector {

public:

  X86InstructionSelector(const X86TargetMachine &TM, const X86Subtarget &STI,

                         const X86RegisterBankInfo &RBI);


  bool select(MachineInstr &I) override;

  static const char *getName() { return DEBUG_TYPE; }


private:

  /// tblgen-erated 'select' implementation, used as the initial selector for

  /// the patterns that don't require complex C++.

  bool selectImpl(MachineInstr &I, CodeGenCoverage &CoverageInfo) const;


  // TODO: remove after supported by Tablegen-erated instruction selection.

  unsigned getLoadStoreOp(const LLT &Ty, const RegisterBank &RB, unsigned Opc,

                          Align Alignment) const;

  // TODO: remove once p0<->i32/i64 matching is available

  unsigned getPtrLoadStoreOp(const LLT &Ty, const RegisterBank &RB,

                             unsigned Opc) const;


  bool selectLoadStoreOp(MachineInstr &I, MachineRegisterInfo &MRI,

                         MachineFunction &MF) const;

  bool selectFrameIndexOrGep(MachineInstr &I, MachineRegisterInfo &MRI,

                             MachineFunction &MF) const;

  bool selectGlobalValue(MachineInstr &I, MachineRegisterInfo &MRI,

                         MachineFunction &MF) const;

  bool selectConstant(MachineInstr &I, MachineRegisterInfo &MRI,

                      MachineFunction &MF) const;

  bool selectTruncOrPtrToInt(MachineInstr &I, MachineRegisterInfo &MRI,

                             MachineFunction &MF) const;

  bool selectZext(MachineInstr &I, MachineRegisterInfo &MRI,

                  MachineFunction &MF) const;

  bool selectAnyext(MachineInstr &I, MachineRegisterInfo &MRI,

                    MachineFunction &MF) const;

  bool selectCmp(MachineInstr &I, MachineRegisterInfo &MRI,

                 MachineFunction &MF) const;

  bool selectFCmp(MachineInstr &I, MachineRegisterInfo &MRI,

                  MachineFunction &MF) const;

  bool selectUAddSub(MachineInstr &I, MachineRegisterInfo &MRI,

                     MachineFunction &MF) const;

  bool selectDebugInstr(MachineInstr &I, MachineRegisterInfo &MRI) const;

  bool selectCopy(MachineInstr &I, MachineRegisterInfo &MRI) const;

  bool selectUnmergeValues(MachineInstr &I, MachineRegisterInfo &MRI,

                           MachineFunction &MF);

  bool selectMergeValues(MachineInstr &I, MachineRegisterInfo &MRI,

                         MachineFunction &MF);

  bool selectInsert(MachineInstr &I, MachineRegisterInfo &MRI,

                    MachineFunction &MF) const;

  bool selectExtract(MachineInstr &I, MachineRegisterInfo &MRI,

                     MachineFunction &MF) const;

  bool selectCondBranch(MachineInstr &I, MachineRegisterInfo &MRI,

                        MachineFunction &MF) const;

  bool selectTurnIntoCOPY(MachineInstr &I, MachineRegisterInfo &MRI,

                          const Register DstReg,

                          const TargetRegisterClass *DstRC,

                          const Register SrcReg,

                          const TargetRegisterClass *SrcRC) const;

  bool materializeFP(MachineInstr &I, MachineRegisterInfo &MRI,

                     MachineFunction &MF) const;

  bool selectImplicitDefOrPHI(MachineInstr &I, MachineRegisterInfo &MRI) const;

  bool selectMulDivRem(MachineInstr &I, MachineRegisterInfo &MRI,

                       MachineFunction &MF) const;

  bool selectSelect(MachineInstr &I, MachineRegisterInfo &MRI,

                    MachineFunction &MF) const;


  ComplexRendererFns selectAddr(MachineOperand &Root) const;


  // emit insert subreg instruction and insert it before MachineInstr &I

  bool emitInsertSubreg(Register DstReg, Register SrcReg, MachineInstr &I,

                        MachineRegisterInfo &MRI, MachineFunction &MF) const;

  // emit extract subreg instruction and insert it before MachineInstr &I

  bool emitExtractSubreg(Register DstReg, Register SrcReg, MachineInstr &I,

                         MachineRegisterInfo &MRI, MachineFunction &MF) const;


  const TargetRegisterClass *getRegClass(LLT Ty, const RegisterBank &RB) const;

  const TargetRegisterClass *getRegClass(LLT Ty, Register Reg,

                                         MachineRegisterInfo &MRI) const;


  const X86TargetMachine &TM;

  const X86Subtarget &STI;

  const X86InstrInfo &TII;

  const X86RegisterInfo &TRI;

  const X86RegisterBankInfo &RBI;


#define GET_GLOBALISEL_PREDICATES_DECL

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_PREDICATES_DECL


#define GET_GLOBALISEL_TEMPORARIES_DECL

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_TEMPORARIES_DECL

};


} // end anonymous namespace


#define GET_GLOBALISEL_IMPL

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_IMPL


X86InstructionSelector::X86InstructionSelector(const X86TargetMachine &TM,

                                               const X86Subtarget &STI,

                                               const X86RegisterBankInfo &RBI)

    : TM(TM), STI(STI), TII(*STI.getInstrInfo()), TRI(*STI.getRegisterInfo()),

      RBI(RBI),

#define GET_GLOBALISEL_PREDICATES_INIT

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_PREDICATES_INIT

#define GET_GLOBALISEL_TEMPORARIES_INIT

#include "X86GenGlobalISel.inc"

#undef GET_GLOBALISEL_TEMPORARIES_INIT

{

}


// FIXME: This should be target-independent, inferred from the types declared

// for each class in the bank.

const TargetRegisterClass *

X86InstructionSelector::getRegClass(LLT Ty, const RegisterBank &RB) const {

  if (RB.getID() == X86::GPRRegBankID) {

    if (Ty.getSizeInBits() <= 8)

      return &X86::GR8RegClass;

    if (Ty.getSizeInBits() == 16)

      return &X86::GR16RegClass;

    if (Ty.getSizeInBits() == 32)

      return &X86::GR32RegClass;

    if (Ty.getSizeInBits() == 64)

      return &X86::GR64RegClass;

  }

  if (RB.getID() == X86::VECRRegBankID) {

    if (Ty.getSizeInBits() == 16)

      return STI.hasAVX512() ? &X86::FR16XRegClass : &X86::FR16RegClass;

    if (Ty.getSizeInBits() == 32)

      return STI.hasAVX512() ? &X86::FR32XRegClass : &X86::FR32RegClass;

    if (Ty.getSizeInBits() == 64)

      return STI.hasAVX512() ? &X86::FR64XRegClass : &X86::FR64RegClass;

    if (Ty.getSizeInBits() == 128)

      return STI.hasAVX512() ? &X86::VR128XRegClass : &X86::VR128RegClass;

    if (Ty.getSizeInBits() == 256)

      return STI.hasAVX512() ? &X86::VR256XRegClass : &X86::VR256RegClass;

    if (Ty.getSizeInBits() == 512)

      return &X86::VR512RegClass;

  }


  if (RB.getID() == X86::PSRRegBankID) {

    if (Ty.getSizeInBits() == 80)

      return &X86::RFP80RegClass;

    if (Ty.getSizeInBits() == 64)

      return &X86::RFP64RegClass;

    if (Ty.getSizeInBits() == 32)

      return &X86::RFP32RegClass;

  }


  llvm_unreachable("Unknown RegBank!");

}


const TargetRegisterClass *

X86InstructionSelector::getRegClass(LLT Ty, Register Reg,

                                    MachineRegisterInfo &MRI) const {

  const RegisterBank &RegBank = *RBI.getRegBank(Reg, MRI, TRI);

  return getRegClass(Ty, RegBank);

}


static unsigned getSubRegIndex(const TargetRegisterClass *RC) {

  unsigned SubIdx = X86::NoSubRegister;

  if (RC == &X86::GR32RegClass) {

    SubIdx = X86::sub_32bit;

  } else if (RC == &X86::GR16RegClass) {

    SubIdx = X86::sub_16bit;

  } else if (RC == &X86::GR8RegClass) {

    SubIdx = X86::sub_8bit;

  }


  return SubIdx;

}


static const TargetRegisterClass *getRegClassFromGRPhysReg(Register Reg) {

  assert(Reg.isPhysical());

  if (X86::GR64RegClass.contains(Reg))

    return &X86::GR64RegClass;

  if (X86::GR32RegClass.contains(Reg))

    return &X86::GR32RegClass;

  if (X86::GR16RegClass.contains(Reg))

    return &X86::GR16RegClass;

  if (X86::GR8RegClass.contains(Reg))

    return &X86::GR8RegClass;


  llvm_unreachable("Unknown RegClass for PhysReg!");

}


// FIXME: We need some sort of API in RBI/TRI to allow generic code to

// constrain operands of simple instructions given a TargetRegisterClass

// and LLT

bool X86InstructionSelector::selectDebugInstr(MachineInstr &I,

                                              MachineRegisterInfo &MRI) const {

  for (MachineOperand &MO : I.operands()) {

    if (!MO.isReg())

      continue;

    Register Reg = MO.getReg();

    if (!Reg)

      continue;

    if (Reg.isPhysical())

      continue;

    LLT Ty = MRI.getType(Reg);

    const RegClassOrRegBank &RegClassOrBank = MRI.getRegClassOrRegBank(Reg);

    const TargetRegisterClass *RC =

        dyn_cast_if_present<const TargetRegisterClass *>(RegClassOrBank);

    if (!RC) {

      const RegisterBank &RB = *cast<const RegisterBank *>(RegClassOrBank);

      RC = getRegClass(Ty, RB);

      if (!RC) {

        LLVM_DEBUG(

            dbgs() << "Warning: DBG_VALUE operand has unexpected size/bank\n");

        break;

      }

    }

    RBI.constrainGenericRegister(Reg, *RC, MRI);

  }


  return true;

}


// Set X86 Opcode and constrain DestReg.

bool X86InstructionSelector::selectCopy(MachineInstr &I,

                                        MachineRegisterInfo &MRI) const {

  Register DstReg = I.getOperand(0).getReg();

  const unsigned DstSize = RBI.getSizeInBits(DstReg, MRI, TRI);

  const RegisterBank &DstRegBank = *RBI.getRegBank(DstReg, MRI, TRI);


  Register SrcReg = I.getOperand(1).getReg();

  const unsigned SrcSize = RBI.getSizeInBits(SrcReg, MRI, TRI);

  const RegisterBank &SrcRegBank = *RBI.getRegBank(SrcReg, MRI, TRI);


  if (DstReg.isPhysical()) {

    assert(I.isCopy() && "Generic operators do not allow physical registers");


    if (DstSize > SrcSize && SrcRegBank.getID() == X86::GPRRegBankID &&

        DstRegBank.getID() == X86::GPRRegBankID) {


      const TargetRegisterClass *SrcRC =

          getRegClass(MRI.getType(SrcReg), SrcRegBank);

      const TargetRegisterClass *DstRC = getRegClassFromGRPhysReg(DstReg);


      if (SrcRC != DstRC) {

        // This case can be generated by ABI lowering, performe anyext

        Register ExtSrc = MRI.createVirtualRegister(DstRC);

        BuildMI(*I.getParent(), I, I.getDebugLoc(),

                TII.get(TargetOpcode::SUBREG_TO_REG))

            .addDef(ExtSrc)

            .addReg(SrcReg)

            .addImm(getSubRegIndex(SrcRC));


        I.getOperand(1).setReg(ExtSrc);

      }

    }


    // Special case GPR16 -> XMM

    if (SrcSize == 16 && SrcRegBank.getID() == X86::GPRRegBankID &&

        (DstRegBank.getID() == X86::VECRRegBankID)) {


      const DebugLoc &DL = I.getDebugLoc();


      // Any extend GPR16 -> GPR32

      Register ExtReg = MRI.createVirtualRegister(&X86::GR32RegClass);

      BuildMI(*I.getParent(), I, DL, TII.get(TargetOpcode::SUBREG_TO_REG),

              ExtReg)

          .addReg(SrcReg)

          .addImm(X86::sub_16bit);


      // Copy GR32 -> XMM

      BuildMI(*I.getParent(), I, DL, TII.get(TargetOpcode::COPY), DstReg)

          .addReg(ExtReg);


      I.eraseFromParent();

    }


    // Special case XMM -> GR16

    if (DstSize == 16 && DstRegBank.getID() == X86::GPRRegBankID &&

        (SrcRegBank.getID() == X86::VECRRegBankID)) {


      const DebugLoc &DL = I.getDebugLoc();


      // Move XMM to GR32 register.

      Register Temp32 = MRI.createVirtualRegister(&X86::GR32RegClass);

      BuildMI(*I.getParent(), I, DL, TII.get(TargetOpcode::COPY), Temp32)

          .addReg(SrcReg);


      // Extract the lower 16 bits

      if (Register Dst32 = TRI.getMatchingSuperReg(DstReg, X86::sub_16bit,

                                                   &X86::GR32RegClass)) {

        // Optimization for Physical Dst (e.g. AX): Copy to EAX directly.

        BuildMI(*I.getParent(), I, DL, TII.get(TargetOpcode::COPY), Dst32)

            .addReg(Temp32);

      } else {

        // Handle if there is no super.

        BuildMI(*I.getParent(), I, DL, TII.get(TargetOpcode::COPY), DstReg)

            .addReg(Temp32, {}, X86::sub_16bit);

      }


      I.eraseFromParent();

    }


    return true;

  }


  assert((!SrcReg.isPhysical() || I.isCopy()) &&

         "No phys reg on generic operators");

  assert((DstSize == SrcSize ||

          // Copies are a mean to setup initial types, the number of

          // bits may not exactly match.

          (SrcReg.isPhysical() &&

           DstSize <= RBI.getSizeInBits(SrcReg, MRI, TRI))) &&

         "Copy with different width?!");


  const TargetRegisterClass *DstRC =

      getRegClass(MRI.getType(DstReg), DstRegBank);


  if (SrcRegBank.getID() == X86::GPRRegBankID &&

      DstRegBank.getID() == X86::GPRRegBankID && SrcSize > DstSize &&

      SrcReg.isPhysical()) {

    // Change the physical register to performe truncate.


    const TargetRegisterClass *SrcRC = getRegClassFromGRPhysReg(SrcReg);


    if (DstRC != SrcRC) {

      I.getOperand(1).setSubReg(getSubRegIndex(DstRC));

      I.getOperand(1).substPhysReg(SrcReg, TRI);

    }

  }


  // No need to constrain SrcReg. It will get constrained when

  // we hit another of its use or its defs.

  // Copies do not have constraints.

  const TargetRegisterClass *OldRC = MRI.getRegClassOrNull(DstReg);

  if (!OldRC || !DstRC->hasSubClassEq(OldRC)) {

    if (!RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

      LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                        << " operand\n");

      return false;

    }

  }

  I.setDesc(TII.get(X86::COPY));

  return true;

}


bool X86InstructionSelector::select(MachineInstr &I) {

  assert(I.getParent() && "Instruction should be in a basic block!");

  assert(I.getParent()->getParent() && "Instruction should be in a function!");


  MachineBasicBlock &MBB = *I.getParent();

  MachineFunction &MF = *MBB.getParent();

  MachineRegisterInfo &MRI = MF.getRegInfo();


  unsigned Opcode = I.getOpcode();

  if (!isPreISelGenericOpcode(Opcode) && !I.isPreISelOpcode()) {

    // Certain non-generic instructions also need some special handling.


    if (Opcode == TargetOpcode::LOAD_STACK_GUARD)

      return false;


    if (I.isCopy())

      return selectCopy(I, MRI);


    if (I.isDebugInstr())

      return selectDebugInstr(I, MRI);


    return true;

  }


  assert(I.getNumOperands() == I.getNumExplicitOperands() &&

         "Generic instruction has unexpected implicit operands\n");


  if (selectImpl(I, *CoverageInfo))

    return true;


  LLVM_DEBUG(dbgs() << " C++ instruction selection: "; I.print(dbgs()));


  // TODO: This should be implemented by tblgen.

  switch (I.getOpcode()) {

  default:

    return false;

  case TargetOpcode::G_STORE:

  case TargetOpcode::G_LOAD:

    return selectLoadStoreOp(I, MRI, MF);

  case TargetOpcode::G_PTR_ADD:

  case TargetOpcode::G_FRAME_INDEX:

    return selectFrameIndexOrGep(I, MRI, MF);

  case TargetOpcode::G_GLOBAL_VALUE:

    return selectGlobalValue(I, MRI, MF);

  case TargetOpcode::G_CONSTANT:

    return selectConstant(I, MRI, MF);

  case TargetOpcode::G_FCONSTANT:

    return materializeFP(I, MRI, MF);

  case TargetOpcode::G_PTRTOINT:

  case TargetOpcode::G_TRUNC:

    return selectTruncOrPtrToInt(I, MRI, MF);

  case TargetOpcode::G_INTTOPTR:

  case TargetOpcode::G_FREEZE:

    return selectCopy(I, MRI);

  case TargetOpcode::G_ZEXT:

    return selectZext(I, MRI, MF);

  case TargetOpcode::G_ANYEXT:

    return selectAnyext(I, MRI, MF);

  case TargetOpcode::G_ICMP:

    return selectCmp(I, MRI, MF);

  case TargetOpcode::G_FCMP:

    return selectFCmp(I, MRI, MF);

  case TargetOpcode::G_UADDE:

  case TargetOpcode::G_UADDO:

  case TargetOpcode::G_USUBE:

  case TargetOpcode::G_USUBO:

    return selectUAddSub(I, MRI, MF);

  case TargetOpcode::G_UNMERGE_VALUES:

    return selectUnmergeValues(I, MRI, MF);

  case TargetOpcode::G_MERGE_VALUES:

  case TargetOpcode::G_CONCAT_VECTORS:

    return selectMergeValues(I, MRI, MF);

  case TargetOpcode::G_EXTRACT:

    return selectExtract(I, MRI, MF);

  case TargetOpcode::G_INSERT:

    return selectInsert(I, MRI, MF);

  case TargetOpcode::G_BRCOND:

    return selectCondBranch(I, MRI, MF);

  case TargetOpcode::G_IMPLICIT_DEF:

  case TargetOpcode::G_PHI:

    return selectImplicitDefOrPHI(I, MRI);

  case TargetOpcode::G_MUL:

  case TargetOpcode::G_SMULH:

  case TargetOpcode::G_UMULH:

  case TargetOpcode::G_SDIV:

  case TargetOpcode::G_UDIV:

  case TargetOpcode::G_SREM:

  case TargetOpcode::G_UREM:

    return selectMulDivRem(I, MRI, MF);

  case TargetOpcode::G_SELECT:

    return selectSelect(I, MRI, MF);

  }


  return false;

}


unsigned X86InstructionSelector::getPtrLoadStoreOp(const LLT &Ty,

                                                   const RegisterBank &RB,

                                                   unsigned Opc) const {

  assert((Opc == TargetOpcode::G_STORE || Opc == TargetOpcode::G_LOAD) &&

         "Only G_STORE and G_LOAD are expected for selection");

  if (Ty.isPointer() && X86::GPRRegBankID == RB.getID()) {

    bool IsLoad = (Opc == TargetOpcode::G_LOAD);

    switch (Ty.getSizeInBits()) {

    default:

      break;

    case 32:

      return IsLoad ? X86::MOV32rm : X86::MOV32mr;

    case 64:

      return IsLoad ? X86::MOV64rm : X86::MOV64mr;

    }

  }

  return Opc;

}


unsigned X86InstructionSelector::getLoadStoreOp(const LLT &Ty,

                                                const RegisterBank &RB,

                                                unsigned Opc,

                                                Align Alignment) const {

  bool Isload = (Opc == TargetOpcode::G_LOAD);

  bool HasAVX = STI.hasAVX();

  bool HasAVX512 = STI.hasAVX512();

  bool HasVLX = STI.hasVLX();


  if (Ty == LLT::scalar(8)) {

    if (X86::GPRRegBankID == RB.getID())

      return Isload ? X86::MOV8rm : X86::MOV8mr;

  } else if (Ty == LLT::scalar(16)) {

    if (X86::GPRRegBankID == RB.getID())

      return Isload ? X86::MOV16rm : X86::MOV16mr;

  } else if (Ty == LLT::scalar(32)) {

    if (X86::GPRRegBankID == RB.getID())

      return Isload ? X86::MOV32rm : X86::MOV32mr;

    if (X86::VECRRegBankID == RB.getID())

      return Isload ? (HasAVX512 ? X86::VMOVSSZrm_alt :

                       HasAVX    ? X86::VMOVSSrm_alt :

                                   X86::MOVSSrm_alt)

                    : (HasAVX512 ? X86::VMOVSSZmr :

                       HasAVX    ? X86::VMOVSSmr :

                                   X86::MOVSSmr);

    if (X86::PSRRegBankID == RB.getID())

      return Isload ? X86::LD_Fp32m : X86::ST_Fp32m;

  } else if (Ty == LLT::scalar(64)) {

    if (X86::GPRRegBankID == RB.getID())

      return Isload ? X86::MOV64rm : X86::MOV64mr;

    if (X86::VECRRegBankID == RB.getID())

      return Isload ? (HasAVX512 ? X86::VMOVSDZrm_alt :

                       HasAVX    ? X86::VMOVSDrm_alt :

                                   X86::MOVSDrm_alt)

                    : (HasAVX512 ? X86::VMOVSDZmr :

                       HasAVX    ? X86::VMOVSDmr :

                                   X86::MOVSDmr);

    if (X86::PSRRegBankID == RB.getID())

      return Isload ? X86::LD_Fp64m : X86::ST_Fp64m;

  } else if (Ty == LLT::scalar(80)) {

    return Isload ? X86::LD_Fp80m : X86::ST_FpP80m;

  } else if (Ty.isVector() && Ty.getSizeInBits() == 128) {

    if (Alignment >= Align(16))

      return Isload ? (HasVLX ? X86::VMOVAPSZ128rm

                              : HasAVX512

                                    ? X86::VMOVAPSZ128rm_NOVLX

                                    : HasAVX ? X86::VMOVAPSrm : X86::MOVAPSrm)

                    : (HasVLX ? X86::VMOVAPSZ128mr

                              : HasAVX512

                                    ? X86::VMOVAPSZ128mr_NOVLX

                                    : HasAVX ? X86::VMOVAPSmr : X86::MOVAPSmr);

    else

      return Isload ? (HasVLX ? X86::VMOVUPSZ128rm

                              : HasAVX512

                                    ? X86::VMOVUPSZ128rm_NOVLX

                                    : HasAVX ? X86::VMOVUPSrm : X86::MOVUPSrm)

                    : (HasVLX ? X86::VMOVUPSZ128mr

                              : HasAVX512

                                    ? X86::VMOVUPSZ128mr_NOVLX

                                    : HasAVX ? X86::VMOVUPSmr : X86::MOVUPSmr);

  } else if (Ty.isVector() && Ty.getSizeInBits() == 256) {

    if (Alignment >= Align(32))

      return Isload ? (HasVLX ? X86::VMOVAPSZ256rm

                              : HasAVX512 ? X86::VMOVAPSZ256rm_NOVLX

                                          : X86::VMOVAPSYrm)

                    : (HasVLX ? X86::VMOVAPSZ256mr

                              : HasAVX512 ? X86::VMOVAPSZ256mr_NOVLX

                                          : X86::VMOVAPSYmr);

    else

      return Isload ? (HasVLX ? X86::VMOVUPSZ256rm

                              : HasAVX512 ? X86::VMOVUPSZ256rm_NOVLX

                                          : X86::VMOVUPSYrm)

                    : (HasVLX ? X86::VMOVUPSZ256mr

                              : HasAVX512 ? X86::VMOVUPSZ256mr_NOVLX

                                          : X86::VMOVUPSYmr);

  } else if (Ty.isVector() && Ty.getSizeInBits() == 512) {

    if (Alignment >= Align(64))

      return Isload ? X86::VMOVAPSZrm : X86::VMOVAPSZmr;

    else

      return Isload ? X86::VMOVUPSZrm : X86::VMOVUPSZmr;

  }

  return Opc;

}


// Fill in an address from the given instruction.


static bool X86SelectAddress(MachineInstr &I, const X86TargetMachine &TM,

                             const MachineRegisterInfo &MRI,

                             const X86Subtarget &STI, X86AddressMode &AM) {

  assert(I.getOperand(0).isReg() && "unsupported operand.");

  assert(MRI.getType(I.getOperand(0).getReg()).isPointer() &&

         "unsupported type.");


  switch (I.getOpcode()) {

  default:

    break;

  case TargetOpcode::G_FRAME_INDEX:

    AM.Base.FrameIndex = I.getOperand(1).getIndex();

    AM.BaseType = X86AddressMode::FrameIndexBase;

    return true;

  case TargetOpcode::G_PTR_ADD: {

    if (auto COff = getIConstantVRegSExtVal(I.getOperand(2).getReg(), MRI)) {

      int64_t Imm = *COff;

      if (isInt<32>(Imm)) { // Check for displacement overflow.

        AM.Disp = static_cast<int32_t>(Imm);

        AM.Base.Reg = I.getOperand(1).getReg();

        return true;

      }

    }

    break;

  }

  case TargetOpcode::G_GLOBAL_VALUE: {

    auto GV = I.getOperand(1).getGlobal();

    if (GV->isThreadLocal()) {

      return false; // TODO: we don't support TLS yet.

    }

    // Can't handle alternate code models yet.

    if (TM.getCodeModel() != CodeModel::Small)

      return false;


    unsigned int GVOpFlags = STI.classifyGlobalReference(GV);


    // If it's a stub, we need to do a load to find the real address, and we

    // can't fold that into just an AM. The load will come from lowering this

    // G_GLOBAL_VALUE later.

    if (isGlobalStubReference(GVOpFlags))

      break;


    // If it's not a stub, point AM directly at the global.

    AM.GV = GV;

    AM.GVOpFlags = GVOpFlags;


    // TODO: This reference is relative to the pic base. not supported yet.

    if (isGlobalRelativeToPICBase(AM.GVOpFlags))

      return false;


    if (STI.isPICStyleRIPRel()) {

      // Use rip-relative addressing.

      assert(AM.Base.Reg == 0 && AM.IndexReg == 0 &&

             "RIP-relative addresses can't have additional register operands");

      AM.Base.Reg = X86::RIP;

    }

    return true;

  }

  case TargetOpcode::G_CONSTANT_POOL: {

    // TODO: Need a separate move for Large model

    if (TM.getCodeModel() == CodeModel::Large)

      return false;


    AM.GVOpFlags = STI.classifyLocalReference(nullptr);

    if (AM.GVOpFlags == X86II::MO_GOTOFF)

      AM.Base.Reg = STI.getInstrInfo()->getGlobalBaseReg(I.getMF());

    else if (STI.is64Bit())

      AM.Base.Reg = X86::RIP;

    AM.CP = true;

    AM.Disp = I.getOperand(1).getIndex();

    return true;

  }

  }

  // Default behavior.

  AM.Base.Reg = I.getOperand(0).getReg();

  return true;

}


bool X86InstructionSelector::selectLoadStoreOp(MachineInstr &I,

                                               MachineRegisterInfo &MRI,

                                               MachineFunction &MF) const {

  unsigned Opc = I.getOpcode();


  assert((Opc == TargetOpcode::G_STORE || Opc == TargetOpcode::G_LOAD) &&

         "Only G_STORE and G_LOAD are expected for selection");


  const Register DefReg = I.getOperand(0).getReg();

  LLT Ty = MRI.getType(DefReg);

  const RegisterBank &RB = *RBI.getRegBank(DefReg, MRI, TRI);


  assert(I.hasOneMemOperand());

  auto &MemOp = **I.memoperands_begin();

  if (MemOp.isAtomic()) {

    // Note: for unordered operations, we rely on the fact the appropriate MMO

    // is already on the instruction we're mutating, and thus we don't need to

    // make any changes.  So long as we select an opcode which is capable of

    // loading or storing the appropriate size atomically, the rest of the

    // backend is required to respect the MMO state.

    if (!MemOp.isUnordered()) {

      LLVM_DEBUG(dbgs() << "Atomic ordering not supported yet\n");

      return false;

    }

    if (MemOp.getAlign() < Ty.getSizeInBits() / 8) {

      LLVM_DEBUG(dbgs() << "Unaligned atomics not supported yet\n");

      return false;

    }

  }


  unsigned NewOpc = getPtrLoadStoreOp(Ty, RB, Opc);

  if (NewOpc == Opc)

    return false;


  I.setDesc(TII.get(NewOpc));

  MachineInstrBuilder MIB(MF, I);

  MachineInstr *Ptr = MRI.getVRegDef(I.getOperand(1).getReg());


  X86AddressMode AM;

  if (!X86SelectAddress(*Ptr, TM, MRI, STI, AM))

    return false;


  if (Opc == TargetOpcode::G_LOAD) {

    I.removeOperand(1);

    addFullAddress(MIB, AM);

  } else {

    // G_STORE (VAL, Addr), X86Store instruction (Addr, VAL)

    I.removeOperand(1);

    I.removeOperand(0);

    addFullAddress(MIB, AM).addUse(DefReg);

  }

  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  I.addImplicitDefUseOperands(MF);

  return true;

}


static unsigned getLeaOP(LLT Ty, const X86Subtarget &STI) {

  if (Ty == LLT::pointer(0, 64))

    return X86::LEA64r;

  else if (Ty == LLT::pointer(0, 32))

    return STI.isTarget64BitILP32() ? X86::LEA64_32r : X86::LEA32r;

  else

    llvm_unreachable("Can't get LEA opcode. Unsupported type.");

}


bool X86InstructionSelector::selectFrameIndexOrGep(MachineInstr &I,

                                                   MachineRegisterInfo &MRI,

                                                   MachineFunction &MF) const {

  unsigned Opc = I.getOpcode();


  assert((Opc == TargetOpcode::G_FRAME_INDEX || Opc == TargetOpcode::G_PTR_ADD) &&

         "unexpected instruction");


  const Register DefReg = I.getOperand(0).getReg();

  LLT Ty = MRI.getType(DefReg);


  // Use LEA to calculate frame index and GEP

  unsigned NewOpc = getLeaOP(Ty, STI);

  I.setDesc(TII.get(NewOpc));

  MachineInstrBuilder MIB(MF, I);


  if (Opc == TargetOpcode::G_FRAME_INDEX) {

    addOffset(MIB, 0);

  } else {

    MachineOperand &InxOp = I.getOperand(2);

    I.addOperand(InxOp);        // set IndexReg

    InxOp.ChangeToImmediate(1); // set Scale

    MIB.addImm(0).addReg(0);

  }


  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  return true;

}


bool X86InstructionSelector::selectGlobalValue(MachineInstr &I,

                                               MachineRegisterInfo &MRI,

                                               MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_GLOBAL_VALUE) &&

         "unexpected instruction");


  X86AddressMode AM;

  unsigned NewOpc;


  const GlobalValue *GV = I.getOperand(1).getGlobal();

  const auto GVOpFlags = STI.classifyGlobalReference(GV);

  if (isGlobalStubReference(GVOpFlags)) {

    // If it's a stub, we need a load from the GOT instead of lea.

    AM.GV = GV;

    AM.GVOpFlags = GVOpFlags;

    if (STI.isPICStyleRIPRel() || AM.GVOpFlags == X86II::MO_GOTPCREL ||

        AM.GVOpFlags == X86II::MO_GOTPCREL_NORELAX)

      AM.Base.Reg = X86::RIP;


    NewOpc = STI.isTarget64BitLP64() ? X86::MOV64rm : X86::MOV32rm;

  } else {

    if (!X86SelectAddress(I, TM, MRI, STI, AM))

      return false;


    const Register DefReg = I.getOperand(0).getReg();

    LLT Ty = MRI.getType(DefReg);

    NewOpc = getLeaOP(Ty, STI);

  }


  I.setDesc(TII.get(NewOpc));

  MachineInstrBuilder MIB(MF, I);


  I.removeOperand(1);

  addFullAddress(MIB, AM);


  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  return true;

}


bool X86InstructionSelector::selectConstant(MachineInstr &I,

                                            MachineRegisterInfo &MRI,

                                            MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_CONSTANT) &&

         "unexpected instruction");


  const Register DefReg = I.getOperand(0).getReg();

  LLT Ty = MRI.getType(DefReg);


  if (RBI.getRegBank(DefReg, MRI, TRI)->getID() != X86::GPRRegBankID)

    return false;


  uint64_t Val = 0;

  if (I.getOperand(1).isCImm()) {

    Val = I.getOperand(1).getCImm()->getZExtValue();

    I.getOperand(1).ChangeToImmediate(Val);

  } else if (I.getOperand(1).isImm()) {

    Val = I.getOperand(1).getImm();

  } else

    llvm_unreachable("Unsupported operand type.");


  unsigned NewOpc;

  switch (Ty.getSizeInBits()) {

  case 8:

    NewOpc = X86::MOV8ri;

    break;

  case 16:

    NewOpc = X86::MOV16ri;

    break;

  case 32:

    NewOpc = X86::MOV32ri;

    break;

  case 64:

    if (isUInt<32>(Val))

      NewOpc = X86::MOV32ri64;

    else if (isInt<32>(Val))

      NewOpc = X86::MOV64ri32;

    else

      NewOpc = X86::MOV64ri;

    break;

  default:

    llvm_unreachable("Can't select G_CONSTANT, unsupported type.");

  }


  I.setDesc(TII.get(NewOpc));

  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  return true;

}


// Helper function for selectTruncOrPtrToInt and selectAnyext.

// Returns true if DstRC lives on a floating register class and

// SrcRC lives on a 128-bit vector class.


static bool canTurnIntoCOPY(const TargetRegisterClass *DstRC,

                            const TargetRegisterClass *SrcRC) {

  return (DstRC == &X86::FR32RegClass || DstRC == &X86::FR32XRegClass ||

          DstRC == &X86::FR64RegClass || DstRC == &X86::FR64XRegClass) &&

         (SrcRC == &X86::VR128RegClass || SrcRC == &X86::VR128XRegClass);

}


bool X86InstructionSelector::selectTurnIntoCOPY(

    MachineInstr &I, MachineRegisterInfo &MRI, const Register DstReg,

    const TargetRegisterClass *DstRC, const Register SrcReg,

    const TargetRegisterClass *SrcRC) const {


  if (!RBI.constrainGenericRegister(SrcReg, *SrcRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                      << " operand\n");

    return false;

  }

  I.setDesc(TII.get(X86::COPY));

  return true;

}


bool X86InstructionSelector::selectTruncOrPtrToInt(MachineInstr &I,

                                                   MachineRegisterInfo &MRI,

                                                   MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_TRUNC ||

          I.getOpcode() == TargetOpcode::G_PTRTOINT) &&

         "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register SrcReg = I.getOperand(1).getReg();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);


  const RegisterBank &DstRB = *RBI.getRegBank(DstReg, MRI, TRI);

  const RegisterBank &SrcRB = *RBI.getRegBank(SrcReg, MRI, TRI);


  if (DstRB.getID() != SrcRB.getID()) {

    LLVM_DEBUG(dbgs() << TII.getName(I.getOpcode())

                      << " input/output on different banks\n");

    return false;

  }


  const TargetRegisterClass *DstRC = getRegClass(DstTy, DstRB);

  const TargetRegisterClass *SrcRC = getRegClass(SrcTy, SrcRB);


  if (!DstRC || !SrcRC)

    return false;


  // If that's truncation of the value that lives on the vector class and goes

  // into the floating class, just replace it with copy, as we are able to

  // select it as a regular move.

  if (canTurnIntoCOPY(DstRC, SrcRC))

    return selectTurnIntoCOPY(I, MRI, DstReg, DstRC, SrcReg, SrcRC);


  if (DstRB.getID() != X86::GPRRegBankID)

    return false;


  unsigned SubIdx;

  if (DstRC == SrcRC) {

    // Nothing to be done

    SubIdx = X86::NoSubRegister;

  } else if (DstRC == &X86::GR32RegClass) {

    SubIdx = X86::sub_32bit;

  } else if (DstRC == &X86::GR16RegClass) {

    SubIdx = X86::sub_16bit;

  } else if (DstRC == &X86::GR8RegClass) {

    SubIdx = X86::sub_8bit;

  } else {

    return false;

  }


  SrcRC = TRI.getSubClassWithSubReg(SrcRC, SubIdx);


  if (!RBI.constrainGenericRegister(SrcReg, *SrcRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                      << "\n");

    return false;

  }


  I.getOperand(1).setSubReg(SubIdx);


  I.setDesc(TII.get(X86::COPY));

  return true;

}


bool X86InstructionSelector::selectZext(MachineInstr &I,

                                        MachineRegisterInfo &MRI,

                                        MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_ZEXT) && "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register SrcReg = I.getOperand(1).getReg();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);


  assert(!(SrcTy == LLT::scalar(8) && DstTy == LLT::scalar(16)) &&

         "8=>16 Zext is handled by tablegen");

  assert(!(SrcTy == LLT::scalar(8) && DstTy == LLT::scalar(32)) &&

         "8=>32 Zext is handled by tablegen");

  assert(!(SrcTy == LLT::scalar(16) && DstTy == LLT::scalar(32)) &&

         "16=>32 Zext is handled by tablegen");

  assert(!(SrcTy == LLT::scalar(8) && DstTy == LLT::scalar(64)) &&

         "8=>64 Zext is handled by tablegen");

  assert(!(SrcTy == LLT::scalar(16) && DstTy == LLT::scalar(64)) &&

         "16=>64 Zext is handled by tablegen");

  assert(!(SrcTy == LLT::scalar(32) && DstTy == LLT::scalar(64)) &&

         "32=>64 Zext is handled by tablegen");


  if (SrcTy != LLT::scalar(1))

    return false;


  unsigned AndOpc;

  if (DstTy == LLT::scalar(8))

    AndOpc = X86::AND8ri;

  else if (DstTy == LLT::scalar(16))

    AndOpc = X86::AND16ri;

  else if (DstTy == LLT::scalar(32))

    AndOpc = X86::AND32ri;

  else if (DstTy == LLT::scalar(64))

    AndOpc = X86::AND64ri32;

  else

    return false;


  Register DefReg = SrcReg;

  if (DstTy != LLT::scalar(8)) {

    Register ImpDefReg =

        MRI.createVirtualRegister(getRegClass(DstTy, DstReg, MRI));

    BuildMI(*I.getParent(), I, I.getDebugLoc(),

            TII.get(TargetOpcode::IMPLICIT_DEF), ImpDefReg);


    DefReg = MRI.createVirtualRegister(getRegClass(DstTy, DstReg, MRI));

    BuildMI(*I.getParent(), I, I.getDebugLoc(),

            TII.get(TargetOpcode::INSERT_SUBREG), DefReg)

        .addReg(ImpDefReg)

        .addReg(SrcReg)

        .addImm(X86::sub_8bit);

  }


  MachineInstr &AndInst =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(AndOpc), DstReg)

           .addReg(DefReg)

           .addImm(1);


  constrainSelectedInstRegOperands(AndInst, TII, TRI, RBI);


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectAnyext(MachineInstr &I,

                                          MachineRegisterInfo &MRI,

                                          MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_ANYEXT) && "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register SrcReg = I.getOperand(1).getReg();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);


  const RegisterBank &DstRB = *RBI.getRegBank(DstReg, MRI, TRI);

  const RegisterBank &SrcRB = *RBI.getRegBank(SrcReg, MRI, TRI);


  assert(DstRB.getID() == SrcRB.getID() &&

         "G_ANYEXT input/output on different banks\n");


  assert(DstTy.getSizeInBits() > SrcTy.getSizeInBits() &&

         "G_ANYEXT incorrect operand size");


  const TargetRegisterClass *DstRC = getRegClass(DstTy, DstRB);

  const TargetRegisterClass *SrcRC = getRegClass(SrcTy, SrcRB);


  // If that's ANY_EXT of the value that lives on the floating class and goes

  // into the vector class, just replace it with copy, as we are able to select

  // it as a regular move.

  if (canTurnIntoCOPY(SrcRC, DstRC))

    return selectTurnIntoCOPY(I, MRI, SrcReg, SrcRC, DstReg, DstRC);


  if (DstRB.getID() != X86::GPRRegBankID)

    return false;


  if (!RBI.constrainGenericRegister(SrcReg, *SrcRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                      << " operand\n");

    return false;

  }


  if (SrcRC == DstRC) {

    I.setDesc(TII.get(X86::COPY));

    return true;

  }


  BuildMI(*I.getParent(), I, I.getDebugLoc(),

          TII.get(TargetOpcode::SUBREG_TO_REG))

      .addDef(DstReg)

      .addReg(SrcReg)

      .addImm(getSubRegIndex(SrcRC));


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectCmp(MachineInstr &I,

                                       MachineRegisterInfo &MRI,

                                       MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_ICMP) && "unexpected instruction");


  X86::CondCode CC;

  bool SwapArgs;

  std::tie(CC, SwapArgs) = X86::getX86ConditionCode(

      (CmpInst::Predicate)I.getOperand(1).getPredicate());


  Register LHS = I.getOperand(2).getReg();

  Register RHS = I.getOperand(3).getReg();


  if (SwapArgs)

    std::swap(LHS, RHS);


  unsigned OpCmp;

  LLT Ty = MRI.getType(LHS);


  switch (Ty.getSizeInBits()) {

  default:

    return false;

  case 8:

    OpCmp = X86::CMP8rr;

    break;

  case 16:

    OpCmp = X86::CMP16rr;

    break;

  case 32:

    OpCmp = X86::CMP32rr;

    break;

  case 64:

    OpCmp = X86::CMP64rr;

    break;

  }


  MachineInstr &CmpInst =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(OpCmp))

           .addReg(LHS)

           .addReg(RHS);


  MachineInstr &SetInst = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                   TII.get(X86::SETCCr), I.getOperand(0).getReg()).addImm(CC);


  constrainSelectedInstRegOperands(CmpInst, TII, TRI, RBI);

  constrainSelectedInstRegOperands(SetInst, TII, TRI, RBI);


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectFCmp(MachineInstr &I,

                                        MachineRegisterInfo &MRI,

                                        MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_FCMP) && "unexpected instruction");


  Register LhsReg = I.getOperand(2).getReg();

  Register RhsReg = I.getOperand(3).getReg();

  CmpInst::Predicate Predicate =

      (CmpInst::Predicate)I.getOperand(1).getPredicate();


  // FCMP_OEQ and FCMP_UNE cannot be checked with a single instruction.

  static const uint16_t SETFOpcTable[2][3] = {

      {X86::COND_E, X86::COND_NP, X86::AND8rr},

      {X86::COND_NE, X86::COND_P, X86::OR8rr}};

  const uint16_t *SETFOpc = nullptr;

  switch (Predicate) {

  default:

    break;

  case CmpInst::FCMP_OEQ:

    SETFOpc = &SETFOpcTable[0][0];

    break;

  case CmpInst::FCMP_UNE:

    SETFOpc = &SETFOpcTable[1][0];

    break;

  }


  assert((LhsReg.isVirtual() && RhsReg.isVirtual()) &&

         "Both arguments of FCMP need to be virtual!");

  auto *LhsBank = RBI.getRegBank(LhsReg, MRI, TRI);

  [[maybe_unused]] auto *RhsBank = RBI.getRegBank(RhsReg, MRI, TRI);

  assert((LhsBank == RhsBank) &&

         "Both banks assigned to FCMP arguments need to be same!");


  // Compute the opcode for the CMP instruction.

  unsigned OpCmp;

  LLT Ty = MRI.getType(LhsReg);

  switch (Ty.getSizeInBits()) {

  default:

    return false;

  case 32:

    OpCmp = LhsBank->getID() == X86::PSRRegBankID ? X86::UCOM_FpIr32

                                                  : X86::UCOMISSrr;

    break;

  case 64:

    OpCmp = LhsBank->getID() == X86::PSRRegBankID ? X86::UCOM_FpIr64

                                                  : X86::UCOMISDrr;

    break;

  case 80:

    OpCmp = X86::UCOM_FpIr80;

    break;

  }


  Register ResultReg = I.getOperand(0).getReg();

  RBI.constrainGenericRegister(

      ResultReg,

      *getRegClass(LLT::scalar(8), *RBI.getRegBank(ResultReg, MRI, TRI)), MRI);

  if (SETFOpc) {

    MachineInstr &CmpInst =

        *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(OpCmp))

             .addReg(LhsReg)

             .addReg(RhsReg);


    Register FlagReg1 = MRI.createVirtualRegister(&X86::GR8RegClass);

    Register FlagReg2 = MRI.createVirtualRegister(&X86::GR8RegClass);

    MachineInstr &Set1 = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                  TII.get(X86::SETCCr), FlagReg1).addImm(SETFOpc[0]);

    MachineInstr &Set2 = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                  TII.get(X86::SETCCr), FlagReg2).addImm(SETFOpc[1]);

    MachineInstr &Set3 = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                  TII.get(SETFOpc[2]), ResultReg)

                              .addReg(FlagReg1)

                              .addReg(FlagReg2);

    constrainSelectedInstRegOperands(CmpInst, TII, TRI, RBI);

    constrainSelectedInstRegOperands(Set1, TII, TRI, RBI);

    constrainSelectedInstRegOperands(Set2, TII, TRI, RBI);

    constrainSelectedInstRegOperands(Set3, TII, TRI, RBI);


    I.eraseFromParent();

    return true;

  }


  X86::CondCode CC;

  bool SwapArgs;

  std::tie(CC, SwapArgs) = X86::getX86ConditionCode(Predicate);

  assert(CC <= X86::LAST_VALID_COND && "Unexpected condition code.");


  if (SwapArgs)

    std::swap(LhsReg, RhsReg);


  // Emit a compare of LHS/RHS.

  MachineInstr &CmpInst =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(OpCmp))

           .addReg(LhsReg)

           .addReg(RhsReg);


  MachineInstr &Set =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::SETCCr), ResultReg).addImm(CC);

  constrainSelectedInstRegOperands(CmpInst, TII, TRI, RBI);

  constrainSelectedInstRegOperands(Set, TII, TRI, RBI);

  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectUAddSub(MachineInstr &I,

                                           MachineRegisterInfo &MRI,

                                           MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_UADDE ||

          I.getOpcode() == TargetOpcode::G_UADDO ||

          I.getOpcode() == TargetOpcode::G_USUBE ||

          I.getOpcode() == TargetOpcode::G_USUBO) &&

         "unexpected instruction");


  auto &CarryMI = cast<GAddSubCarryOut>(I);


  const Register DstReg = CarryMI.getDstReg();

  const Register CarryOutReg = CarryMI.getCarryOutReg();

  const Register Op0Reg = CarryMI.getLHSReg();

  const Register Op1Reg = CarryMI.getRHSReg();

  bool IsSub = CarryMI.isSub();


  const LLT DstTy = MRI.getType(DstReg);

  assert(DstTy.isScalar() && "selectUAddSub only supported for scalar types");


  // TODO: Handle immediate argument variants?

  unsigned OpADC, OpADD, OpSBB, OpSUB;

  switch (DstTy.getSizeInBits()) {

  case 8:

    OpADC = X86::ADC8rr;

    OpADD = X86::ADD8rr;

    OpSBB = X86::SBB8rr;

    OpSUB = X86::SUB8rr;

    break;

  case 16:

    OpADC = X86::ADC16rr;

    OpADD = X86::ADD16rr;

    OpSBB = X86::SBB16rr;

    OpSUB = X86::SUB16rr;

    break;

  case 32:

    OpADC = X86::ADC32rr;

    OpADD = X86::ADD32rr;

    OpSBB = X86::SBB32rr;

    OpSUB = X86::SUB32rr;

    break;

  case 64:

    OpADC = X86::ADC64rr;

    OpADD = X86::ADD64rr;

    OpSBB = X86::SBB64rr;

    OpSUB = X86::SUB64rr;

    break;

  default:

    llvm_unreachable("selectUAddSub unsupported type.");

  }


  const RegisterBank &CarryRB = *RBI.getRegBank(CarryOutReg, MRI, TRI);

  const TargetRegisterClass *CarryRC =

      getRegClass(MRI.getType(CarryOutReg), CarryRB);


  unsigned Opcode = IsSub ? OpSUB : OpADD;


  // G_UADDE/G_USUBE - find CarryIn def instruction.

  if (auto CarryInMI = dyn_cast<GAddSubCarryInOut>(&I)) {

    Register CarryInReg = CarryInMI->getCarryInReg();

    MachineInstr *Def = MRI.getVRegDef(CarryInReg);

    while (Def->getOpcode() == TargetOpcode::G_TRUNC) {

      CarryInReg = Def->getOperand(1).getReg();

      Def = MRI.getVRegDef(CarryInReg);

    }


    // TODO - handle more CF generating instructions

    if (Def->getOpcode() == TargetOpcode::G_UADDE ||

        Def->getOpcode() == TargetOpcode::G_UADDO ||

        Def->getOpcode() == TargetOpcode::G_USUBE ||

        Def->getOpcode() == TargetOpcode::G_USUBO) {

      // carry set by prev ADD/SUB.


      BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::CMP8ri))

          .addReg(CarryInReg)

          .addImm(1);


      if (!RBI.constrainGenericRegister(CarryInReg, *CarryRC, MRI))

        return false;


      Opcode = IsSub ? OpSBB : OpADC;

    } else if (auto val = getIConstantVRegVal(CarryInReg, MRI)) {

      // carry is constant, support only 0.

      if (*val != 0)

        return false;


      Opcode = IsSub ? OpSUB : OpADD;

    } else

      return false;

  }


  MachineInstr &Inst =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(Opcode), DstReg)

           .addReg(Op0Reg)

           .addReg(Op1Reg);


  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::SETCCr), CarryOutReg)

      .addImm(X86::COND_B);


  constrainSelectedInstRegOperands(Inst, TII, TRI, RBI);

  if (!RBI.constrainGenericRegister(CarryOutReg, *CarryRC, MRI))

    return false;


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectExtract(MachineInstr &I,

                                           MachineRegisterInfo &MRI,

                                           MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_EXTRACT) &&

         "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register SrcReg = I.getOperand(1).getReg();

  int64_t Index = I.getOperand(2).getImm();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);


  // Meanwile handle vector type only.

  if (!DstTy.isVector())

    return false;


  if (Index % DstTy.getSizeInBits() != 0)

    return false; // Not extract subvector.


  if (Index == 0) {

    // Replace by extract subreg copy.

    if (!emitExtractSubreg(DstReg, SrcReg, I, MRI, MF))

      return false;


    I.eraseFromParent();

    return true;

  }


  bool HasAVX = STI.hasAVX();

  bool HasAVX512 = STI.hasAVX512();

  bool HasVLX = STI.hasVLX();


  if (SrcTy.getSizeInBits() == 256 && DstTy.getSizeInBits() == 128) {

    if (HasVLX)

      I.setDesc(TII.get(X86::VEXTRACTF32X4Z256rri));

    else if (HasAVX)

      I.setDesc(TII.get(X86::VEXTRACTF128rri));

    else

      return false;

  } else if (SrcTy.getSizeInBits() == 512 && HasAVX512) {

    if (DstTy.getSizeInBits() == 128)

      I.setDesc(TII.get(X86::VEXTRACTF32X4Zrri));

    else if (DstTy.getSizeInBits() == 256)

      I.setDesc(TII.get(X86::VEXTRACTF64X4Zrri));

    else

      return false;

  } else

    return false;


  // Convert to X86 VEXTRACT immediate.

  Index = Index / DstTy.getSizeInBits();

  I.getOperand(2).setImm(Index);


  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  return true;

}


bool X86InstructionSelector::emitExtractSubreg(Register DstReg, Register SrcReg,

                                               MachineInstr &I,

                                               MachineRegisterInfo &MRI,

                                               MachineFunction &MF) const {

  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);

  unsigned SubIdx = X86::NoSubRegister;


  if (!DstTy.isVector() || !SrcTy.isVector())

    return false;


  assert(SrcTy.getSizeInBits() > DstTy.getSizeInBits() &&

         "Incorrect Src/Dst register size");


  if (DstTy.getSizeInBits() == 128)

    SubIdx = X86::sub_xmm;

  else if (DstTy.getSizeInBits() == 256)

    SubIdx = X86::sub_ymm;

  else

    return false;


  const TargetRegisterClass *DstRC = getRegClass(DstTy, DstReg, MRI);

  const TargetRegisterClass *SrcRC = getRegClass(SrcTy, SrcReg, MRI);


  SrcRC = TRI.getSubClassWithSubReg(SrcRC, SubIdx);


  if (!RBI.constrainGenericRegister(SrcReg, *SrcRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain EXTRACT_SUBREG\n");

    return false;

  }


  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::COPY), DstReg)

      .addReg(SrcReg, {}, SubIdx);


  return true;

}


bool X86InstructionSelector::emitInsertSubreg(Register DstReg, Register SrcReg,

                                              MachineInstr &I,

                                              MachineRegisterInfo &MRI,

                                              MachineFunction &MF) const {

  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg);

  unsigned SubIdx = X86::NoSubRegister;


  // TODO: support scalar types

  if (!DstTy.isVector() || !SrcTy.isVector())

    return false;


  assert(SrcTy.getSizeInBits() < DstTy.getSizeInBits() &&

         "Incorrect Src/Dst register size");


  if (SrcTy.getSizeInBits() == 128)

    SubIdx = X86::sub_xmm;

  else if (SrcTy.getSizeInBits() == 256)

    SubIdx = X86::sub_ymm;

  else

    return false;


  const TargetRegisterClass *SrcRC = getRegClass(SrcTy, SrcReg, MRI);

  const TargetRegisterClass *DstRC = getRegClass(DstTy, DstReg, MRI);


  if (!RBI.constrainGenericRegister(SrcReg, *SrcRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain INSERT_SUBREG\n");

    return false;

  }


  Register ImpDefReg = MRI.createVirtualRegister(DstRC);

  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::IMPLICIT_DEF),

          ImpDefReg);


  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::INSERT_SUBREG),

          DstReg)

      .addReg(ImpDefReg)

      .addReg(SrcReg)

      .addImm(SubIdx);


  return true;

}


bool X86InstructionSelector::selectInsert(MachineInstr &I,

                                          MachineRegisterInfo &MRI,

                                          MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_INSERT) && "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register SrcReg = I.getOperand(1).getReg();

  const Register InsertReg = I.getOperand(2).getReg();

  int64_t Index = I.getOperand(3).getImm();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT InsertRegTy = MRI.getType(InsertReg);


  // Meanwile handle vector type only.

  if (!DstTy.isVector())

    return false;


  if (Index % InsertRegTy.getSizeInBits() != 0)

    return false; // Not insert subvector.


  if (Index == 0 && MRI.getVRegDef(SrcReg)->isImplicitDef()) {

    // Replace by subreg copy.

    if (!emitInsertSubreg(DstReg, InsertReg, I, MRI, MF))

      return false;


    I.eraseFromParent();

    return true;

  }


  bool HasAVX = STI.hasAVX();

  bool HasAVX512 = STI.hasAVX512();

  bool HasVLX = STI.hasVLX();


  if (DstTy.getSizeInBits() == 256 && InsertRegTy.getSizeInBits() == 128) {

    if (HasVLX)

      I.setDesc(TII.get(X86::VINSERTF32X4Z256rri));

    else if (HasAVX)

      I.setDesc(TII.get(X86::VINSERTF128rri));

    else

      return false;

  } else if (DstTy.getSizeInBits() == 512 && HasAVX512) {

    if (InsertRegTy.getSizeInBits() == 128)

      I.setDesc(TII.get(X86::VINSERTF32X4Zrri));

    else if (InsertRegTy.getSizeInBits() == 256)

      I.setDesc(TII.get(X86::VINSERTF64X4Zrri));

    else

      return false;

  } else

    return false;


  // Convert to X86 VINSERT immediate.

  Index = Index / InsertRegTy.getSizeInBits();


  I.getOperand(3).setImm(Index);


  constrainSelectedInstRegOperands(I, TII, TRI, RBI);

  return true;

}


bool X86InstructionSelector::selectUnmergeValues(

    MachineInstr &I, MachineRegisterInfo &MRI, MachineFunction &MF) {

  assert((I.getOpcode() == TargetOpcode::G_UNMERGE_VALUES) &&

         "unexpected instruction");


  // Split to extracts.

  unsigned NumDefs = I.getNumOperands() - 1;

  Register SrcReg = I.getOperand(NumDefs).getReg();

  unsigned DefSize = MRI.getType(I.getOperand(0).getReg()).getSizeInBits();


  for (unsigned Idx = 0; Idx < NumDefs; ++Idx) {

    MachineInstr &ExtrInst =

        *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                 TII.get(TargetOpcode::G_EXTRACT), I.getOperand(Idx).getReg())

             .addReg(SrcReg)

             .addImm(Idx * DefSize);


    if (!select(ExtrInst))

      return false;

  }


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectMergeValues(

    MachineInstr &I, MachineRegisterInfo &MRI, MachineFunction &MF) {

  assert((I.getOpcode() == TargetOpcode::G_MERGE_VALUES ||

          I.getOpcode() == TargetOpcode::G_CONCAT_VECTORS) &&

         "unexpected instruction");


  // Split to inserts.

  Register DstReg = I.getOperand(0).getReg();

  Register SrcReg0 = I.getOperand(1).getReg();


  const LLT DstTy = MRI.getType(DstReg);

  const LLT SrcTy = MRI.getType(SrcReg0);

  unsigned SrcSize = SrcTy.getSizeInBits();


  const RegisterBank &RegBank = *RBI.getRegBank(DstReg, MRI, TRI);


  // For the first src use insertSubReg.

  Register DefReg = MRI.createGenericVirtualRegister(DstTy);

  MRI.setRegBank(DefReg, RegBank);

  if (!emitInsertSubreg(DefReg, I.getOperand(1).getReg(), I, MRI, MF))

    return false;


  for (unsigned Idx = 2; Idx < I.getNumOperands(); ++Idx) {

    Register Tmp = MRI.createGenericVirtualRegister(DstTy);

    MRI.setRegBank(Tmp, RegBank);


    MachineInstr &InsertInst = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                        TII.get(TargetOpcode::G_INSERT), Tmp)

                                    .addReg(DefReg)

                                    .addReg(I.getOperand(Idx).getReg())

                                    .addImm((Idx - 1) * SrcSize);


    DefReg = Tmp;


    if (!select(InsertInst))

      return false;

  }


  MachineInstr &CopyInst = *BuildMI(*I.getParent(), I, I.getDebugLoc(),

                                    TII.get(TargetOpcode::COPY), DstReg)

                                .addReg(DefReg);


  if (!select(CopyInst))

    return false;


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectCondBranch(MachineInstr &I,

                                              MachineRegisterInfo &MRI,

                                              MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_BRCOND) && "unexpected instruction");


  const Register CondReg = I.getOperand(0).getReg();

  MachineBasicBlock *DestMBB = I.getOperand(1).getMBB();


  MachineInstr &TestInst =

      *BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::TEST8ri))

           .addReg(CondReg)

           .addImm(1);

  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::JCC_1))

      .addMBB(DestMBB).addImm(X86::COND_NE);


  constrainSelectedInstRegOperands(TestInst, TII, TRI, RBI);


  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::materializeFP(MachineInstr &I,

                                           MachineRegisterInfo &MRI,

                                           MachineFunction &MF) const {

  assert((I.getOpcode() == TargetOpcode::G_FCONSTANT) &&

         "unexpected instruction");


  // Can't handle alternate code models yet.

  CodeModel::Model CM = TM.getCodeModel();

  if (CM != CodeModel::Small && CM != CodeModel::Large)

    return false;


  const Register DstReg = I.getOperand(0).getReg();

  const LLT DstTy = MRI.getType(DstReg);

  const RegisterBank &RegBank = *RBI.getRegBank(DstReg, MRI, TRI);

  // Create the load from the constant pool.

  const ConstantFP *CFP = I.getOperand(1).getFPImm();

  const auto &DL = MF.getDataLayout();

  Align Alignment = DL.getPrefTypeAlign(CFP->getType());

  const DebugLoc &DbgLoc = I.getDebugLoc();


  unsigned Opc =

      getLoadStoreOp(DstTy, RegBank, TargetOpcode::G_LOAD, Alignment);


  unsigned CPI = MF.getConstantPool()->getConstantPoolIndex(CFP, Alignment);

  MachineInstr *LoadInst = nullptr;

  unsigned char OpFlag = STI.classifyLocalReference(nullptr);


  if (CM == CodeModel::Large && STI.is64Bit()) {

    // Under X86-64 non-small code model, GV (and friends) are 64-bits, so

    // they cannot be folded into immediate fields.


    Register AddrReg = MRI.createVirtualRegister(&X86::GR64RegClass);

    BuildMI(*I.getParent(), I, DbgLoc, TII.get(X86::MOV64ri), AddrReg)

        .addConstantPoolIndex(CPI, 0, OpFlag);


    MachineMemOperand *MMO = MF.getMachineMemOperand(

        MachinePointerInfo::getConstantPool(MF), MachineMemOperand::MOLoad,

        LLT::pointer(0, DL.getPointerSizeInBits()), Alignment);


    LoadInst =

        addDirectMem(BuildMI(*I.getParent(), I, DbgLoc, TII.get(Opc), DstReg),

                     AddrReg)

            .addMemOperand(MMO);


  } else if (CM == CodeModel::Small || !STI.is64Bit()) {

    // Handle the case when globals fit in our immediate field.

    // This is true for X86-32 always and X86-64 when in -mcmodel=small mode.


    // x86-32 PIC requires a PIC base register for constant pools.

    unsigned PICBase = 0;

    if (OpFlag == X86II::MO_PIC_BASE_OFFSET || OpFlag == X86II::MO_GOTOFF) {

      // PICBase can be allocated by TII.getGlobalBaseReg(&MF).

      // In DAGISEL the code that initialize it generated by the CGBR pass.

      return false; // TODO support the mode.

    } else if (STI.is64Bit() && TM.getCodeModel() == CodeModel::Small)

      PICBase = X86::RIP;


    LoadInst = addConstantPoolReference(

        BuildMI(*I.getParent(), I, DbgLoc, TII.get(Opc), DstReg), CPI, PICBase,

        OpFlag);

  } else

    return false;


  constrainSelectedInstRegOperands(*LoadInst, TII, TRI, RBI);

  I.eraseFromParent();

  return true;

}


bool X86InstructionSelector::selectImplicitDefOrPHI(

    MachineInstr &I, MachineRegisterInfo &MRI) const {

  assert((I.getOpcode() == TargetOpcode::G_IMPLICIT_DEF ||

          I.getOpcode() == TargetOpcode::G_PHI) &&

         "unexpected instruction");


  Register DstReg = I.getOperand(0).getReg();


  if (!MRI.getRegClassOrNull(DstReg)) {

    const LLT DstTy = MRI.getType(DstReg);

    const TargetRegisterClass *RC = getRegClass(DstTy, DstReg, MRI);


    if (!RBI.constrainGenericRegister(DstReg, *RC, MRI)) {

      LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                        << " operand\n");

      return false;

    }

  }


  if (I.getOpcode() == TargetOpcode::G_IMPLICIT_DEF)

    I.setDesc(TII.get(X86::IMPLICIT_DEF));

  else

    I.setDesc(TII.get(X86::PHI));


  return true;

}


bool X86InstructionSelector::selectMulDivRem(MachineInstr &I,

                                             MachineRegisterInfo &MRI,

                                             MachineFunction &MF) const {

  // The implementation of this function is adapted from X86FastISel.

  assert((I.getOpcode() == TargetOpcode::G_MUL ||

          I.getOpcode() == TargetOpcode::G_SMULH ||

          I.getOpcode() == TargetOpcode::G_UMULH ||

          I.getOpcode() == TargetOpcode::G_SDIV ||

          I.getOpcode() == TargetOpcode::G_SREM ||

          I.getOpcode() == TargetOpcode::G_UDIV ||

          I.getOpcode() == TargetOpcode::G_UREM) &&

         "unexpected instruction");


  const Register DstReg = I.getOperand(0).getReg();

  const Register Op1Reg = I.getOperand(1).getReg();

  const Register Op2Reg = I.getOperand(2).getReg();


  const LLT RegTy = MRI.getType(DstReg);

  assert(RegTy == MRI.getType(Op1Reg) && RegTy == MRI.getType(Op2Reg) &&

         "Arguments and return value types must match");


  const RegisterBank *RegRB = RBI.getRegBank(DstReg, MRI, TRI);

  if (!RegRB || RegRB->getID() != X86::GPRRegBankID)

    return false;


  const static unsigned NumTypes = 4; // i8, i16, i32, i64

  const static unsigned NumOps = 7;   // SDiv/SRem/UDiv/URem/Mul/SMulH/UMulh

  const static bool S = true;         // IsSigned

  const static bool U = false;        // !IsSigned

  const static unsigned Copy = TargetOpcode::COPY;


  // For the X86 IDIV instruction, in most cases the dividend

  // (numerator) must be in a specific register pair highreg:lowreg,

  // producing the quotient in lowreg and the remainder in highreg.

  // For most data types, to set up the instruction, the dividend is

  // copied into lowreg, and lowreg is sign-extended into highreg.  The

  // exception is i8, where the dividend is defined as a single register rather

  // than a register pair, and we therefore directly sign-extend the dividend

  // into lowreg, instead of copying, and ignore the highreg.

  const static struct MulDivRemEntry {

    // The following portion depends only on the data type.

    unsigned SizeInBits;

    unsigned LowInReg;  // low part of the register pair

    unsigned HighInReg; // high part of the register pair

    // The following portion depends on both the data type and the operation.

    struct MulDivRemResult {

      unsigned OpMulDivRem;     // The specific MUL/DIV opcode to use.

      unsigned OpSignExtend;    // Opcode for sign-extending lowreg into

                                // highreg, or copying a zero into highreg.

      unsigned OpCopy;          // Opcode for copying dividend into lowreg, or

                                // zero/sign-extending into lowreg for i8.

      unsigned ResultReg;       // Register containing the desired result.

      bool IsOpSigned;          // Whether to use signed or unsigned form.

    } ResultTable[NumOps];

  } OpTable[NumTypes] = {

      {8,

       X86::AX,

       0,

       {

           {X86::IDIV8r, 0, X86::MOVSX16rr8, X86::AL, S}, // SDiv

           {X86::IDIV8r, 0, X86::MOVSX16rr8, X86::AH, S}, // SRem

           {X86::DIV8r, 0, X86::MOVZX16rr8, X86::AL, U},  // UDiv

           {X86::DIV8r, 0, X86::MOVZX16rr8, X86::AH, U},  // URem

           {X86::IMUL8r, 0, X86::MOVSX16rr8, X86::AL, S}, // Mul

           {X86::IMUL8r, 0, X86::MOVSX16rr8, X86::AH, S}, // SMulH

           {X86::MUL8r, 0, X86::MOVZX16rr8, X86::AH, U},  // UMulH

       }},                                                // i8

      {16,

       X86::AX,

       X86::DX,

       {

           {X86::IDIV16r, X86::CWD, Copy, X86::AX, S},     // SDiv

           {X86::IDIV16r, X86::CWD, Copy, X86::DX, S},     // SRem

           {X86::DIV16r, X86::MOV32r0, Copy, X86::AX, U},  // UDiv

           {X86::DIV16r, X86::MOV32r0, Copy, X86::DX, U},  // URem

           {X86::IMUL16r, X86::MOV32r0, Copy, X86::AX, S}, // Mul

           {X86::IMUL16r, X86::MOV32r0, Copy, X86::DX, S}, // SMulH

           {X86::MUL16r, X86::MOV32r0, Copy, X86::DX, U},  // UMulH

       }},                                                 // i16

      {32,

       X86::EAX,

       X86::EDX,

       {

           {X86::IDIV32r, X86::CDQ, Copy, X86::EAX, S},     // SDiv

           {X86::IDIV32r, X86::CDQ, Copy, X86::EDX, S},     // SRem

           {X86::DIV32r, X86::MOV32r0, Copy, X86::EAX, U},  // UDiv

           {X86::DIV32r, X86::MOV32r0, Copy, X86::EDX, U},  // URem

           {X86::IMUL32r, X86::MOV32r0, Copy, X86::EAX, S}, // Mul

           {X86::IMUL32r, X86::MOV32r0, Copy, X86::EDX, S}, // SMulH

           {X86::MUL32r, X86::MOV32r0, Copy, X86::EDX, U},  // UMulH

       }},                                                  // i32

      {64,

       X86::RAX,

       X86::RDX,

       {

           {X86::IDIV64r, X86::CQO, Copy, X86::RAX, S},    // SDiv

           {X86::IDIV64r, X86::CQO, Copy, X86::RDX, S},    // SRem

           {X86::DIV64r, X86::MOV32r0, Copy, X86::RAX, U}, // UDiv

           {X86::DIV64r, X86::MOV32r0, Copy, X86::RDX, U}, // URem

           {X86::IMUL64r, X86::MOV32r0, Copy, X86::RAX, S}, // Mul

           {X86::IMUL64r, X86::MOV32r0, Copy, X86::RDX, S}, // SMulH

           {X86::MUL64r, X86::MOV32r0, Copy, X86::RDX, U},  // UMulH

       }},                                                  // i64

  };


  auto OpEntryIt = llvm::find_if(OpTable, [RegTy](const MulDivRemEntry &El) {

    return El.SizeInBits == RegTy.getSizeInBits();

  });

  if (OpEntryIt == std::end(OpTable))

    return false;


  unsigned OpIndex;

  switch (I.getOpcode()) {

  default:

    llvm_unreachable("Unexpected mul/div/rem opcode");

  case TargetOpcode::G_SDIV:

    OpIndex = 0;

    break;

  case TargetOpcode::G_SREM:

    OpIndex = 1;

    break;

  case TargetOpcode::G_UDIV:

    OpIndex = 2;

    break;

  case TargetOpcode::G_UREM:

    OpIndex = 3;

    break;

  case TargetOpcode::G_MUL:

    OpIndex = 4;

    break;

  case TargetOpcode::G_SMULH:

    OpIndex = 5;

    break;

  case TargetOpcode::G_UMULH:

    OpIndex = 6;

    break;

  }


  const MulDivRemEntry &TypeEntry = *OpEntryIt;

  const MulDivRemEntry::MulDivRemResult &OpEntry =

      TypeEntry.ResultTable[OpIndex];


  const TargetRegisterClass *RegRC = getRegClass(RegTy, *RegRB);

  if (!RBI.constrainGenericRegister(Op1Reg, *RegRC, MRI) ||

      !RBI.constrainGenericRegister(Op2Reg, *RegRC, MRI) ||

      !RBI.constrainGenericRegister(DstReg, *RegRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain " << TII.getName(I.getOpcode())

                      << " operand\n");

    return false;

  }


  // Move op1 into low-order input register.

  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(OpEntry.OpCopy),

          TypeEntry.LowInReg)

      .addReg(Op1Reg);


  // Zero-extend or sign-extend into high-order input register.

  if (OpEntry.OpSignExtend) {

    if (OpEntry.IsOpSigned)

      BuildMI(*I.getParent(), I, I.getDebugLoc(),

              TII.get(OpEntry.OpSignExtend));

    else {

      Register Zero32 = MRI.createVirtualRegister(&X86::GR32RegClass);

      BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::MOV32r0),

              Zero32);


      // Copy the zero into the appropriate sub/super/identical physical

      // register. Unfortunately the operations needed are not uniform enough

      // to fit neatly into the table above.

      if (RegTy.getSizeInBits() == 16) {

        BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(Copy),

                TypeEntry.HighInReg)

            .addReg(Zero32, {}, X86::sub_16bit);

      } else if (RegTy.getSizeInBits() == 32) {

        BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(Copy),

                TypeEntry.HighInReg)

            .addReg(Zero32);

      } else if (RegTy.getSizeInBits() == 64) {

        BuildMI(*I.getParent(), I, I.getDebugLoc(),

                TII.get(TargetOpcode::SUBREG_TO_REG), TypeEntry.HighInReg)

            .addReg(Zero32)

            .addImm(X86::sub_32bit);

      }

    }

  }


  // Generate the DIV/IDIV/MUL/IMUL instruction.

  BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(OpEntry.OpMulDivRem))

      .addReg(Op2Reg);


  // For i8 remainder, we can't reference ah directly, as we'll end

  // up with bogus copies like %r9b = COPY %ah. Reference ax

  // instead to prevent ah references in a rex instruction.

  //

  // The current assumption of the fast register allocator is that isel

  // won't generate explicit references to the GR8_NOREX registers. If

  // the allocator and/or the backend get enhanced to be more robust in

  // that regard, this can be, and should be, removed.

  if (OpEntry.ResultReg == X86::AH && STI.is64Bit()) {

    Register SourceSuperReg = MRI.createVirtualRegister(&X86::GR16RegClass);

    Register ResultSuperReg = MRI.createVirtualRegister(&X86::GR16RegClass);

    BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(Copy), SourceSuperReg)

        .addReg(X86::AX);


    // Shift AX right by 8 bits instead of using AH.

    BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(X86::SHR16ri),

            ResultSuperReg)

        .addReg(SourceSuperReg)

        .addImm(8);


    // Now reference the 8-bit subreg of the result.

    BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(TargetOpcode::COPY),

            DstReg)

        .addReg(ResultSuperReg, {}, X86::sub_8bit);

  } else {

    BuildMI(*I.getParent(), I, I.getDebugLoc(), TII.get(TargetOpcode::COPY),

            DstReg)

        .addReg(OpEntry.ResultReg);

  }

  I.eraseFromParent();


  return true;

}


bool X86InstructionSelector::selectSelect(MachineInstr &I,

                                          MachineRegisterInfo &MRI,

                                          MachineFunction &MF) const {

  GSelect &Sel = cast<GSelect>(I);

  Register DstReg = Sel.getReg(0);

  BuildMI(*Sel.getParent(), Sel, Sel.getDebugLoc(), TII.get(X86::TEST32rr))

      .addReg(Sel.getCondReg())

      .addReg(Sel.getCondReg());


  unsigned OpCmp;

  LLT Ty = MRI.getType(DstReg);

  if (Ty.getSizeInBits() == 80) {

    BuildMI(*Sel.getParent(), Sel, Sel.getDebugLoc(), TII.get(X86::CMOVE_Fp80),

            DstReg)

        .addReg(Sel.getTrueReg())

        .addReg(Sel.getFalseReg());

  } else {

    switch (Ty.getSizeInBits()) {

    default:

      return false;

    case 8:

      OpCmp = X86::CMOV_GR8;

      break;

    case 16:

      OpCmp = STI.canUseCMOV() ? X86::CMOV16rr : X86::CMOV_GR16;

      break;

    case 32:

      OpCmp = STI.canUseCMOV() ? X86::CMOV32rr : X86::CMOV_GR32;

      break;

    case 64:

      assert(STI.is64Bit() && STI.canUseCMOV());

      OpCmp = X86::CMOV64rr;

      break;

    }

    BuildMI(*Sel.getParent(), Sel, Sel.getDebugLoc(), TII.get(OpCmp), DstReg)

        .addReg(Sel.getTrueReg())

        .addReg(Sel.getFalseReg())

        .addImm(X86::COND_E);

  }

  const TargetRegisterClass *DstRC = getRegClass(Ty, DstReg, MRI);

  if (!RBI.constrainGenericRegister(DstReg, *DstRC, MRI)) {

    LLVM_DEBUG(dbgs() << "Failed to constrain CMOV\n");

    return false;

  }


  Sel.eraseFromParent();

  return true;

}


InstructionSelector::ComplexRendererFns

X86InstructionSelector::selectAddr(MachineOperand &Root) const {

  MachineInstr *MI = Root.getParent();

  MachineIRBuilder MIRBuilder(*MI);


  MachineRegisterInfo &MRI = MI->getMF()->getRegInfo();

  MachineInstr *Ptr = MRI.getVRegDef(Root.getReg());

  X86AddressMode AM;

  X86SelectAddress(*Ptr, TM, MRI, STI, AM);


  if (AM.IndexReg)

    return std::nullopt;


  return {// Base

          {[=](MachineInstrBuilder &MIB) {

             if (AM.BaseType == X86AddressMode::RegBase)

               MIB.addUse(AM.Base.Reg);

             else {

               assert(AM.BaseType == X86AddressMode::FrameIndexBase &&

                      "Unknown type of address base");

               MIB.addFrameIndex(AM.Base.FrameIndex);

             }

           },

           // Scale

           [=](MachineInstrBuilder &MIB) { MIB.addImm(AM.Scale); },

           // Index

           [=](MachineInstrBuilder &MIB) { MIB.addUse(0); },

           // Disp

           [=](MachineInstrBuilder &MIB) {

             if (AM.GV)

               MIB.addGlobalAddress(AM.GV, AM.Disp, AM.GVOpFlags);

             else if (AM.CP)

               MIB.addConstantPoolIndex(AM.Disp, 0, AM.GVOpFlags);

             else

               MIB.addImm(AM.Disp);

           },

           // Segment

           [=](MachineInstrBuilder &MIB) { MIB.addUse(0); }}};

}


InstructionSelector *


llvm::createX86InstructionSelector(const X86TargetMachine &TM,

                                   const X86Subtarget &Subtarget,

                                   const X86RegisterBankInfo &RBI) {

  return new X86InstructionSelector(TM, Subtarget, RBI);

}


getRegClass
static const TargetRegisterClass * getRegClass(const MachineInstr &MI, Register Reg)
Definition AArch64InstrInfo.cpp:5179

GET_GLOBALISEL_PREDICATES_INIT
#define GET_GLOBALISEL_PREDICATES_INIT

GET_GLOBALISEL_TEMPORARIES_INIT
#define GET_GLOBALISEL_TEMPORARIES_INIT

selectCopy
static bool selectCopy(MachineInstr &I, const TargetInstrInfo &TII, MachineRegisterInfo &MRI, const TargetRegisterInfo &TRI, const RegisterBankInfo &RBI)
Definition AArch64InstructionSelector.cpp:1022

selectDebugInstr
static bool selectDebugInstr(MachineInstr &I, MachineRegisterInfo &MRI, const RegisterBankInfo &RBI)
Definition AArch64InstructionSelector.cpp:993

assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

selectMergeValues
static bool selectMergeValues(MachineInstrBuilder &MIB, const ARMBaseInstrInfo &TII, MachineRegisterInfo &MRI, const TargetRegisterInfo &TRI, const RegisterBankInfo &RBI)
Definition ARMInstructionSelector.cpp:233

selectUnmergeValues
static bool selectUnmergeValues(MachineInstrBuilder &MIB, const ARMBaseInstrInfo &TII, MachineRegisterInfo &MRI, const TargetRegisterInfo &TRI, const RegisterBankInfo &RBI)
Definition ARMInstructionSelector.cpp:264

MBB
MachineBasicBlock & MBB
Definition ARMSLSHardening.cpp:71

DL
MachineBasicBlock MachineBasicBlock::iterator DebugLoc DL
Definition ARMSLSHardening.cpp:73

Utils.h

CodeGen.h

DataLayout.h

GIMatchTableExecutorImpl.h

DEBUG_TYPE
#define DEBUG_TYPE
Definition GenericCycleImpl.h:31

GenericMachineInstrs.h
Declares convenience wrapper classes for interpreting MachineInstr instances as specific generic oper...

TII
const HexagonInstrInfo * TII
Definition HexagonCopyToCombine.cpp:118

MI
IRTranslator LLVM IR MI
Definition IRTranslator.cpp:110

InstrTypes.h

InstructionSelector.h

NumOps
const size_t AbstractManglingParser< Derived, Alloc >::NumOps
Definition ItaniumDemangle.h:3452

LowLevelType.h
Implement a low-level type suitable for MachineInstr level instruction selection.

I
#define I(x, y, z)
Definition MD5.cpp:57

MachineBasicBlock.h

MachineConstantPool.h
This file declares the MachineConstantPool class which is an abstract constant pool to keep track of ...

MachineFunction.h

MachineInstrBuilder.h

MachineInstr.h

MachineMemOperand.h

MachineOperand.h

MachineRegisterInfo.h

Reg
Register Reg
Definition MachineSink.cpp:2126

TRI
Register const TargetRegisterInfo * TRI
Definition MachineSink.cpp:2127

MathExtras.h

Register
Promote Memory to Register
Definition Mem2Reg.cpp:110

selectLoadStoreOp
static unsigned selectLoadStoreOp(unsigned GenericOpc, unsigned RegBankID, unsigned OpSize)
Definition PPCInstructionSelector.cpp:154

getName
static StringRef getName(Value *V)
Definition ProvenanceAnalysisEvaluator.cpp:20

Opc
auto Opc
Definition RISCVRedundantCopyElimination.cpp:77

RegisterBank.h

OpIndex
unsigned OpIndex
Definition SPIRVModuleAnalysis.cpp:60

contains
static bool contains(SmallPtrSetImpl< ConstantExpr * > &Cache, ConstantExpr *Expr, Constant *C)
Definition Value.cpp:483

Debug.h

LLVM_DEBUG
#define LLVM_DEBUG(...)
Definition Debug.h:114

TargetOpcodes.h

TargetRegisterInfo.h

X86BaseInfo.h

X86InstrBuilder.h

X86InstrInfo.h

X86SelectAddress
static bool X86SelectAddress(MachineInstr &I, const X86TargetMachine &TM, const MachineRegisterInfo &MRI, const X86Subtarget &STI, X86AddressMode &AM)
Definition X86InstructionSelector.cpp:603

canTurnIntoCOPY
static bool canTurnIntoCOPY(const TargetRegisterClass *DstRC, const TargetRegisterClass *SrcRC)
Definition X86InstructionSelector.cpp:866

getLeaOP
static unsigned getLeaOP(LLT Ty, const X86Subtarget &STI)
Definition X86InstructionSelector.cpp:737

getRegClassFromGRPhysReg
static const TargetRegisterClass * getRegClassFromGRPhysReg(Register Reg)
Definition X86InstructionSelector.cpp:234

RHS
Value * RHS
Definition X86PartialReduction.cpp:81

LHS
Value * LHS
Definition X86PartialReduction.cpp:80

X86RegisterBankInfo.h
This file declares the targeting of the RegisterBankInfo class for X86.

X86RegisterInfo.h

X86Subtarget.h

X86TargetMachine.h

X86.h

llvm::CmpInst::Predicate
Predicate
This enumeration lists the possible predicates for CmpInst subclasses.
Definition InstrTypes.h:676

llvm::CmpInst::FCMP_OEQ
@ FCMP_OEQ
0 0 0 1 True if ordered and equal
Definition InstrTypes.h:679

llvm::CmpInst::FCMP_UNE
@ FCMP_UNE
1 1 1 0 True if unordered or not equal
Definition InstrTypes.h:692

llvm::CodeGenCoverage
Definition CodeGenCoverage.h:19

llvm::GSelect::getCondReg
Register getCondReg() const
Definition GenericMachineInstrs.h:352

llvm::GSelect::getFalseReg
Register getFalseReg() const
Definition GenericMachineInstrs.h:354

llvm::GSelect::getTrueReg
Register getTrueReg() const
Definition GenericMachineInstrs.h:353

llvm::GenericMachineInstr::getReg
Register getReg(unsigned Idx) const
Access the Idx'th operand as a register and return it.
Definition GenericMachineInstrs.h:38

llvm::InstructionSelector
Definition InstructionSelector.h:22

llvm::LLT
Definition LowLevelType.h:45

llvm::LLT::isScalar
constexpr bool isScalar() const
Definition LowLevelType.h:279

llvm::LLT::scalar
static constexpr LLT scalar(unsigned SizeInBits)
Get a low-level scalar or aggregate "bag of bits".
Definition LowLevelType.h:88

llvm::LLT::isVector
constexpr bool isVector() const
Definition LowLevelType.h:286

llvm::LLT::pointer
static constexpr LLT pointer(unsigned AddressSpace, unsigned SizeInBits)
Get a low-level pointer in the given address space.
Definition LowLevelType.h:115

llvm::LLT::getSizeInBits
constexpr TypeSize getSizeInBits() const
Returns the total size of the type. Must only be called on sized types.
Definition LowLevelType.h:355

llvm::LLT::isPointer
constexpr bool isPointer() const
Definition LowLevelType.h:266

llvm::MachineBasicBlock::getParent
const MachineFunction * getParent() const
Return the MachineFunction containing this basic block.
Definition MachineBasicBlock.h:330

llvm::MachineConstantPool::getConstantPoolIndex
unsigned getConstantPoolIndex(const Constant *C, Align Alignment)
getConstantPoolIndex - Create a new entry in the constant pool or return an existing one.
Definition MachineFunction.cpp:1598

llvm::MachineFunction
Definition MachineFunction.h:295

llvm::MachineFunction::getMachineMemOperand
MachineMemOperand * getMachineMemOperand(MachinePointerInfo PtrInfo, MachineMemOperand::Flags f, LLT MemTy, Align base_alignment, const AAMDNodes &AAInfo=AAMDNodes(), const MDNode *Ranges=nullptr, SyncScope::ID SSID=SyncScope::System, AtomicOrdering Ordering=AtomicOrdering::NotAtomic, AtomicOrdering FailureOrdering=AtomicOrdering::NotAtomic)
getMachineMemOperand - Allocate a new MachineMemOperand.
Definition MachineFunction.cpp:566

llvm::MachineFunction::getRegInfo
MachineRegisterInfo & getRegInfo()
getRegInfo - Return information about the registers currently in use.
Definition MachineFunction.h:804

llvm::MachineFunction::getDataLayout
const DataLayout & getDataLayout() const
Return the DataLayout attached to the Module associated to this MF.
Definition MachineFunction.cpp:327

llvm::MachineFunction::getConstantPool
MachineConstantPool * getConstantPool()
getConstantPool - Return the constant pool object for the current function.
Definition MachineFunction.h:826

llvm::MachineInstrBuilder::addUse
const MachineInstrBuilder & addUse(Register RegNo, RegState Flags={}, unsigned SubReg=0) const
Add a virtual register use operand.
Definition MachineInstrBuilder.h:225

llvm::MachineInstrBuilder::addReg
const MachineInstrBuilder & addReg(Register RegNo, RegState Flags={}, unsigned SubReg=0) const
Add a new virtual register operand.
Definition MachineInstrBuilder.h:199

llvm::MachineInstrBuilder::addImm
const MachineInstrBuilder & addImm(int64_t Val) const
Add a new immediate operand.
Definition MachineInstrBuilder.h:233

llvm::MachineInstrBuilder::addConstantPoolIndex
const MachineInstrBuilder & addConstantPoolIndex(unsigned Idx, int Offset=0, unsigned TargetFlags=0) const
Definition MachineInstrBuilder.h:260

llvm::MachineInstrBuilder::addMBB
const MachineInstrBuilder & addMBB(MachineBasicBlock *MBB, unsigned TargetFlags=0) const
Definition MachineInstrBuilder.h:248

llvm::MachineInstrBuilder::addDef
const MachineInstrBuilder & addDef(Register RegNo, RegState Flags={}, unsigned SubReg=0) const
Add a virtual register definition operand.
Definition MachineInstrBuilder.h:218

llvm::MachineInstrBuilder::addMemOperand
const MachineInstrBuilder & addMemOperand(MachineMemOperand *MMO) const
Definition MachineInstrBuilder.h:304

llvm::MachineInstr
Representation of each machine instruction.
Definition MachineInstr.h:73

llvm::MachineInstr::isImplicitDef
bool isImplicitDef() const
Definition MachineInstr.h:1427

llvm::MachineInstr::getParent
const MachineBasicBlock * getParent() const
Definition MachineInstr.h:373

llvm::MachineInstr::getDebugLoc
const DebugLoc & getDebugLoc() const
Returns the debug location id of this MachineInstr.
Definition MachineInstr.h:525

llvm::MachineInstr::eraseFromParent
LLVM_ABI MachineInstrBundleIterator< MachineInstr > eraseFromParent()
Unlink 'this' from the containing basic block and delete it.
Definition MachineInstr.cpp:800

llvm::MachineMemOperand::MOLoad
@ MOLoad
The memory access reads data.
Definition MachineMemOperand.h:137

llvm::MachineOperand
MachineOperand class - Representation of each machine instruction operand.
Definition MachineOperand.h:49

llvm::MachineOperand::ChangeToImmediate
LLVM_ABI void ChangeToImmediate(int64_t ImmVal, unsigned TargetFlags=0)
ChangeToImmediate - Replace this operand with a new immediate operand of the specified value.
Definition MachineOperand.cpp:161

llvm::MachineOperand::getParent
MachineInstr * getParent()
getParent - Return the instruction that this operand belongs to.
Definition MachineOperand.h:246

llvm::MachineOperand::getReg
Register getReg() const
getReg - Returns the register number.
Definition MachineOperand.h:372

llvm::MachineRegisterInfo
MachineRegisterInfo - Keep track of information for virtual and physical registers,...
Definition MachineRegisterInfo.h:53

llvm::MachineRegisterInfo::getVRegDef
LLVM_ABI MachineInstr * getVRegDef(Register Reg) const
getVRegDef - Return the machine instr that defines the specified virtual register or null if none is ...
Definition MachineRegisterInfo.cpp:404

llvm::MachineRegisterInfo::getRegClassOrRegBank
const RegClassOrRegBank & getRegClassOrRegBank(Register Reg) const
Return the register bank or register class of Reg.
Definition MachineRegisterInfo.h:688

llvm::MachineRegisterInfo::createVirtualRegister
LLVM_ABI Register createVirtualRegister(const TargetRegisterClass *RegClass, StringRef Name="")
createVirtualRegister - Create and return a new virtual register in the function with the specified r...
Definition MachineRegisterInfo.cpp:154

llvm::MachineRegisterInfo::getType
LLT getType(Register Reg) const
Get the low-level type of Reg or LLT{} if Reg is not a generic (target independent) virtual register.
Definition MachineRegisterInfo.h:771

llvm::MachineRegisterInfo::setRegBank
LLVM_ABI void setRegBank(Register Reg, const RegisterBank &RegBank)
Set the register bank to RegBank for Reg.
Definition MachineRegisterInfo.cpp:63

llvm::MachineRegisterInfo::createGenericVirtualRegister
LLVM_ABI Register createGenericVirtualRegister(LLT Ty, StringRef Name="")
Create and return a new generic virtual register with low-level type Ty.
Definition MachineRegisterInfo.cpp:191

llvm::MachineRegisterInfo::getRegClassOrNull
const TargetRegisterClass * getRegClassOrNull(Register Reg) const
Return the register class of Reg, or null if Reg has not been assigned a register class yet.
Definition MachineRegisterInfo.h:665

llvm::RegisterBankInfo::constrainGenericRegister
static const TargetRegisterClass * constrainGenericRegister(Register Reg, const TargetRegisterClass &RC, MachineRegisterInfo &MRI)
Constrain the (possibly generic) virtual register Reg to RC.
Definition RegisterBankInfo.cpp:131

llvm::RegisterBankInfo::getRegBank
const RegisterBank & getRegBank(unsigned ID)
Get the register bank identified by ID.
Definition RegisterBankInfo.h:440

llvm::RegisterBankInfo::getSizeInBits
TypeSize getSizeInBits(Register Reg, const MachineRegisterInfo &MRI, const TargetRegisterInfo &TRI) const
Get the size in bits of Reg.
Definition RegisterBankInfo.cpp:497

llvm::RegisterBank
This class implements the register bank concept.
Definition RegisterBank.h:29

llvm::RegisterBank::getID
unsigned getID() const
Get the identifier of this register bank.
Definition RegisterBank.h:46

llvm::Register
Wrapper class representing virtual and physical registers.
Definition Register.h:20

llvm::Register::isVirtual
constexpr bool isVirtual() const
Return true if the specified register number is in the virtual register namespace.
Definition Register.h:79

llvm::Register::isPhysical
constexpr bool isPhysical() const
Return true if the specified register number is in the physical register namespace.
Definition Register.h:83

llvm::TargetMachine::getCodeModel
CodeModel::Model getCodeModel() const
Returns the code model.
Definition TargetMachine.h:264

llvm::TargetRegisterClass
Definition TargetRegisterInfo.h:45

llvm::TargetRegisterClass::hasSubClassEq
bool hasSubClassEq(const TargetRegisterClass *RC) const
Returns true if RC is a sub-class of or equal to this class.
Definition TargetRegisterInfo.h:136

llvm::Value::getType
Type * getType() const
All values are typed, get the type of this value.
Definition Value.h:255

llvm::X86InstrInfo
Definition X86InstrInfo.h:224

llvm::X86InstrInfo::getGlobalBaseReg
Register getGlobalBaseReg(MachineFunction *MF) const
getGlobalBaseReg - Return a virtual register initialized with the the global base register value.
Definition X86InstrInfo.cpp:9111

llvm::X86RegisterBankInfo
This class provides the information for the target register banks.
Definition X86RegisterBankInfo.h:44

llvm::X86RegisterInfo
Definition X86RegisterInfo.h:25

llvm::X86Subtarget
Definition X86Subtarget.h:53

llvm::X86Subtarget::canUseCMOV
bool canUseCMOV() const
Definition X86Subtarget.h:199

llvm::X86Subtarget::isTarget64BitILP32
bool isTarget64BitILP32() const
Is this x86_64 with the ILP32 programming model (x32 ABI)?
Definition X86Subtarget.h:184

llvm::X86Subtarget::isTarget64BitLP64
bool isTarget64BitLP64() const
Is this x86_64 with the LP64 programming model (standard AMD64, no x32)?
Definition X86Subtarget.h:187

llvm::X86Subtarget::getInstrInfo
const X86InstrInfo * getInstrInfo() const override
Definition X86Subtarget.h:128

llvm::X86Subtarget::hasAVX512
bool hasAVX512() const
Definition X86Subtarget.h:208

llvm::X86Subtarget::classifyGlobalReference
unsigned char classifyGlobalReference(const GlobalValue *GV, const Module &M) const
Definition X86Subtarget.cpp:124

llvm::X86Subtarget::isPICStyleRIPRel
bool isPICStyleRIPRel() const
Definition X86Subtarget.h:345

llvm::X86Subtarget::classifyLocalReference
unsigned char classifyLocalReference(const GlobalValue *GV) const
Classify a global variable reference for the current subtarget according to how we should reference i...
Definition X86Subtarget.cpp:71

llvm::X86Subtarget::hasAVX
bool hasAVX() const
Definition X86Subtarget.h:206

llvm::X86TargetMachine
Definition X86TargetMachine.h:28

ErrorHandling.h

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition ErrorHandling.h:164

llvm::AMDGPU::HSAMD::Kernel::Arg::Key::Align
constexpr char Align[]
Key for Kernel::Arg::Metadata::mAlign.
Definition AMDGPUMetadata.h:183

llvm::CodeModel::Model
Model
Definition CodeGen.h:31

llvm::CodeModel::Large
@ Large
Definition CodeGen.h:31

llvm::CodeModel::Small
@ Small
Definition CodeGen.h:31

llvm::ISD::ConstantFP
@ ConstantFP
Definition ISDOpcodes.h:87

llvm::M68k::MemAddrModeKind::U
@ U
Definition M68kBaseInfo.h:61

llvm::PPC::Predicate
Predicate
Predicate - These are "(BI << 5) | BO" for various predicates.
Definition PPCPredicates.h:26

llvm::WinEH::EncodingType::X86
@ X86
Windows x64, Windows Itanium (IA-64)
Definition MCAsmInfo.h:50

llvm::X86II::MO_GOTPCREL_NORELAX
@ MO_GOTPCREL_NORELAX
MO_GOTPCREL_NORELAX - Same as MO_GOTPCREL except that R_X86_64_GOTPCREL relocations are guaranteed to...
Definition X86BaseInfo.h:391

llvm::X86II::MO_GOTOFF
@ MO_GOTOFF
MO_GOTOFF - On a symbol operand this indicates that the immediate is the offset to the location of th...
Definition X86BaseInfo.h:381

llvm::X86II::MO_PIC_BASE_OFFSET
@ MO_PIC_BASE_OFFSET
MO_PIC_BASE_OFFSET - On a symbol operand this indicates that the immediate should get the value of th...
Definition X86BaseInfo.h:371

llvm::X86II::MO_GOTPCREL
@ MO_GOTPCREL
MO_GOTPCREL - On a symbol operand this indicates that the immediate is offset to the GOT entry for th...
Definition X86BaseInfo.h:387

llvm::X86::CondCode
CondCode
Definition X86BaseInfo.h:77

llvm::X86::LAST_VALID_COND
@ LAST_VALID_COND
Definition X86BaseInfo.h:94

llvm::X86::COND_NP
@ COND_NP
Definition X86BaseInfo.h:89

llvm::X86::COND_E
@ COND_E
Definition X86BaseInfo.h:82

llvm::X86::COND_B
@ COND_B
Definition X86BaseInfo.h:80

llvm::X86::COND_NE
@ COND_NE
Definition X86BaseInfo.h:83

llvm::X86::COND_P
@ COND_P
Definition X86BaseInfo.h:88

llvm::X86::getX86ConditionCode
std::pair< CondCode, bool > getX86ConditionCode(CmpInst::Predicate Predicate)
Return a pair of condition code for the given predicate and whether the instruction operands should b...
Definition X86InstrInfo.cpp:3380

llvm::codeview::FrameCookieKind::Copy
@ Copy
Definition CodeView.h:494

llvm::dwarf_linker::parallel::TypeEntry
StringMapEntry< std::atomic< TypeEntryBody * > > TypeEntry
Definition TypePool.h:27

llvm::dwarf_linker::DebugSectionKind::DebugLoc
@ DebugLoc
Definition DWARFLinkerBase.h:34

llvm::dwarf::Index
Index
Definition Dwarf.h:903

llvm::objcopy::AdjustKind::Set
@ Set
Definition CommonConfig.h:155

llvm::rdf::Def
NodeAddr< DefNode * > Def
Definition RDFGraph.h:384

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition FunctionInfo.h:25

llvm::isGlobalStubReference
static bool isGlobalStubReference(unsigned char TargetFlag)
isGlobalStubReference - Return true if the specified TargetFlag operand is a reference to a stub for ...
Definition X86InstrInfo.h:121

llvm::isGlobalRelativeToPICBase
static bool isGlobalRelativeToPICBase(unsigned char TargetFlag)
isGlobalRelativeToPICBase - Return true if the specified global value reference is relative to a 32-b...
Definition X86InstrInfo.h:139

llvm::RegClassOrRegBank
PointerUnion< const TargetRegisterClass *, const RegisterBank * > RegClassOrRegBank
Convenient type to represent either a register class or a register bank.
Definition MachineRegisterInfo.h:47

llvm::BuildMI
MachineInstrBuilder BuildMI(MachineFunction &MF, const MIMetadata &MIMD, const MCInstrDesc &MCID)
Builder interface. Specify how to create the initial instruction itself.
Definition MachineInstrBuilder.h:449

llvm::getIConstantVRegVal
LLVM_ABI std::optional< APInt > getIConstantVRegVal(Register VReg, const MachineRegisterInfo &MRI)
If VReg is defined by a G_CONSTANT, return the corresponding value.
Definition Utils.cpp:293

llvm::isInt
constexpr bool isInt(int64_t x)
Checks if an integer fits into the given bit width.
Definition MathExtras.h:165

llvm::dyn_cast
decltype(auto) dyn_cast(const From &Val)
dyn_cast<X> - Return the argument parameter cast to the specified type.
Definition Casting.h:643

llvm::constrainSelectedInstRegOperands
LLVM_ABI void constrainSelectedInstRegOperands(MachineInstr &I, const TargetInstrInfo &TII, const TargetRegisterInfo &TRI, const RegisterBankInfo &RBI)
Mutate the newly-selected instruction I to constrain its (possibly generic) virtual register operands...
Definition Utils.cpp:155

llvm::isPreISelGenericOpcode
bool isPreISelGenericOpcode(unsigned Opcode)
Check whether the given Opcode is a generic opcode that is not supposed to appear after ISel.
Definition TargetOpcodes.h:30

llvm::addConstantPoolReference
static const MachineInstrBuilder & addConstantPoolReference(const MachineInstrBuilder &MIB, unsigned CPI, Register GlobalBaseReg, unsigned char OpFlags)
addConstantPoolReference - This function is used to add a reference to the base of a constant value s...
Definition X86InstrBuilder.h:220

llvm::dyn_cast_if_present
auto dyn_cast_if_present(const Y &Val)
dyn_cast_if_present<X> - Functionally identical to dyn_cast, except that a null (or none in the case ...
Definition Casting.h:732

llvm::addFullAddress
static const MachineInstrBuilder & addFullAddress(const MachineInstrBuilder &MIB, const X86AddressMode &AM)
Definition X86InstrBuilder.h:169

llvm::getIConstantVRegSExtVal
LLVM_ABI std::optional< int64_t > getIConstantVRegSExtVal(Register VReg, const MachineRegisterInfo &MRI)
If VReg is defined by a G_CONSTANT fits in int64_t returns it.
Definition Utils.cpp:313

llvm::dbgs
LLVM_ABI raw_ostream & dbgs()
dbgs() - This returns a reference to a raw_ostream for debugging messages.
Definition Debug.cpp:207

llvm::isUInt
constexpr bool isUInt(uint64_t x)
Checks if an unsigned integer fits into the given bit width.
Definition MathExtras.h:189

llvm::addOffset
static const MachineInstrBuilder & addOffset(const MachineInstrBuilder &MIB, int Offset)
Definition X86InstrBuilder.h:137

llvm::cast
decltype(auto) cast(const From &Val)
cast<X> - Return the argument parameter cast to the specified type.
Definition Casting.h:559

llvm::find_if
auto find_if(R &&Range, UnaryPredicate P)
Provide wrappers to std::find_if which take ranges instead of having to pass begin/end explicitly.
Definition STLExtras.h:1772

llvm::addDirectMem
static const MachineInstrBuilder & addDirectMem(const MachineInstrBuilder &MIB, Register Reg)
addDirectMem - This function is used to add a direct memory reference to the current instruction – th...
Definition X86InstrBuilder.h:118

llvm::createX86InstructionSelector
InstructionSelector * createX86InstructionSelector(const X86TargetMachine &TM, const X86Subtarget &, const X86RegisterBankInfo &)
Definition X86InstructionSelector.cpp:2037

std::swap
void swap(llvm::BitVector &LHS, llvm::BitVector &RHS)
Implement std::swap in terms of BitVector swap.
Definition BitVector.h:872

raw_ostream.h

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition Alignment.h:39

llvm::MachinePointerInfo::getConstantPool
static LLVM_ABI MachinePointerInfo getConstantPool(MachineFunction &MF)
Return a MachinePointerInfo record that refers to the constant pool.
Definition MachineOperand.cpp:1086

llvm::X86AddressMode
X86AddressMode - This struct holds a generalized full x86 address mode.
Definition X86InstrBuilder.h:42

llvm::X86AddressMode::IndexReg
Register IndexReg
Definition X86InstrBuilder.h:53

llvm::X86AddressMode::GVOpFlags
unsigned GVOpFlags
Definition X86InstrBuilder.h:56

llvm::X86AddressMode::RegBase
@ RegBase
Definition X86InstrBuilder.h:43

llvm::X86AddressMode::FrameIndexBase
@ FrameIndexBase
Definition X86InstrBuilder.h:43

llvm::X86AddressMode::GV
const GlobalValue * GV
Definition X86InstrBuilder.h:55

llvm::X86AddressMode::Disp
int Disp
Definition X86InstrBuilder.h:54

llvm::X86AddressMode::Scale
unsigned Scale
Definition X86InstrBuilder.h:52

llvm::X86AddressMode::Base
union llvm::X86AddressMode::BaseUnion Base

llvm::X86AddressMode::CP
bool CP
Definition X86InstrBuilder.h:57

llvm::X86AddressMode::BaseType
enum llvm::X86AddressMode::@202116273335065351270200035056227005202106004277 BaseType

llvm::X86AddressMode::BaseUnion::FrameIndex
int FrameIndex
Definition X86InstrBuilder.h:47

llvm::X86AddressMode::BaseUnion::Reg
Register Reg
Definition X86InstrBuilder.h:46