doxygen/InlineOrder_8cpp_source.html

//===- InlineOrder.cpp - Inlining order abstraction -*- C++ ---*-----------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//


#include "llvm/Analysis/InlineOrder.h"

#include "llvm/Analysis/AssumptionCache.h"

#include "llvm/Analysis/BlockFrequencyInfo.h"

#include "llvm/Analysis/GlobalsModRef.h"

#include "llvm/Analysis/InlineAdvisor.h"

#include "llvm/Analysis/InlineCost.h"

#include "llvm/Analysis/OptimizationRemarkEmitter.h"

#include "llvm/Analysis/ProfileSummaryInfo.h"

#include "llvm/Analysis/TargetLibraryInfo.h"

#include "llvm/Analysis/TargetTransformInfo.h"

#include "llvm/Support/CommandLine.h"


using namespace llvm;


#define DEBUG_TYPE "inline-order"


enum class InlinePriorityMode : int { Size, Cost, CostBenefit, ML };


static cl::opt<InlinePriorityMode> UseInlinePriority(

    "inline-priority-mode", cl::init(InlinePriorityMode::Size), cl::Hidden,

    cl::desc("Choose the priority mode to use in module inline"),

    cl::values(clEnumValN(InlinePriorityMode::Size, "size",

                          "Use callee size priority."),

               clEnumValN(InlinePriorityMode::Cost, "cost",

                          "Use inline cost priority."),

               clEnumValN(InlinePriorityMode::CostBenefit, "cost-benefit",

                          "Use cost-benefit ratio."),

               clEnumValN(InlinePriorityMode::ML, "ml", "Use ML.")));


static cl::opt<int> ModuleInlinerTopPriorityThreshold(

    "module-inliner-top-priority-threshold", cl::Hidden, cl::init(0),

    cl::desc("The cost threshold for call sites that get inlined without the "

             "cost-benefit analysis"));


namespace {


llvm::InlineCost getInlineCostWrapper(CallBase &CB,

                                      FunctionAnalysisManager &FAM,

                                      const InlineParams &Params) {

  Function &Caller = *CB.getCaller();

  ProfileSummaryInfo *PSI =

      FAM.getResult<ModuleAnalysisManagerFunctionProxy>(Caller)

          .getCachedResult<ProfileSummaryAnalysis>(

              *CB.getParent()->getParent()->getParent());


  auto &ORE = FAM.getResult<OptimizationRemarkEmitterAnalysis>(Caller);

  auto GetAssumptionCache = [&](Function &F) -> AssumptionCache & {

    return FAM.getResult<AssumptionAnalysis>(F);

  };

  auto GetBFI = [&](Function &F) -> BlockFrequencyInfo & {

    return FAM.getResult<BlockFrequencyAnalysis>(F);

  };

  auto GetTLI = [&](Function &F) -> const TargetLibraryInfo & {

    return FAM.getResult<TargetLibraryAnalysis>(F);

  };


  Function &Callee = *CB.getCalledFunction();

  auto &CalleeTTI = FAM.getResult<TargetIRAnalysis>(Callee);

  bool RemarksEnabled =

      Callee.getContext().getDiagHandlerPtr()->isMissedOptRemarkEnabled(

          DEBUG_TYPE);

  return getInlineCost(CB, Params, CalleeTTI, GetAssumptionCache, GetTLI,

                       GetBFI, PSI, RemarksEnabled ? &ORE : nullptr);

}


class SizePriority {

public:

  SizePriority() = default;

  SizePriority(const CallBase *CB, FunctionAnalysisManager &,

               const InlineParams &) {

    Function *Callee = CB->getCalledFunction();

    Size = Callee->getInstructionCount();

  }


  static bool isMoreDesirable(const SizePriority &P1, const SizePriority &P2) {

    return P1.Size < P2.Size;

  }


private:

  unsigned Size = UINT_MAX;

};


class CostPriority {

public:

  CostPriority() = default;

  CostPriority(const CallBase *CB, FunctionAnalysisManager &FAM,

               const InlineParams &Params) {

    auto IC = getInlineCostWrapper(const_cast<CallBase &>(*CB), FAM, Params);

    if (IC.isVariable())

      Cost = IC.getCost();

    else

      Cost = IC.isNever() ? INT_MAX : INT_MIN;

  }


  static bool isMoreDesirable(const CostPriority &P1, const CostPriority &P2) {

    return P1.Cost < P2.Cost;

  }


private:

  int Cost = INT_MAX;

};


class CostBenefitPriority {

public:

  CostBenefitPriority() = default;

  CostBenefitPriority(const CallBase *CB, FunctionAnalysisManager &FAM,

                      const InlineParams &Params) {

    auto IC = getInlineCostWrapper(const_cast<CallBase &>(*CB), FAM, Params);

    if (IC.isVariable())

      Cost = IC.getCost();

    else

      Cost = IC.isNever() ? INT_MAX : INT_MIN;

    StaticBonusApplied = IC.getStaticBonusApplied();

    CostBenefit = IC.getCostBenefit();

  }


  static bool isMoreDesirable(const CostBenefitPriority &P1,

                              const CostBenefitPriority &P2) {

    // We prioritize call sites in the dictionary order of the following

    // priorities:

    //

    // 1. Those call sites that are expected to reduce the caller size when

    //    inlined.  Within them, we prioritize those call sites with bigger

    //    reduction.

    //

    // 2. Those call sites that have gone through the cost-benefit analysis.

    //    Currently, they are limited to hot call sites.  Within them, we

    //    prioritize those call sites with higher benefit-to-cost ratios.

    //

    // 3. Remaining call sites are prioritized according to their costs.


    // We add back StaticBonusApplied to determine whether we expect the caller

    // to shrink (even if we don't delete the callee).

    bool P1ReducesCallerSize =

        P1.Cost + P1.StaticBonusApplied < ModuleInlinerTopPriorityThreshold;

    bool P2ReducesCallerSize =

        P2.Cost + P2.StaticBonusApplied < ModuleInlinerTopPriorityThreshold;

    if (P1ReducesCallerSize || P2ReducesCallerSize) {

      // If one reduces the caller size while the other doesn't, then return

      // true iff P1 reduces the caller size.

      if (P1ReducesCallerSize != P2ReducesCallerSize)

        return P1ReducesCallerSize;


      // If they both reduce the caller size, pick the one with the smaller

      // cost.

      return P1.Cost < P2.Cost;

    }


    bool P1HasCB = P1.CostBenefit.has_value();

    bool P2HasCB = P2.CostBenefit.has_value();

    if (P1HasCB || P2HasCB) {

      // If one has undergone the cost-benefit analysis while the other hasn't,

      // then return true iff P1 has.

      if (P1HasCB != P2HasCB)

        return P1HasCB;


      // If they have undergone the cost-benefit analysis, then pick the one

      // with a higher benefit-to-cost ratio.

      APInt LHS = P1.CostBenefit->getBenefit() * P2.CostBenefit->getCost();

      APInt RHS = P2.CostBenefit->getBenefit() * P1.CostBenefit->getCost();

      return LHS.ugt(RHS);

    }


    // Remaining call sites are ordered according to their costs.

    return P1.Cost < P2.Cost;

  }


private:

  int Cost = INT_MAX;

  int StaticBonusApplied = 0;

  std::optional<CostBenefitPair> CostBenefit;

};


class MLPriority {

public:

  MLPriority() = default;

  MLPriority(const CallBase *CB, FunctionAnalysisManager &FAM,

             const InlineParams &Params) {

    auto IC = getInlineCostWrapper(const_cast<CallBase &>(*CB), FAM, Params);

    if (IC.isVariable())

      Cost = IC.getCost();

    else

      Cost = IC.isNever() ? INT_MAX : INT_MIN;

  }


  static bool isMoreDesirable(const MLPriority &P1, const MLPriority &P2) {

    return P1.Cost < P2.Cost;

  }


private:

  int Cost = INT_MAX;

};


template <typename PriorityT>

class PriorityInlineOrder : public InlineOrder<std::pair<CallBase *, int>> {

  using T = std::pair<CallBase *, int>;


  bool hasLowerPriority(const CallBase *L, const CallBase *R) const {

    const auto I1 = Priorities.find(L);

    const auto I2 = Priorities.find(R);

    assert(I1 != Priorities.end() && I2 != Priorities.end());

    return PriorityT::isMoreDesirable(I2->second, I1->second);

  }


  bool updateAndCheckDecreased(const CallBase *CB) {

    auto It = Priorities.find(CB);

    const auto OldPriority = It->second;

    It->second = PriorityT(CB, FAM, Params);

    const auto NewPriority = It->second;

    return PriorityT::isMoreDesirable(OldPriority, NewPriority);

  }


  // A call site could become less desirable for inlining because of the size

  // growth from prior inlining into the callee. This method is used to lazily

  // update the desirability of a call site if it's decreasing. It is only

  // called on pop(), not every time the desirability changes. When the

  // desirability of the front call site decreases, an updated one would be

  // pushed right back into the heap. For simplicity, those cases where the

  // desirability of a call site increases are ignored here.

  void pop_heap_adjust() {

    std::pop_heap(Heap.begin(), Heap.end(), isLess);

    while (updateAndCheckDecreased(Heap.back())) {

      std::push_heap(Heap.begin(), Heap.end(), isLess);

      std::pop_heap(Heap.begin(), Heap.end(), isLess);

    }

  }


public:

  PriorityInlineOrder(FunctionAnalysisManager &FAM, const InlineParams &Params)

      : FAM(FAM), Params(Params) {

    isLess = [&](const CallBase *L, const CallBase *R) {

      return hasLowerPriority(L, R);

    };

  }


  size_t size() override { return Heap.size(); }


  void push(const T &Elt) override {

    CallBase *CB = Elt.first;

    const int InlineHistoryID = Elt.second;


    Heap.push_back(CB);

    Priorities[CB] = PriorityT(CB, FAM, Params);

    std::push_heap(Heap.begin(), Heap.end(), isLess);

    InlineHistoryMap[CB] = InlineHistoryID;

  }


  T pop() override {

    assert(size() > 0);

    pop_heap_adjust();


    CallBase *CB = Heap.pop_back_val();

    T Result = std::make_pair(CB, InlineHistoryMap[CB]);

    InlineHistoryMap.erase(CB);

    return Result;

  }


  void erase_if(function_ref<bool(T)> Pred) override {

    auto PredWrapper = [=](CallBase *CB) -> bool {

      return Pred(std::make_pair(CB, InlineHistoryMap[CB]));

    };

    llvm::erase_if(Heap, PredWrapper);

    std::make_heap(Heap.begin(), Heap.end(), isLess);

  }


private:

  SmallVector<CallBase *, 16> Heap;

  std::function<bool(const CallBase *L, const CallBase *R)> isLess;

  DenseMap<CallBase *, int> InlineHistoryMap;

  DenseMap<const CallBase *, PriorityT> Priorities;

  FunctionAnalysisManager &FAM;

  const InlineParams &Params;

};


} // namespace


AnalysisKey llvm::PluginInlineOrderAnalysis::Key;

bool llvm::PluginInlineOrderAnalysis::HasBeenRegistered;


std::unique_ptr<InlineOrder<std::pair<CallBase *, int>>>

llvm::getDefaultInlineOrder(FunctionAnalysisManager &FAM,

                            const InlineParams &Params,

                            ModuleAnalysisManager &MAM, Module &M) {

  switch (UseInlinePriority) {

  case InlinePriorityMode::Size:

    LLVM_DEBUG(dbgs() << "    Current used priority: Size priority ---- \n");

    return std::make_unique<PriorityInlineOrder<SizePriority>>(FAM, Params);


  case InlinePriorityMode::Cost:

    LLVM_DEBUG(dbgs() << "    Current used priority: Cost priority ---- \n");

    return std::make_unique<PriorityInlineOrder<CostPriority>>(FAM, Params);


  case InlinePriorityMode::CostBenefit:

    LLVM_DEBUG(

        dbgs() << "    Current used priority: cost-benefit priority ---- \n");

    return std::make_unique<PriorityInlineOrder<CostBenefitPriority>>(FAM,

                                                                      Params);

  case InlinePriorityMode::ML:

    LLVM_DEBUG(dbgs() << "    Current used priority: ML priority ---- \n");

    return std::make_unique<PriorityInlineOrder<MLPriority>>(FAM, Params);

  }

  return nullptr;

}


std::unique_ptr<InlineOrder<std::pair<CallBase *, int>>>

llvm::getInlineOrder(FunctionAnalysisManager &FAM, const InlineParams &Params,

                     ModuleAnalysisManager &MAM, Module &M) {

  if (llvm::PluginInlineOrderAnalysis::isRegistered()) {

    LLVM_DEBUG(dbgs() << "    Current used priority: plugin ---- \n");

    return MAM.getResult<PluginInlineOrderAnalysis>(M).Factory(FAM, Params, MAM,

                                                               M);

  }

  return getDefaultInlineOrder(FAM, Params, MAM, M);

}

AssumptionCache.h

BlockFrequencyInfo.h

CommandLine.h

clEnumValN
#define clEnumValN(ENUMVAL, FLAGNAME, DESC)
Definition: CommandLine.h:686

LLVM_DEBUG
#define LLVM_DEBUG(X)
Definition: Debug.h:101

GlobalsModRef.h
This is the interface for a simple mod/ref and alias analysis over globals.

InlineAdvisor.h

InlineCost.h

ModuleInlinerTopPriorityThreshold
static cl::opt< int > ModuleInlinerTopPriorityThreshold("module-inliner-top-priority-threshold", cl::Hidden, cl::init(0), cl::desc("The cost threshold for call sites that get inlined without the " "cost-benefit analysis"))

InlinePriorityMode
InlinePriorityMode
Definition: InlineOrder.cpp:25

InlinePriorityMode::Cost
@ Cost

InlinePriorityMode::CostBenefit
@ CostBenefit

InlinePriorityMode::Size
@ Size

InlinePriorityMode::ML
@ ML

UseInlinePriority
static cl::opt< InlinePriorityMode > UseInlinePriority("inline-priority-mode", cl::init(InlinePriorityMode::Size), cl::Hidden, cl::desc("Choose the priority mode to use in module inline"), cl::values(clEnumValN(InlinePriorityMode::Size, "size", "Use callee size priority."), clEnumValN(InlinePriorityMode::Cost, "cost", "Use inline cost priority."), clEnumValN(InlinePriorityMode::CostBenefit, "cost-benefit", "Use cost-benefit ratio."), clEnumValN(InlinePriorityMode::ML, "ml", "Use ML.")))

DEBUG_TYPE
#define DEBUG_TYPE
Definition: InlineOrder.cpp:23

InlineOrder.h

F
#define F(x, y, z)
Definition: MD5.cpp:55

OptimizationRemarkEmitter.h

FAM
FunctionAnalysisManager FAM
Definition: PassBuilderBindings.cpp:64

MAM
ModuleAnalysisManager MAM
Definition: PassBuilderBindings.cpp:66

ProfileSummaryInfo.h

assert
assert(ImpDefSCC.getReg()==AMDGPU::SCC &&ImpDefSCC.isDef())

TargetLibraryInfo.h

TargetTransformInfo.h
This pass exposes codegen information to IR-level passes.

RHS
Value * RHS
Definition: X86PartialReduction.cpp:76

LHS
Value * LHS
Definition: X86PartialReduction.cpp:75

T

bool

llvm::APInt
Class for arbitrary precision integers.
Definition: APInt.h:78

llvm::AnalysisManager
A container for analyses that lazily runs them and caches their results.
Definition: PassManager.h:253

llvm::AnalysisManager::getResult
PassT::Result & getResult(IRUnitT &IR, ExtraArgTs... ExtraArgs)
Get the result of an analysis pass for a given IR unit.
Definition: PassManager.h:405

llvm::AssumptionAnalysis
A function analysis which provides an AssumptionCache.
Definition: AssumptionCache.h:173

llvm::AssumptionCache
A cache of @llvm.assume calls within a function.
Definition: AssumptionCache.h:42

llvm::BlockFrequencyAnalysis
Analysis pass which computes BlockFrequencyInfo.
Definition: BlockFrequencyInfo.h:115

llvm::BlockFrequencyInfo
BlockFrequencyInfo pass uses BlockFrequencyInfoImpl implementation to estimate IR basic block frequen...
Definition: BlockFrequencyInfo.h:38

llvm::CallBase
Base class for all callable instructions (InvokeInst and CallInst) Holds everything related to callin...
Definition: InstrTypes.h:1236

llvm::CallBase::getCalledFunction
Function * getCalledFunction() const
Returns the function called, or null if this is an indirect function invocation or the function signa...
Definition: InstrTypes.h:1465

llvm::CallBase::getCaller
Function * getCaller()
Helper to get the caller (the parent function).
Definition: Instructions.cpp:324

llvm::DenseMap
Definition: DenseMap.h:777

llvm::Function
Definition: Function.h:64

llvm::InlineCost
Represents the cost of inlining a function.
Definition: InlineCost.h:90

llvm::InlineOrder
Definition: InlineOrder.h:19

llvm::InlineOrder::pop
virtual T pop()=0

llvm::InlineOrder::size
virtual size_t size()=0

llvm::InlineOrder::erase_if
virtual void erase_if(function_ref< bool(T)> Pred)=0

llvm::InlineOrder::push
virtual void push(const T &Elt)=0

llvm::InstructionCost
Definition: InstructionCost.h:29

llvm::Module
A Module instance is used to store all the information related to an LLVM module.
Definition: Module.h:65

llvm::OptimizationRemarkEmitterAnalysis
Definition: OptimizationRemarkEmitter.h:166

llvm::OuterAnalysisManagerProxy
An analysis over an "inner" IR unit that provides access to an analysis manager over a "outer" IR uni...
Definition: PassManager.h:688

llvm::PluginInlineOrderAnalysis
Used for dynamically loading instances of InlineOrder as plugins.
Definition: InlineOrder.h:52

llvm::PluginInlineOrderAnalysis::isRegistered
static bool isRegistered()
Definition: InlineOrder.h:74

llvm::PluginInlineOrderAnalysis::Key
static AnalysisKey Key
Definition: InlineOrder.h:54

llvm::ProfileSummaryInfo
Analysis providing profile information.
Definition: ProfileSummaryInfo.h:42

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition: SmallVector.h:1210

llvm::TargetIRAnalysis
Analysis pass providing the TargetTransformInfo.
Definition: TargetTransformInfo.h:2984

llvm::TargetLibraryAnalysis
Analysis pass providing the TargetLibraryInfo.
Definition: TargetLibraryInfo.h:597

llvm::TargetLibraryInfo
Provides information about what library functions are available for the current target.
Definition: TargetLibraryInfo.h:281

llvm::cl::opt
Definition: CommandLine.h:1423

llvm::function_ref
An efficient, type-erasing, non-owning reference to a callable.
Definition: STLFunctionalExtras.h:36

llvm::ilist_detail::node_parent_access::getParent
const ParentTy * getParent() const
Definition: ilist_node.h:32

llvm::Check::Size
@ Size
Definition: FileCheck.h:77

llvm::M68k::MemAddrModeKind::L
@ L

llvm::RISCVFenceField::R
@ R
Definition: RISCVBaseInfo.h:327

llvm::cl::Hidden
@ Hidden
Definition: CommandLine.h:137

llvm::cl::values
ValuesClass values(OptsTy... Options)
Helper to build a ValuesClass by forwarding a variable number of arguments as an initializer list to ...
Definition: CommandLine.h:711

llvm::cl::init
initializer< Ty > init(const Ty &Val)
Definition: CommandLine.h:443

llvm::dxil::ParameterKind::I1
@ I1

llvm::ms_demangle::QualifierMangleMode::Result
@ Result

llvm::pdb::PDB_SymType::Callee
@ Callee

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::getInlineCost
InlineCost getInlineCost(CallBase &Call, const InlineParams &Params, TargetTransformInfo &CalleeTTI, function_ref< AssumptionCache &(Function &)> GetAssumptionCache, function_ref< const TargetLibraryInfo &(Function &)> GetTLI, function_ref< BlockFrequencyInfo &(Function &)> GetBFI=nullptr, ProfileSummaryInfo *PSI=nullptr, OptimizationRemarkEmitter *ORE=nullptr)
Get an InlineCost object representing the cost of inlining this callsite.
Definition: InlineCost.cpp:2932

llvm::getDefaultInlineOrder
std::unique_ptr< InlineOrder< std::pair< CallBase *, int > > > getDefaultInlineOrder(FunctionAnalysisManager &FAM, const InlineParams &Params, ModuleAnalysisManager &MAM, Module &M)
Definition: InlineOrder.cpp:289

llvm::getInlineOrder
std::unique_ptr< InlineOrder< std::pair< CallBase *, int > > > getInlineOrder(FunctionAnalysisManager &FAM, const InlineParams &Params, ModuleAnalysisManager &MAM, Module &M)
Definition: InlineOrder.cpp:314

llvm::dbgs
raw_ostream & dbgs()
dbgs() - This returns a reference to a raw_ostream for debugging messages.
Definition: Debug.cpp:163

llvm::erase_if
void erase_if(Container &C, UnaryPredicate P)
Provide a container algorithm similar to C++ Library Fundamentals v2's erase_if which is equivalent t...
Definition: STLExtras.h:2057

llvm::AnalysisKey
A special type used by analysis passes to provide an address that identifies that particular analysis...
Definition: Analysis.h:28

llvm::InlineParams
Thresholds to tune inline cost analysis.
Definition: InlineCost.h:206

llvm::cl::desc
Definition: CommandLine.h:409