doxygen/AMDGPUTargetStreamer_8cpp_source.html

//===-- AMDGPUTargetStreamer.cpp - Mips Target Streamer Methods -----------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file provides AMDGPU specific target streamer methods.

//

//===----------------------------------------------------------------------===//


#include "AMDGPUTargetStreamer.h"

#include "AMDGPUMCExpr.h"

#include "AMDGPUMCKernelDescriptor.h"

#include "AMDGPUPTNote.h"

#include "Utils/AMDGPUBaseInfo.h"

#include "Utils/AMDKernelCodeTUtils.h"

#include "llvm/BinaryFormat/AMDGPUMetadataVerifier.h"

#include "llvm/BinaryFormat/ELF.h"

#include "llvm/MC/MCAsmInfo.h"

#include "llvm/MC/MCAssembler.h"

#include "llvm/MC/MCContext.h"

#include "llvm/MC/MCELFObjectWriter.h"

#include "llvm/MC/MCELFStreamer.h"

#include "llvm/MC/MCSubtargetInfo.h"

#include "llvm/Support/AMDGPUMetadata.h"

#include "llvm/Support/AMDHSAKernelDescriptor.h"

#include "llvm/Support/CommandLine.h"

#include "llvm/Support/FormattedStream.h"

#include "llvm/TargetParser/TargetParser.h"


using namespace llvm;

using namespace llvm::AMDGPU;


//===----------------------------------------------------------------------===//

// AMDGPUTargetStreamer

//===----------------------------------------------------------------------===//


static cl::opt<unsigned>

    ForceGenericVersion("amdgpu-force-generic-version",

                        cl::desc("Force a specific generic_v<N> flag to be "

                                 "added. For testing purposes only."),

                        cl::ReallyHidden, cl::init(0));


bool AMDGPUTargetStreamer::EmitHSAMetadataV3(StringRef HSAMetadataString) {

  msgpack::Document HSAMetadataDoc;

  if (!HSAMetadataDoc.fromYAML(HSAMetadataString))

    return false;

  return EmitHSAMetadata(HSAMetadataDoc, false);

}


StringRef AMDGPUTargetStreamer::getArchNameFromElfMach(unsigned ElfMach) {

  AMDGPU::GPUKind AK;


  // clang-format off

  switch (ElfMach) {

  case ELF::EF_AMDGPU_MACH_R600_R600:      AK = GK_R600;    break;

  case ELF::EF_AMDGPU_MACH_R600_R630:      AK = GK_R630;    break;

  case ELF::EF_AMDGPU_MACH_R600_RS880:     AK = GK_RS880;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV670:     AK = GK_RV670;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV710:     AK = GK_RV710;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV730:     AK = GK_RV730;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV770:     AK = GK_RV770;   break;

  case ELF::EF_AMDGPU_MACH_R600_CEDAR:     AK = GK_CEDAR;   break;

  case ELF::EF_AMDGPU_MACH_R600_CYPRESS:   AK = GK_CYPRESS; break;

  case ELF::EF_AMDGPU_MACH_R600_JUNIPER:   AK = GK_JUNIPER; break;

  case ELF::EF_AMDGPU_MACH_R600_REDWOOD:   AK = GK_REDWOOD; break;

  case ELF::EF_AMDGPU_MACH_R600_SUMO:      AK = GK_SUMO;    break;

  case ELF::EF_AMDGPU_MACH_R600_BARTS:     AK = GK_BARTS;   break;

  case ELF::EF_AMDGPU_MACH_R600_CAICOS:    AK = GK_CAICOS;  break;

  case ELF::EF_AMDGPU_MACH_R600_CAYMAN:    AK = GK_CAYMAN;  break;

  case ELF::EF_AMDGPU_MACH_R600_TURKS:     AK = GK_TURKS;   break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX600:  AK = GK_GFX600;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX601:  AK = GK_GFX601;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX602:  AK = GK_GFX602;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX700:  AK = GK_GFX700;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX701:  AK = GK_GFX701;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX702:  AK = GK_GFX702;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX703:  AK = GK_GFX703;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX704:  AK = GK_GFX704;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX705:  AK = GK_GFX705;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX801:  AK = GK_GFX801;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX802:  AK = GK_GFX802;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX803:  AK = GK_GFX803;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX805:  AK = GK_GFX805;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX810:  AK = GK_GFX810;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX900:  AK = GK_GFX900;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX902:  AK = GK_GFX902;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX904:  AK = GK_GFX904;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX906:  AK = GK_GFX906;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX908:  AK = GK_GFX908;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX909:  AK = GK_GFX909;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX90A:  AK = GK_GFX90A;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX90C:  AK = GK_GFX90C;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX942:  AK = GK_GFX942;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX950:  AK = GK_GFX950;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1010: AK = GK_GFX1010; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1011: AK = GK_GFX1011; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1012: AK = GK_GFX1012; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1013: AK = GK_GFX1013; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1030: AK = GK_GFX1030; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1031: AK = GK_GFX1031; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1032: AK = GK_GFX1032; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1033: AK = GK_GFX1033; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1034: AK = GK_GFX1034; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1035: AK = GK_GFX1035; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1036: AK = GK_GFX1036; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1100: AK = GK_GFX1100; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1101: AK = GK_GFX1101; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1102: AK = GK_GFX1102; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1103: AK = GK_GFX1103; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1150: AK = GK_GFX1150; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1151: AK = GK_GFX1151; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1152: AK = GK_GFX1152; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1153: AK = GK_GFX1153; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1200: AK = GK_GFX1200; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1201: AK = GK_GFX1201; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1250: AK = GK_GFX1250; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1251: AK = GK_GFX1251; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC:     AK = GK_GFX9_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC:   AK = GK_GFX9_4_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC:  AK = GK_GFX10_1_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC:  AK = GK_GFX10_3_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC:    AK = GK_GFX11_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC:    AK = GK_GFX12_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_NONE:           AK = GK_NONE;    break;

  default:                                 AK = GK_NONE;    break;

  }

  // clang-format on


  StringRef GPUName = getArchNameAMDGCN(AK);

  if (GPUName != "")

    return GPUName;

  return getArchNameR600(AK);

}


unsigned AMDGPUTargetStreamer::getElfMach(StringRef GPU) {

  AMDGPU::GPUKind AK = parseArchAMDGCN(GPU);

  if (AK == AMDGPU::GPUKind::GK_NONE)

    AK = parseArchR600(GPU);


  // clang-format off

  switch (AK) {

  case GK_R600:    return ELF::EF_AMDGPU_MACH_R600_R600;

  case GK_R630:    return ELF::EF_AMDGPU_MACH_R600_R630;

  case GK_RS880:   return ELF::EF_AMDGPU_MACH_R600_RS880;

  case GK_RV670:   return ELF::EF_AMDGPU_MACH_R600_RV670;

  case GK_RV710:   return ELF::EF_AMDGPU_MACH_R600_RV710;

  case GK_RV730:   return ELF::EF_AMDGPU_MACH_R600_RV730;

  case GK_RV770:   return ELF::EF_AMDGPU_MACH_R600_RV770;

  case GK_CEDAR:   return ELF::EF_AMDGPU_MACH_R600_CEDAR;

  case GK_CYPRESS: return ELF::EF_AMDGPU_MACH_R600_CYPRESS;

  case GK_JUNIPER: return ELF::EF_AMDGPU_MACH_R600_JUNIPER;

  case GK_REDWOOD: return ELF::EF_AMDGPU_MACH_R600_REDWOOD;

  case GK_SUMO:    return ELF::EF_AMDGPU_MACH_R600_SUMO;

  case GK_BARTS:   return ELF::EF_AMDGPU_MACH_R600_BARTS;

  case GK_CAICOS:  return ELF::EF_AMDGPU_MACH_R600_CAICOS;

  case GK_CAYMAN:  return ELF::EF_AMDGPU_MACH_R600_CAYMAN;

  case GK_TURKS:   return ELF::EF_AMDGPU_MACH_R600_TURKS;

  case GK_GFX600:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX600;

  case GK_GFX601:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX601;

  case GK_GFX602:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX602;

  case GK_GFX700:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX700;

  case GK_GFX701:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX701;

  case GK_GFX702:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX702;

  case GK_GFX703:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX703;

  case GK_GFX704:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX704;

  case GK_GFX705:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX705;

  case GK_GFX801:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX801;

  case GK_GFX802:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX802;

  case GK_GFX803:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX803;

  case GK_GFX805:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX805;

  case GK_GFX810:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX810;

  case GK_GFX900:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX900;

  case GK_GFX902:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX902;

  case GK_GFX904:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX904;

  case GK_GFX906:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX906;

  case GK_GFX908:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX908;

  case GK_GFX909:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX909;

  case GK_GFX90A:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX90A;

  case GK_GFX90C:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX90C;

  case GK_GFX942:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX942;

  case GK_GFX950:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX950;

  case GK_GFX1010: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1010;

  case GK_GFX1011: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1011;

  case GK_GFX1012: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1012;

  case GK_GFX1013: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1013;

  case GK_GFX1030: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1030;

  case GK_GFX1031: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1031;

  case GK_GFX1032: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1032;

  case GK_GFX1033: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1033;

  case GK_GFX1034: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1034;

  case GK_GFX1035: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1035;

  case GK_GFX1036: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1036;

  case GK_GFX1100: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1100;

  case GK_GFX1101: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1101;

  case GK_GFX1102: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1102;

  case GK_GFX1103: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1103;

  case GK_GFX1150: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1150;

  case GK_GFX1151: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1151;

  case GK_GFX1152: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1152;

  case GK_GFX1153: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1153;

  case GK_GFX1200: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1200;

  case GK_GFX1201: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1201;

  case GK_GFX1250: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1250;

  case GK_GFX1251: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1251;

  case GK_GFX9_GENERIC:     return ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC;

  case GK_GFX9_4_GENERIC:   return ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC;

  case GK_GFX10_1_GENERIC:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC;

  case GK_GFX10_3_GENERIC:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC;

  case GK_GFX11_GENERIC:    return ELF::EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC;

  case GK_GFX12_GENERIC:    return ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC;

  case GK_NONE:    return ELF::EF_AMDGPU_MACH_NONE;

  }

  // clang-format on


  llvm_unreachable("unknown GPU");

}


//===----------------------------------------------------------------------===//

// AMDGPUTargetAsmStreamer

//===----------------------------------------------------------------------===//


AMDGPUTargetAsmStreamer::AMDGPUTargetAsmStreamer(MCStreamer &S,

                                                 formatted_raw_ostream &OS)

    : AMDGPUTargetStreamer(S), OS(OS) { }


// A hook for emitting stuff at the end.

// We use it for emitting the accumulated PAL metadata as directives.

// The PAL metadata is reset after it is emitted.


void AMDGPUTargetAsmStreamer::finish() {

  std::string S;

  getPALMetadata()->toString(S);

  OS << S;


  // Reset the pal metadata so its data will not affect a compilation that

  // reuses this object.

  getPALMetadata()->reset();

}


void AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget() {

  OS << "\t.amdgcn_target \"" << getTargetID()->toString() << "\"\n";

}


void AMDGPUTargetAsmStreamer::EmitDirectiveAMDHSACodeObjectVersion(

    unsigned COV) {

  AMDGPUTargetStreamer::EmitDirectiveAMDHSACodeObjectVersion(COV);

  OS << "\t.amdhsa_code_object_version " << COV << '\n';

}


void AMDGPUTargetAsmStreamer::EmitAMDKernelCodeT(AMDGPUMCKernelCodeT &Header) {

  auto FoldAndPrint = [&](const MCExpr *Expr, raw_ostream &OS,

                          const MCAsmInfo *MAI) {

    printAMDGPUMCExpr(foldAMDGPUMCExpr(Expr, getContext()), OS, MAI);

  };


  OS << "\t.amd_kernel_code_t\n";

  Header.EmitKernelCodeT(OS, getContext(), FoldAndPrint);

  OS << "\t.end_amd_kernel_code_t\n";

}


void AMDGPUTargetAsmStreamer::EmitAMDGPUSymbolType(StringRef SymbolName,

                                                   unsigned Type) {

  switch (Type) {

    default: llvm_unreachable("Invalid AMDGPU symbol type");

    case ELF::STT_AMDGPU_HSA_KERNEL:

      OS << "\t.amdgpu_hsa_kernel " << SymbolName << '\n' ;

      break;

  }

}


void AMDGPUTargetAsmStreamer::emitAMDGPULDS(MCSymbol *Symbol, unsigned Size,

                                            Align Alignment) {

  OS << "\t.amdgpu_lds " << Symbol->getName() << ", " << Size << ", "

     << Alignment.value() << '\n';

}


void AMDGPUTargetAsmStreamer::EmitMCResourceInfo(

    const MCSymbol *NumVGPR, const MCSymbol *NumAGPR,

    const MCSymbol *NumExplicitSGPR, const MCSymbol *NumNamedBarrier,

    const MCSymbol *PrivateSegmentSize, const MCSymbol *UsesVCC,

    const MCSymbol *UsesFlatScratch, const MCSymbol *HasDynamicallySizedStack,

    const MCSymbol *HasRecursion, const MCSymbol *HasIndirectCall) {

#define PRINT_RES_INFO(ARG)                                                    \

  OS << "\t.set ";                                                             \

  ARG->print(OS, getContext().getAsmInfo());                                   \

  OS << ", ";                                                                  \

  getContext().getAsmInfo()->printExpr(OS, *ARG->getVariableValue());          \

  Streamer.addBlankLine();


  PRINT_RES_INFO(NumVGPR);

  PRINT_RES_INFO(NumAGPR);

  PRINT_RES_INFO(NumExplicitSGPR);

  PRINT_RES_INFO(NumNamedBarrier);

  PRINT_RES_INFO(PrivateSegmentSize);

  PRINT_RES_INFO(UsesVCC);

  PRINT_RES_INFO(UsesFlatScratch);

  PRINT_RES_INFO(HasDynamicallySizedStack);

  PRINT_RES_INFO(HasRecursion);

  PRINT_RES_INFO(HasIndirectCall);

#undef PRINT_RES_INFO

}


void AMDGPUTargetAsmStreamer::EmitMCResourceMaximums(

    const MCSymbol *MaxVGPR, const MCSymbol *MaxAGPR, const MCSymbol *MaxSGPR,

    const MCSymbol *MaxNamedBarrier) {

#define PRINT_RES_INFO(ARG)                                                    \

  OS << "\t.set ";                                                             \

  ARG->print(OS, getContext().getAsmInfo());                                   \

  OS << ", ";                                                                  \

  getContext().getAsmInfo()->printExpr(OS, *ARG->getVariableValue());          \

  Streamer.addBlankLine();


  PRINT_RES_INFO(MaxVGPR);

  PRINT_RES_INFO(MaxAGPR);

  PRINT_RES_INFO(MaxSGPR);

  PRINT_RES_INFO(MaxNamedBarrier);

#undef PRINT_RES_INFO

}


bool AMDGPUTargetAsmStreamer::EmitISAVersion() {

  OS << "\t.amd_amdgpu_isa \"" << getTargetID()->toString() << "\"\n";

  return true;

}


bool AMDGPUTargetAsmStreamer::EmitHSAMetadata(

    msgpack::Document &HSAMetadataDoc, bool Strict) {

  HSAMD::V3::MetadataVerifier Verifier(Strict);

  if (!Verifier.verify(HSAMetadataDoc.getRoot()))

    return false;


  std::string HSAMetadataString;

  raw_string_ostream StrOS(HSAMetadataString);

  HSAMetadataDoc.toYAML(StrOS);


  OS << '\t' << HSAMD::V3::AssemblerDirectiveBegin << '\n';

  OS << StrOS.str() << '\n';

  OS << '\t' << HSAMD::V3::AssemblerDirectiveEnd << '\n';

  return true;

}


bool AMDGPUTargetAsmStreamer::EmitCodeEnd(const MCSubtargetInfo &STI) {

  const uint32_t Encoded_s_code_end = 0xbf9f0000;

  const uint32_t Encoded_s_nop = 0xbf800000;

  uint32_t Encoded_pad = Encoded_s_code_end;


  // Instruction cache line size in bytes.

  const unsigned Log2CacheLineSize = AMDGPU::isGFX11Plus(STI) ? 7 : 6;

  const unsigned CacheLineSize = 1u << Log2CacheLineSize;


  // Extra padding amount in bytes to support prefetch mode 3.

  unsigned FillSize = 3 * CacheLineSize;


  if (AMDGPU::isGFX90A(STI)) {

    Encoded_pad = Encoded_s_nop;

    FillSize = 16 * CacheLineSize;

  }


  OS << "\t.p2alignl " << Log2CacheLineSize << ", " << Encoded_pad << '\n';

  OS << "\t.fill " << (FillSize / 4) << ", 4, " << Encoded_pad << '\n';

  return true;

}


void AMDGPUTargetAsmStreamer::EmitAmdhsaKernelDescriptor(

    const MCSubtargetInfo &STI, StringRef KernelName,

    const MCKernelDescriptor &KD, const MCExpr *NextVGPR,

    const MCExpr *NextSGPR, const MCExpr *ReserveVCC,

    const MCExpr *ReserveFlatScr) {

  IsaVersion IVersion = getIsaVersion(STI.getCPU());

  const MCAsmInfo *MAI = getContext().getAsmInfo();


  OS << "\t.amdhsa_kernel " << KernelName << '\n';


  auto PrintField = [&](const MCExpr *Expr, uint32_t Shift, uint32_t Mask,

                        StringRef Directive) {

    OS << "\t\t" << Directive << ' ';

    const MCExpr *ShiftedAndMaskedExpr =

        MCKernelDescriptor::bits_get(Expr, Shift, Mask, getContext());

    const MCExpr *New = foldAMDGPUMCExpr(ShiftedAndMaskedExpr, getContext());

    printAMDGPUMCExpr(New, OS, MAI);

    OS << '\n';

  };


  auto EmitMCExpr = [&](const MCExpr *Value) {

    const MCExpr *NewExpr = foldAMDGPUMCExpr(Value, getContext());

    printAMDGPUMCExpr(NewExpr, OS, MAI);

  };


  OS << "\t\t.amdhsa_group_segment_fixed_size ";

  EmitMCExpr(KD.group_segment_fixed_size);

  OS << '\n';


  OS << "\t\t.amdhsa_private_segment_fixed_size ";

  EmitMCExpr(KD.private_segment_fixed_size);

  OS << '\n';


  OS << "\t\t.amdhsa_kernarg_size ";

  EmitMCExpr(KD.kernarg_size);

  OS << '\n';


  if (isGFX1250(STI)) {

    PrintField(KD.compute_pgm_rsrc2,

               amdhsa::COMPUTE_PGM_RSRC2_GFX125_USER_SGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC2_GFX125_USER_SGPR_COUNT,

               ".amdhsa_user_sgpr_count");

  } else {

    PrintField(KD.compute_pgm_rsrc2,

               amdhsa::COMPUTE_PGM_RSRC2_GFX6_GFX120_USER_SGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC2_GFX6_GFX120_USER_SGPR_COUNT,

               ".amdhsa_user_sgpr_count");

  }


  if (!hasArchitectedFlatScratch(STI))

    PrintField(

        KD.kernel_code_properties,

        amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_BUFFER_SHIFT,

        amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_BUFFER,

        ".amdhsa_user_sgpr_private_segment_buffer");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_PTR,

             ".amdhsa_user_sgpr_dispatch_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_QUEUE_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_QUEUE_PTR,

             ".amdhsa_user_sgpr_queue_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_KERNARG_SEGMENT_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_KERNARG_SEGMENT_PTR,

             ".amdhsa_user_sgpr_kernarg_segment_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_ID_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_ID,

             ".amdhsa_user_sgpr_dispatch_id");

  if (!hasArchitectedFlatScratch(STI))

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_FLAT_SCRATCH_INIT_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_FLAT_SCRATCH_INIT,

               ".amdhsa_user_sgpr_flat_scratch_init");

  if (hasKernargPreload(STI)) {

    PrintField(KD.kernarg_preload, amdhsa::KERNARG_PRELOAD_SPEC_LENGTH_SHIFT,

               amdhsa::KERNARG_PRELOAD_SPEC_LENGTH,

               ".amdhsa_user_sgpr_kernarg_preload_length");

    PrintField(KD.kernarg_preload, amdhsa::KERNARG_PRELOAD_SPEC_OFFSET_SHIFT,

               amdhsa::KERNARG_PRELOAD_SPEC_OFFSET,

               ".amdhsa_user_sgpr_kernarg_preload_offset");

  }

  PrintField(

      KD.kernel_code_properties,

      amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_SIZE_SHIFT,

      amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_SIZE,

      ".amdhsa_user_sgpr_private_segment_size");

  if (IVersion.Major >= 10)

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32,

               ".amdhsa_wavefront_size32");

  if (CodeObjectVersion >= AMDGPU::AMDHSA_COV5)

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_USES_DYNAMIC_STACK_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_USES_DYNAMIC_STACK,

               ".amdhsa_uses_dynamic_stack");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT,

             (hasArchitectedFlatScratch(STI)

                  ? ".amdhsa_enable_private_segment"

                  : ".amdhsa_system_sgpr_private_segment_wavefront_offset"));

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X,

             ".amdhsa_system_sgpr_workgroup_id_x");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Y_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Y,

             ".amdhsa_system_sgpr_workgroup_id_y");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Z_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Z,

             ".amdhsa_system_sgpr_workgroup_id_z");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_INFO_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_INFO,

             ".amdhsa_system_sgpr_workgroup_info");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_VGPR_WORKITEM_ID_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_VGPR_WORKITEM_ID,

             ".amdhsa_system_vgpr_workitem_id");


  // These directives are required.

  OS << "\t\t.amdhsa_next_free_vgpr ";

  EmitMCExpr(NextVGPR);

  OS << '\n';


  OS << "\t\t.amdhsa_next_free_sgpr ";

  EmitMCExpr(NextSGPR);

  OS << '\n';


  if (AMDGPU::isGFX90A(STI)) {

    // MCExpr equivalent of taking the (accum_offset + 1) * 4.

    const MCExpr *accum_bits = MCKernelDescriptor::bits_get(

        KD.compute_pgm_rsrc3,

        amdhsa::COMPUTE_PGM_RSRC3_GFX90A_ACCUM_OFFSET_SHIFT,

        amdhsa::COMPUTE_PGM_RSRC3_GFX90A_ACCUM_OFFSET, getContext());

    accum_bits = MCBinaryExpr::createAdd(

        accum_bits, MCConstantExpr::create(1, getContext()), getContext());

    accum_bits = MCBinaryExpr::createMul(

        accum_bits, MCConstantExpr::create(4, getContext()), getContext());

    OS << "\t\t.amdhsa_accum_offset ";

    const MCExpr *New = foldAMDGPUMCExpr(accum_bits, getContext());

    printAMDGPUMCExpr(New, OS, MAI);

    OS << '\n';

  }


  if (AMDGPU::isGFX1250(STI))

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX125_NAMED_BAR_CNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX125_NAMED_BAR_CNT,

               ".amdhsa_named_barrier_count");


  OS << "\t\t.amdhsa_reserve_vcc ";

  EmitMCExpr(ReserveVCC);

  OS << '\n';


  if (IVersion.Major >= 7 && !hasArchitectedFlatScratch(STI)) {

    OS << "\t\t.amdhsa_reserve_flat_scratch ";

    EmitMCExpr(ReserveFlatScr);

    OS << '\n';

  }


  switch (CodeObjectVersion) {

  default:

    break;

  case AMDGPU::AMDHSA_COV4:

  case AMDGPU::AMDHSA_COV5:

    if (getTargetID()->isXnackSupported())

      OS << "\t\t.amdhsa_reserve_xnack_mask " << getTargetID()->isXnackOnOrAny() << '\n';

    break;

  }


  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_32_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_32,

             ".amdhsa_float_round_mode_32");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_16_64_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_16_64,

             ".amdhsa_float_round_mode_16_64");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_32_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_32,

             ".amdhsa_float_denorm_mode_32");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64,

             ".amdhsa_float_denorm_mode_16_64");

  if (IVersion.Major < 12) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP,

               ".amdhsa_dx10_clamp");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE,

               ".amdhsa_ieee_mode");

  }

  if (IVersion.Major >= 9) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX9_PLUS_FP16_OVFL_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX9_PLUS_FP16_OVFL,

               ".amdhsa_fp16_overflow");

  }

  if (AMDGPU::isGFX90A(STI))

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT, ".amdhsa_tg_split");

  if (AMDGPU::supportsWGP(STI))

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE,

               ".amdhsa_workgroup_processor_mode");

  if (IVersion.Major >= 10) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED,

               ".amdhsa_memory_ordered");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_FWD_PROGRESS_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_FWD_PROGRESS,

               ".amdhsa_forward_progress");

  }

  if (IVersion.Major >= 10 && IVersion.Major < 12) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT,

               ".amdhsa_shared_vgpr_count");

  }

  if (IVersion.Major == 11) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX11_INST_PREF_SIZE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX11_INST_PREF_SIZE,

               ".amdhsa_inst_pref_size");

  }

  if (IVersion.Major >= 12) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX12_PLUS_INST_PREF_SIZE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX12_PLUS_INST_PREF_SIZE,

               ".amdhsa_inst_pref_size");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX12_PLUS_ENABLE_WG_RR_EN_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX12_PLUS_ENABLE_WG_RR_EN,

               ".amdhsa_round_robin_scheduling");

  }

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::

          COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INVALID_OPERATION_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INVALID_OPERATION,

      ".amdhsa_exception_fp_ieee_invalid_op");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_FP_DENORMAL_SOURCE_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_FP_DENORMAL_SOURCE,

      ".amdhsa_exception_fp_denorm_src");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::

          COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_DIVISION_BY_ZERO_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_DIVISION_BY_ZERO,

      ".amdhsa_exception_fp_ieee_div_zero");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_OVERFLOW_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_OVERFLOW,

      ".amdhsa_exception_fp_ieee_overflow");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_UNDERFLOW_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_UNDERFLOW,

      ".amdhsa_exception_fp_ieee_underflow");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INEXACT_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INEXACT,

      ".amdhsa_exception_fp_ieee_inexact");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_INT_DIVIDE_BY_ZERO_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_INT_DIVIDE_BY_ZERO,

      ".amdhsa_exception_int_div_zero");


  OS << "\t.end_amdhsa_kernel\n";

}


//===----------------------------------------------------------------------===//

// AMDGPUTargetELFStreamer

//===----------------------------------------------------------------------===//


AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer(MCStreamer &S,

                                                 const MCSubtargetInfo &STI)

    : AMDGPUTargetStreamer(S), STI(STI), Streamer(S) {}


MCELFStreamer &AMDGPUTargetELFStreamer::getStreamer() {

  return static_cast<MCELFStreamer &>(Streamer);

}


// A hook for emitting stuff at the end.

// We use it for emitting the accumulated PAL metadata as a .note record.

// The PAL metadata is reset after it is emitted.


void AMDGPUTargetELFStreamer::finish() {

  ELFObjectWriter &W = getStreamer().getWriter();

  W.setELFHeaderEFlags(getEFlags());

  W.setOverrideABIVersion(

      getELFABIVersion(STI.getTargetTriple(), CodeObjectVersion));


  std::string Blob;

  const char *Vendor = getPALMetadata()->getVendor();

  unsigned Type = getPALMetadata()->getType();

  getPALMetadata()->toBlob(Type, Blob);

  if (Blob.empty())

    return;

  EmitNote(Vendor, MCConstantExpr::create(Blob.size(), getContext()), Type,

           [&](MCELFStreamer &OS) { OS.emitBytes(Blob); });


  // Reset the pal metadata so its data will not affect a compilation that

  // reuses this object.

  getPALMetadata()->reset();

}


void AMDGPUTargetELFStreamer::EmitNote(

    StringRef Name, const MCExpr *DescSZ, unsigned NoteType,

    function_ref<void(MCELFStreamer &)> EmitDesc) {

  auto &S = getStreamer();

  auto &Context = S.getContext();


  auto NameSZ = Name.size() + 1;


  unsigned NoteFlags = 0;

  // TODO Apparently, this is currently needed for OpenCL as mentioned in

  // https://reviews.llvm.org/D74995

  if (isHsaAbi(STI))

    NoteFlags = ELF::SHF_ALLOC;


  S.pushSection();

  S.switchSection(

      Context.getELFSection(ElfNote::SectionName, ELF::SHT_NOTE, NoteFlags));

  S.emitInt32(NameSZ);                                        // namesz

  S.emitValue(DescSZ, 4);                                     // descz

  S.emitInt32(NoteType);                                      // type

  S.emitBytes(Name);                                          // name

  S.emitValueToAlignment(Align(4), 0, 1, 0);                  // padding 0

  EmitDesc(S);                                                // desc

  S.emitValueToAlignment(Align(4), 0, 1, 0);                  // padding 0

  S.popSection();

}


unsigned AMDGPUTargetELFStreamer::getEFlags() {

  switch (STI.getTargetTriple().getArch()) {

  default:

    llvm_unreachable("Unsupported Arch");

  case Triple::r600:

    return getEFlagsR600();

  case Triple::amdgcn:

    return getEFlagsAMDGCN();

  }

}


unsigned AMDGPUTargetELFStreamer::getEFlagsR600() {

  assert(STI.getTargetTriple().getArch() == Triple::r600);


  return getElfMach(STI.getCPU());

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDGCN() {

  assert(STI.getTargetTriple().isAMDGCN());


  switch (STI.getTargetTriple().getOS()) {

  default:

    // TODO: Why are some tests have "mingw" listed as OS?

    // llvm_unreachable("Unsupported OS");

  case Triple::UnknownOS:

    return getEFlagsUnknownOS();

  case Triple::AMDHSA:

    return getEFlagsAMDHSA();

  case Triple::AMDPAL:

    return getEFlagsAMDPAL();

  case Triple::Mesa3D:

    return getEFlagsMesa3D();

  }

}


unsigned AMDGPUTargetELFStreamer::getEFlagsUnknownOS() {

  // TODO: Why are some tests have "mingw" listed as OS?

  // assert(STI.getTargetTriple().getOS() == Triple::UnknownOS);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDHSA() {

  assert(isHsaAbi(STI));


  if (CodeObjectVersion >= 6)

    return getEFlagsV6();

  return getEFlagsV4();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDPAL() {

  assert(STI.getTargetTriple().getOS() == Triple::AMDPAL);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsMesa3D() {

  assert(STI.getTargetTriple().getOS() == Triple::Mesa3D);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV3() {

  unsigned EFlagsV3 = 0;


  // mach.

  EFlagsV3 |= getElfMach(STI.getCPU());


  // xnack.

  if (getTargetID()->isXnackOnOrAny())

    EFlagsV3 |= ELF::EF_AMDGPU_FEATURE_XNACK_V3;

  // sramecc.

  if (getTargetID()->isSramEccOnOrAny())

    EFlagsV3 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_V3;


  return EFlagsV3;

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV4() {

  unsigned EFlagsV4 = 0;


  // mach.

  EFlagsV4 |= getElfMach(STI.getCPU());


  // xnack.

  switch (getTargetID()->getXnackSetting()) {

  case AMDGPU::IsaInfo::TargetIDSetting::Unsupported:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Any:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_ANY_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Off:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_OFF_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::On:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_ON_V4;

    break;

  }

  // sramecc.

  switch (getTargetID()->getSramEccSetting()) {

  case AMDGPU::IsaInfo::TargetIDSetting::Unsupported:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Any:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_ANY_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Off:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_OFF_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::On:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_ON_V4;

    break;

  }


  return EFlagsV4;

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV6() {

  unsigned Flags = getEFlagsV4();


  unsigned Version = ForceGenericVersion;

  if (!Version) {

    switch (parseArchAMDGCN(STI.getCPU())) {

    case AMDGPU::GK_GFX9_GENERIC:

      Version = GenericVersion::GFX9;

      break;

    case AMDGPU::GK_GFX9_4_GENERIC:

      Version = GenericVersion::GFX9_4;

      break;

    case AMDGPU::GK_GFX10_1_GENERIC:

      Version = GenericVersion::GFX10_1;

      break;

    case AMDGPU::GK_GFX10_3_GENERIC:

      Version = GenericVersion::GFX10_3;

      break;

    case AMDGPU::GK_GFX11_GENERIC:

      Version = GenericVersion::GFX11;

      break;

    case AMDGPU::GK_GFX12_GENERIC:

      Version = GenericVersion::GFX12;

      break;

    default:

      break;

    }

  }


  // Versions start at 1.

  if (Version) {

    if (Version > ELF::EF_AMDGPU_GENERIC_VERSION_MAX)

      report_fatal_error("Cannot encode generic code object version " +

                         Twine(Version) +

                         " - no ELF flag can represent this version!");

    Flags |= (Version << ELF::EF_AMDGPU_GENERIC_VERSION_OFFSET);

  }


  return Flags;

}


void AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget() {}


void AMDGPUTargetELFStreamer::EmitAMDKernelCodeT(AMDGPUMCKernelCodeT &Header) {

  MCStreamer &OS = getStreamer();

  OS.pushSection();

  Header.EmitKernelCodeT(OS, getContext());

  OS.popSection();

}


void AMDGPUTargetELFStreamer::EmitAMDGPUSymbolType(StringRef SymbolName,

                                                   unsigned Type) {

  auto *Symbol = static_cast<MCSymbolELF *>(

      getStreamer().getContext().getOrCreateSymbol(SymbolName));

  Symbol->setType(Type);

}


void AMDGPUTargetELFStreamer::emitAMDGPULDS(MCSymbol *Symbol, unsigned Size,

                                            Align Alignment) {

  auto *SymbolELF = static_cast<MCSymbolELF *>(Symbol);

  SymbolELF->setType(ELF::STT_OBJECT);


  if (!SymbolELF->isBindingSet())

    SymbolELF->setBinding(ELF::STB_GLOBAL);


  if (SymbolELF->declareCommon(Size, Alignment)) {

    report_fatal_error("Symbol: " + Symbol->getName() +

                       " redeclared as different type");

  }


  SymbolELF->setIndex(ELF::SHN_AMDGPU_LDS);

  SymbolELF->setSize(MCConstantExpr::create(Size, getContext()));

}


bool AMDGPUTargetELFStreamer::EmitISAVersion() {

  // Create two labels to mark the beginning and end of the desc field

  // and a MCExpr to calculate the size of the desc field.

  auto &Context = getContext();

  auto *DescBegin = Context.createTempSymbol();

  auto *DescEnd = Context.createTempSymbol();

  auto *DescSZ = MCBinaryExpr::createSub(

    MCSymbolRefExpr::create(DescEnd, Context),

    MCSymbolRefExpr::create(DescBegin, Context), Context);


  EmitNote(ElfNote::NoteNameV2, DescSZ, ELF::NT_AMD_HSA_ISA_NAME,

           [&](MCELFStreamer &OS) {

             OS.emitLabel(DescBegin);

             OS.emitBytes(getTargetID()->toString());

             OS.emitLabel(DescEnd);

           });

  return true;

}


bool AMDGPUTargetELFStreamer::EmitHSAMetadata(msgpack::Document &HSAMetadataDoc,

                                              bool Strict) {

  HSAMD::V3::MetadataVerifier Verifier(Strict);

  if (!Verifier.verify(HSAMetadataDoc.getRoot()))

    return false;


  std::string HSAMetadataString;

  HSAMetadataDoc.writeToBlob(HSAMetadataString);


  // Create two labels to mark the beginning and end of the desc field

  // and a MCExpr to calculate the size of the desc field.

  auto &Context = getContext();

  auto *DescBegin = Context.createTempSymbol();

  auto *DescEnd = Context.createTempSymbol();

  auto *DescSZ = MCBinaryExpr::createSub(

      MCSymbolRefExpr::create(DescEnd, Context),

      MCSymbolRefExpr::create(DescBegin, Context), Context);


  EmitNote(ElfNote::NoteNameV3, DescSZ, ELF::NT_AMDGPU_METADATA,

           [&](MCELFStreamer &OS) {

             OS.emitLabel(DescBegin);

             OS.emitBytes(HSAMetadataString);

             OS.emitLabel(DescEnd);

           });

  return true;

}


bool AMDGPUTargetELFStreamer::EmitCodeEnd(const MCSubtargetInfo &STI) {

  const uint32_t Encoded_s_code_end = 0xbf9f0000;

  const uint32_t Encoded_s_nop = 0xbf800000;

  uint32_t Encoded_pad = Encoded_s_code_end;


  // Instruction cache line size in bytes.

  const unsigned Log2CacheLineSize = AMDGPU::isGFX11Plus(STI) ? 7 : 6;

  const unsigned CacheLineSize = 1u << Log2CacheLineSize;


  // Extra padding amount in bytes to support prefetch mode 3.

  unsigned FillSize = 3 * CacheLineSize;


  if (AMDGPU::isGFX90A(STI)) {

    Encoded_pad = Encoded_s_nop;

    FillSize = 16 * CacheLineSize;

  }


  MCStreamer &OS = getStreamer();

  OS.pushSection();

  OS.emitValueToAlignment(Align(CacheLineSize), Encoded_pad, 4);

  for (unsigned I = 0; I < FillSize; I += 4)

    OS.emitInt32(Encoded_pad);

  OS.popSection();

  return true;

}


void AMDGPUTargetELFStreamer::EmitAmdhsaKernelDescriptor(

    const MCSubtargetInfo &STI, StringRef KernelName,

    const MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR,

    const MCExpr *NextSGPR, const MCExpr *ReserveVCC,

    const MCExpr *ReserveFlatScr) {

  auto &Streamer = getStreamer();

  auto &Context = Streamer.getContext();


  auto *KernelCodeSymbol =

      static_cast<MCSymbolELF *>(Context.getOrCreateSymbol(Twine(KernelName)));

  auto *KernelDescriptorSymbol = static_cast<MCSymbolELF *>(

      Context.getOrCreateSymbol(Twine(KernelName) + Twine(".kd")));


  // Copy kernel descriptor symbol's binding, other and visibility from the

  // kernel code symbol.

  KernelDescriptorSymbol->setBinding(KernelCodeSymbol->getBinding());

  KernelDescriptorSymbol->setOther(KernelCodeSymbol->getOther());

  KernelDescriptorSymbol->setVisibility(KernelCodeSymbol->getVisibility());

  // Kernel descriptor symbol's type and size are fixed.

  KernelDescriptorSymbol->setType(ELF::STT_OBJECT);

  KernelDescriptorSymbol->setSize(

      MCConstantExpr::create(sizeof(amdhsa::kernel_descriptor_t), Context));


  // The visibility of the kernel code symbol must be protected or less to allow

  // static relocations from the kernel descriptor to be used.

  if (KernelCodeSymbol->getVisibility() == ELF::STV_DEFAULT)

    KernelCodeSymbol->setVisibility(ELF::STV_PROTECTED);


  Streamer.emitLabel(KernelDescriptorSymbol);

  Streamer.emitValue(

      KernelDescriptor.group_segment_fixed_size,

      sizeof(amdhsa::kernel_descriptor_t::group_segment_fixed_size));

  Streamer.emitValue(

      KernelDescriptor.private_segment_fixed_size,

      sizeof(amdhsa::kernel_descriptor_t::private_segment_fixed_size));

  Streamer.emitValue(KernelDescriptor.kernarg_size,

                     sizeof(amdhsa::kernel_descriptor_t::kernarg_size));


  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved0); ++i)

    Streamer.emitInt8(0u);


  // FIXME: Remove the use of VK_AMDGPU_REL64 in the expression below. The

  // expression being created is:

  //   (start of kernel code) - (start of kernel descriptor)

  // It implies R_AMDGPU_REL64, but ends up being R_AMDGPU_ABS64.

  Streamer.emitValue(

      MCBinaryExpr::createSub(

          MCSymbolRefExpr::create(KernelCodeSymbol, AMDGPUMCExpr::S_REL64,

                                  Context),

          MCSymbolRefExpr::create(KernelDescriptorSymbol, Context), Context),

      sizeof(amdhsa::kernel_descriptor_t::kernel_code_entry_byte_offset));

  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved1); ++i)

    Streamer.emitInt8(0u);

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc3,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc3));

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc1,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc1));

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc2,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc2));

  Streamer.emitValue(

      KernelDescriptor.kernel_code_properties,

      sizeof(amdhsa::kernel_descriptor_t::kernel_code_properties));

  Streamer.emitValue(KernelDescriptor.kernarg_preload,

                     sizeof(amdhsa::kernel_descriptor_t::kernarg_preload));

  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved3); ++i)

    Streamer.emitInt8(0u);

}


assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

AMDGPUBaseInfo.h

AMDGPUMCExpr.h

AMDGPUMCKernelDescriptor.h
AMDHSA kernel descriptor MCExpr struct for use in MC layer.

AMDGPUMetadataVerifier.h
This is a verifier for AMDGPU HSA metadata, which can verify both well-typed metadata and untyped met...

AMDGPUMetadata.h
AMDGPU metadata definitions and in-memory representations.

AMDGPUPTNote.h
Enums and constants for AMDGPU PT_NOTE sections.

ForceGenericVersion
static cl::opt< unsigned > ForceGenericVersion("amdgpu-force-generic-version", cl::desc("Force a specific generic_v<N> flag to be " "added. For testing purposes only."), cl::ReallyHidden, cl::init(0))

PRINT_RES_INFO
#define PRINT_RES_INFO(ARG)

AMDGPUTargetStreamer.h

AMDHSAKernelDescriptor.h
AMDHSA kernel descriptor definitions.

AMDKernelCodeTUtils.h
MC layer struct for AMDGPUMCKernelCodeT, provides MCExpr functionality where required.

ELF.h

CommandLine.h

FormattedStream.h

InlinePriorityMode::Size
@ Size
Definition InlineOrder.cpp:25

MCAsmInfo.h

MCAssembler.h

MCContext.h

MCELFObjectWriter.h

MCELFStreamer.h

MCSubtargetInfo.h

I
#define I(x, y, z)
Definition MD5.cpp:57

Verifier
verify safepoint Safepoint IR Verifier
Definition SafepointIRVerifier.cpp:248

TargetParser.h

CacheLineSize
static cl::opt< unsigned > CacheLineSize("cache-line-size", cl::init(0), cl::Hidden, cl::desc("Use this to override the target cache line size when " "specified by the user."))

NewExpr
Definition ItaniumDemangle.h:2121

PrintField
Definition AMDKernelCodeTUtils.cpp:206

llvm::AMDGPUMCExpr::S_REL64
@ S_REL64
Definition AMDGPUMCExpr.h:54

llvm::AMDGPUPALMetadata::getVendor
const char * getVendor() const
Definition AMDGPUPALMetadata.cpp:1018

llvm::AMDGPUPALMetadata::getType
unsigned getType() const
Definition AMDGPUPALMetadata.cpp:1026

llvm::AMDGPUPALMetadata::toBlob
void toBlob(unsigned Type, std::string &S)
Definition AMDGPUPALMetadata.cpp:868

llvm::AMDGPUPALMetadata::reset
void reset()
Definition AMDGPUPALMetadata.cpp:1041

llvm::AMDGPUPALMetadata::toString
void toString(std::string &S)
Definition AMDGPUPALMetadata.cpp:815

llvm::AMDGPUTargetAsmStreamer::AMDGPUTargetAsmStreamer
AMDGPUTargetAsmStreamer(MCStreamer &S, formatted_raw_ostream &OS)
Definition AMDGPUTargetStreamer.cpp:225

llvm::AMDGPUTargetAsmStreamer::EmitHSAMetadata
bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict) override
Definition AMDGPUTargetStreamer.cpp:327

llvm::AMDGPUTargetAsmStreamer::EmitAMDGPUSymbolType
void EmitAMDGPUSymbolType(StringRef SymbolName, unsigned Type) override
Definition AMDGPUTargetStreamer.cpp:263

llvm::AMDGPUTargetAsmStreamer::EmitISAVersion
bool EmitISAVersion() override
Definition AMDGPUTargetStreamer.cpp:322

llvm::AMDGPUTargetAsmStreamer::EmitDirectiveAMDHSACodeObjectVersion
void EmitDirectiveAMDHSACodeObjectVersion(unsigned COV) override
Definition AMDGPUTargetStreamer.cpp:246

llvm::AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget
void EmitDirectiveAMDGCNTarget() override
Definition AMDGPUTargetStreamer.cpp:242

llvm::AMDGPUTargetAsmStreamer::EmitMCResourceMaximums
void EmitMCResourceMaximums(const MCSymbol *MaxVGPR, const MCSymbol *MaxAGPR, const MCSymbol *MaxSGPR, const MCSymbol *MaxNamedBarrier) override
Definition AMDGPUTargetStreamer.cpp:305

llvm::AMDGPUTargetAsmStreamer::EmitAMDKernelCodeT
void EmitAMDKernelCodeT(AMDGPU::AMDGPUMCKernelCodeT &Header) override
Definition AMDGPUTargetStreamer.cpp:252

llvm::AMDGPUTargetAsmStreamer::EmitAmdhsaKernelDescriptor
void EmitAmdhsaKernelDescriptor(const MCSubtargetInfo &STI, StringRef KernelName, const AMDGPU::MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR, const MCExpr *NextSGPR, const MCExpr *ReserveVCC, const MCExpr *ReserveFlatScr) override
Definition AMDGPUTargetStreamer.cpp:365

llvm::AMDGPUTargetAsmStreamer::EmitMCResourceInfo
void EmitMCResourceInfo(const MCSymbol *NumVGPR, const MCSymbol *NumAGPR, const MCSymbol *NumExplicitSGPR, const MCSymbol *NumNamedBarrier, const MCSymbol *PrivateSegmentSize, const MCSymbol *UsesVCC, const MCSymbol *UsesFlatScratch, const MCSymbol *HasDynamicallySizedStack, const MCSymbol *HasRecursion, const MCSymbol *HasIndirectCall) override
Definition AMDGPUTargetStreamer.cpp:279

llvm::AMDGPUTargetAsmStreamer::finish
void finish() override
Definition AMDGPUTargetStreamer.cpp:232

llvm::AMDGPUTargetAsmStreamer::EmitCodeEnd
bool EmitCodeEnd(const MCSubtargetInfo &STI) override
Definition AMDGPUTargetStreamer.cpp:343

llvm::AMDGPUTargetAsmStreamer::emitAMDGPULDS
void emitAMDGPULDS(MCSymbol *Sym, unsigned Size, Align Alignment) override
Definition AMDGPUTargetStreamer.cpp:273

llvm::AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget
void EmitDirectiveAMDGCNTarget() override
Definition AMDGPUTargetStreamer.cpp:877

llvm::AMDGPUTargetELFStreamer::EmitCodeEnd
bool EmitCodeEnd(const MCSubtargetInfo &STI) override
Definition AMDGPUTargetStreamer.cpp:956

llvm::AMDGPUTargetELFStreamer::EmitAMDKernelCodeT
void EmitAMDKernelCodeT(AMDGPU::AMDGPUMCKernelCodeT &Header) override
Definition AMDGPUTargetStreamer.cpp:879

llvm::AMDGPUTargetELFStreamer::finish
void finish() override
Definition AMDGPUTargetStreamer.cpp:671

llvm::AMDGPUTargetELFStreamer::EmitHSAMetadata
bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict) override
Definition AMDGPUTargetStreamer.cpp:929

llvm::AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer
AMDGPUTargetELFStreamer(MCStreamer &S, const MCSubtargetInfo &STI)
Definition AMDGPUTargetStreamer.cpp:660

llvm::AMDGPUTargetELFStreamer::emitAMDGPULDS
void emitAMDGPULDS(MCSymbol *Sym, unsigned Size, Align Alignment) override
Definition AMDGPUTargetStreamer.cpp:893

llvm::AMDGPUTargetELFStreamer::EmitAmdhsaKernelDescriptor
void EmitAmdhsaKernelDescriptor(const MCSubtargetInfo &STI, StringRef KernelName, const AMDGPU::MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR, const MCExpr *NextSGPR, const MCExpr *ReserveVCC, const MCExpr *ReserveFlatScr) override
Definition AMDGPUTargetStreamer.cpp:982

llvm::AMDGPUTargetELFStreamer::getStreamer
MCELFStreamer & getStreamer()
Definition AMDGPUTargetStreamer.cpp:664

llvm::AMDGPUTargetELFStreamer::EmitAMDGPUSymbolType
void EmitAMDGPUSymbolType(StringRef SymbolName, unsigned Type) override
Definition AMDGPUTargetStreamer.cpp:886

llvm::AMDGPUTargetELFStreamer::EmitISAVersion
bool EmitISAVersion() override
Definition AMDGPUTargetStreamer.cpp:910

llvm::AMDGPUTargetStreamer::EmitHSAMetadata
virtual bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict)
Emit HSA Metadata.
Definition AMDGPUTargetStreamer.h:88

llvm::AMDGPUTargetStreamer::getPALMetadata
AMDGPUPALMetadata * getPALMetadata()
Definition AMDGPUTargetStreamer.h:48

llvm::AMDGPUTargetStreamer::AMDGPUTargetStreamer
AMDGPUTargetStreamer(MCStreamer &S)
Definition AMDGPUTargetStreamer.h:42

llvm::AMDGPUTargetStreamer::EmitDirectiveAMDHSACodeObjectVersion
virtual void EmitDirectiveAMDHSACodeObjectVersion(unsigned COV)
Definition AMDGPUTargetStreamer.h:52

llvm::AMDGPUTargetStreamer::EmitHSAMetadataV3
virtual bool EmitHSAMetadataV3(StringRef HSAMetadataString)
Definition AMDGPUTargetStreamer.cpp:46

llvm::AMDGPUTargetStreamer::getElfMach
static unsigned getElfMach(StringRef GPU)
Definition AMDGPUTargetStreamer.cpp:138

llvm::AMDGPUTargetStreamer::getContext
MCContext & getContext() const
Definition AMDGPUTargetStreamer.h:39

llvm::AMDGPUTargetStreamer::getArchNameFromElfMach
static StringRef getArchNameFromElfMach(unsigned ElfMach)
Definition AMDGPUTargetStreamer.cpp:53

llvm::AMDGPUTargetStreamer::getTargetID
const std::optional< AMDGPU::IsaInfo::AMDGPUTargetID > & getTargetID() const
Definition AMDGPUTargetStreamer.h:110

llvm::AMDGPUTargetStreamer::CodeObjectVersion
unsigned CodeObjectVersion
Definition AMDGPUTargetStreamer.h:37

llvm::AMDGPU::HSAMD::V3::MetadataVerifier
Verifier for AMDGPU HSA metadata.
Definition AMDGPUMetadataVerifier.h:45

llvm::Directive
Definition DirectiveEmitter.h:231

llvm::ELFObjectWriter
Definition MCELFObjectWriter.h:142

llvm::MCAsmInfo
This class is intended to be used as a base class for asm properties and features specific to the tar...
Definition MCAsmInfo.h:64

llvm::MCBinaryExpr::createAdd
static const MCBinaryExpr * createAdd(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx, SMLoc Loc=SMLoc())
Definition MCExpr.h:343

llvm::MCBinaryExpr::createMul
static const MCBinaryExpr * createMul(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx)
Definition MCExpr.h:398

llvm::MCBinaryExpr::createSub
static const MCBinaryExpr * createSub(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx)
Definition MCExpr.h:428

llvm::MCConstantExpr::create
static LLVM_ABI const MCConstantExpr * create(int64_t Value, MCContext &Ctx, bool PrintInHex=false, unsigned SizeInBytes=0)
Definition MCExpr.cpp:212

llvm::MCContext::getAsmInfo
const MCAsmInfo * getAsmInfo() const
Definition MCContext.h:412

llvm::MCContext::getOrCreateSymbol
LLVM_ABI MCSymbol * getOrCreateSymbol(const Twine &Name)
Lookup the symbol inside with the specified Name.
Definition MCContext.cpp:203

llvm::MCELFStreamer
Definition MCELFStreamer.h:31

llvm::MCELFStreamer::getWriter
ELFObjectWriter & getWriter()
Definition MCELFStreamer.cpp:46

llvm::MCELFStreamer::emitLabel
void emitLabel(MCSymbol *Symbol, SMLoc Loc=SMLoc()) override
Emit a label for Symbol into the current section.
Definition MCELFStreamer.cpp:60

llvm::MCExpr
Base class for the full range of assembler expressions which are needed for parsing.
Definition MCExpr.h:34

llvm::MCObjectStreamer::emitBytes
void emitBytes(StringRef Data) override
Emit the bytes in Data into the output.
Definition MCObjectStreamer.cpp:654

llvm::MCStreamer
Streaming machine code generation interface.
Definition MCStreamer.h:220

llvm::MCStreamer::popSection
virtual bool popSection()
Restore the current and previous section from the section stack.
Definition MCStreamer.cpp:1348

llvm::MCStreamer::getContext
MCContext & getContext() const
Definition MCStreamer.h:314

llvm::MCStreamer::emitValueToAlignment
virtual void emitValueToAlignment(Align Alignment, int64_t Fill=0, uint8_t FillLen=1, unsigned MaxBytesToEmit=0)
Emit some number of copies of Value until the byte alignment ByteAlignment is reached.
Definition MCStreamer.cpp:1341

llvm::MCStreamer::pushSection
void pushSection()
Save the current and previous section on the section stack.
Definition MCStreamer.h:443

llvm::MCStreamer::emitInt32
void emitInt32(uint64_t Value)
Definition MCStreamer.h:750

llvm::MCSubtargetInfo
Generic base class for all target subtargets.
Definition MCSubtargetInfo.h:77

llvm::MCSubtargetInfo::getTargetTriple
const Triple & getTargetTriple() const
Definition MCSubtargetInfo.h:111

llvm::MCSubtargetInfo::getCPU
StringRef getCPU() const
Definition MCSubtargetInfo.h:112

llvm::MCSymbolELF
Definition MCSymbolELF.h:15

llvm::MCSymbolELF::setBinding
void setBinding(unsigned Binding) const
Definition MCSymbolELF.cpp:43

llvm::MCSymbolELF::setType
void setType(unsigned Type) const
Definition MCSymbolELF.cpp:92

llvm::MCSymbolRefExpr::create
static const MCSymbolRefExpr * create(const MCSymbol *Symbol, MCContext &Ctx, SMLoc Loc=SMLoc())
Definition MCExpr.h:214

llvm::MCSymbol
MCSymbol - Instances of this class represent a symbol name in the MC file, and MCSymbols are created ...
Definition MCSymbol.h:42

llvm::StringRef
StringRef - Represent a constant reference to a string, i.e.
Definition StringRef.h:55

llvm::Triple::AMDHSA
@ AMDHSA
Definition Triple.h:231

llvm::Triple::UnknownOS
@ UnknownOS
Definition Triple.h:208

llvm::Triple::AMDPAL
@ AMDPAL
Definition Triple.h:241

llvm::Triple::Mesa3D
@ Mesa3D
Definition Triple.h:240

llvm::Triple::r600
@ r600
Definition Triple.h:76

llvm::Triple::amdgcn
@ amdgcn
Definition Triple.h:77

llvm::Triple::getArch
ArchType getArch() const
Get the parsed architecture type of this triple.
Definition Triple.h:413

llvm::Twine
Twine - A lightweight data structure for efficiently representing the concatenation of temporary valu...
Definition Twine.h:82

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition Type.h:45

llvm::Value
LLVM Value Representation.
Definition Value.h:75

llvm::cl::opt
Definition CommandLine.h:1455

llvm::formatted_raw_ostream
formatted_raw_ostream - A raw_ostream that wraps another one and keeps track of line and column posit...
Definition FormattedStream.h:31

llvm::function_ref
An efficient, type-erasing, non-owning reference to a callable.
Definition STLFunctionalExtras.h:37

llvm::msgpack::Document
Simple in-memory representation of a document of msgpack objects with ability to find and create arra...
Definition MsgPackDocument.h:280

llvm::msgpack::Document::getRoot
DocNode & getRoot()
Get ref to the document's root element.
Definition MsgPackDocument.h:304

llvm::msgpack::Document::toYAML
LLVM_ABI void toYAML(raw_ostream &OS)
Convert MsgPack Document to YAML text.
Definition MsgPackDocumentYAML.cpp:236

llvm::msgpack::Document::writeToBlob
LLVM_ABI void writeToBlob(std::string &Blob)
Write a MsgPack document to a binary MsgPack blob.
Definition MsgPackDocument.cpp:264

llvm::msgpack::Document::fromYAML
LLVM_ABI bool fromYAML(StringRef S)
Read YAML text into the MsgPack document. Returns false on failure.
Definition MsgPackDocumentYAML.cpp:242

llvm::raw_ostream
This class implements an extremely fast bulk output stream that can only output to a stream.
Definition raw_ostream.h:53

llvm::raw_string_ostream
A raw_ostream that writes to an std::string.
Definition raw_ostream.h:662

llvm::raw_string_ostream::str
std::string & str()
Returns the string's reference.
Definition raw_ostream.h:680

uint32_t

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition ErrorHandling.h:164

llvm::AMDGPU::ElfNote::NoteNameV2
const char NoteNameV2[]
Definition AMDGPUPTNote.h:26

llvm::AMDGPU::ElfNote::SectionName
const char SectionName[]
Definition AMDGPUPTNote.h:24

llvm::AMDGPU::ElfNote::NoteNameV3
const char NoteNameV3[]
Definition AMDGPUPTNote.h:27

llvm::AMDGPU::GenericVersion::GFX9_4
static constexpr unsigned GFX9_4
Definition AMDGPUBaseInfo.h:54

llvm::AMDGPU::GenericVersion::GFX10_1
static constexpr unsigned GFX10_1
Definition AMDGPUBaseInfo.h:55

llvm::AMDGPU::GenericVersion::GFX10_3
static constexpr unsigned GFX10_3
Definition AMDGPUBaseInfo.h:56

llvm::AMDGPU::GenericVersion::GFX11
static constexpr unsigned GFX11
Definition AMDGPUBaseInfo.h:57

llvm::AMDGPU::GenericVersion::GFX9
static constexpr unsigned GFX9
Definition AMDGPUBaseInfo.h:53

llvm::AMDGPU::GenericVersion::GFX12
static constexpr unsigned GFX12
Definition AMDGPUBaseInfo.h:58

llvm::AMDGPU::HSAMD::V3::AssemblerDirectiveBegin
constexpr char AssemblerDirectiveBegin[]
HSA metadata beginning assembler directive.
Definition AMDGPUMetadata.h:466

llvm::AMDGPU::HSAMD::V3::AssemblerDirectiveEnd
constexpr char AssemblerDirectiveEnd[]
HSA metadata ending assembler directive.
Definition AMDGPUMetadata.h:468

llvm::AMDGPU::IsaInfo::TargetIDSetting::On
@ On
Definition AMDGPUBaseInfo.h:150

llvm::AMDGPU::IsaInfo::TargetIDSetting::Unsupported
@ Unsupported
Definition AMDGPUBaseInfo.h:150

llvm::AMDGPU::IsaInfo::TargetIDSetting::Off
@ Off
Definition AMDGPUBaseInfo.h:150

llvm::AMDGPU::IsaInfo::TargetIDSetting::Any
@ Any
Definition AMDGPUBaseInfo.h:150

llvm::AMDGPU
Definition AMDGPUMetadataVerifier.h:34

llvm::AMDGPU::getArchNameR600
LLVM_ABI StringRef getArchNameR600(GPUKind AK)
Definition TargetParser.cpp:229

llvm::AMDGPU::GPUKind
GPUKind
GPU kinds supported by the AMDGPU target.
Definition TargetParser.h:38

llvm::AMDGPU::GK_GFX600
@ GK_GFX600
Definition TargetParser.h:64

llvm::AMDGPU::GK_SUMO
@ GK_SUMO
Definition TargetParser.h:54

llvm::AMDGPU::GK_GFX701
@ GK_GFX701
Definition TargetParser.h:69

llvm::AMDGPU::GK_GFX1030
@ GK_GFX1030
Definition TargetParser.h:96

llvm::AMDGPU::GK_GFX9_GENERIC
@ GK_GFX9_GENERIC
Definition TargetParser.h:121

llvm::AMDGPU::GK_GFX704
@ GK_GFX704
Definition TargetParser.h:72

llvm::AMDGPU::GK_GFX1251
@ GK_GFX1251
Definition TargetParser.h:116

llvm::AMDGPU::GK_GFX1013
@ GK_GFX1013
Definition TargetParser.h:95

llvm::AMDGPU::GK_R630
@ GK_R630
Definition TargetParser.h:44

llvm::AMDGPU::GK_JUNIPER
@ GK_JUNIPER
Definition TargetParser.h:52

llvm::AMDGPU::GK_GFX1033
@ GK_GFX1033
Definition TargetParser.h:99

llvm::AMDGPU::GK_RV730
@ GK_RV730
Definition TargetParser.h:48

llvm::AMDGPU::GK_GFX908
@ GK_GFX908
Definition TargetParser.h:85

llvm::AMDGPU::GK_RV670
@ GK_RV670
Definition TargetParser.h:46

llvm::AMDGPU::GK_RV710
@ GK_RV710
Definition TargetParser.h:47

llvm::AMDGPU::GK_GFX10_3_GENERIC
@ GK_GFX10_3_GENERIC
Definition TargetParser.h:123

llvm::AMDGPU::GK_GFX1031
@ GK_GFX1031
Definition TargetParser.h:97

llvm::AMDGPU::GK_GFX909
@ GK_GFX909
Definition TargetParser.h:86

llvm::AMDGPU::GK_GFX942
@ GK_GFX942
Definition TargetParser.h:89

llvm::AMDGPU::GK_GFX802
@ GK_GFX802
Definition TargetParser.h:76

llvm::AMDGPU::GK_GFX1102
@ GK_GFX1102
Definition TargetParser.h:106

llvm::AMDGPU::GK_GFX904
@ GK_GFX904
Definition TargetParser.h:83

llvm::AMDGPU::GK_GFX1101
@ GK_GFX1101
Definition TargetParser.h:105

llvm::AMDGPU::GK_TURKS
@ GK_TURKS
Definition TargetParser.h:58

llvm::AMDGPU::GK_GFX1035
@ GK_GFX1035
Definition TargetParser.h:101

llvm::AMDGPU::GK_GFX803
@ GK_GFX803
Definition TargetParser.h:77

llvm::AMDGPU::GK_GFX702
@ GK_GFX702
Definition TargetParser.h:70

llvm::AMDGPU::GK_GFX703
@ GK_GFX703
Definition TargetParser.h:71

llvm::AMDGPU::GK_GFX90A
@ GK_GFX90A
Definition TargetParser.h:87

llvm::AMDGPU::GK_GFX12_GENERIC
@ GK_GFX12_GENERIC
Definition TargetParser.h:125

llvm::AMDGPU::GK_NONE
@ GK_NONE
Definition TargetParser.h:40

llvm::AMDGPU::GK_CAYMAN
@ GK_CAYMAN
Definition TargetParser.h:57

llvm::AMDGPU::GK_GFX1200
@ GK_GFX1200
Definition TargetParser.h:113

llvm::AMDGPU::GK_GFX1250
@ GK_GFX1250
Definition TargetParser.h:115

llvm::AMDGPU::GK_REDWOOD
@ GK_REDWOOD
Definition TargetParser.h:53

llvm::AMDGPU::GK_GFX1150
@ GK_GFX1150
Definition TargetParser.h:108

llvm::AMDGPU::GK_CYPRESS
@ GK_CYPRESS
Definition TargetParser.h:51

llvm::AMDGPU::GK_GFX1100
@ GK_GFX1100
Definition TargetParser.h:104

llvm::AMDGPU::GK_GFX950
@ GK_GFX950
Definition TargetParser.h:90

llvm::AMDGPU::GK_GFX902
@ GK_GFX902
Definition TargetParser.h:82

llvm::AMDGPU::GK_GFX705
@ GK_GFX705
Definition TargetParser.h:73

llvm::AMDGPU::GK_GFX810
@ GK_GFX810
Definition TargetParser.h:79

llvm::AMDGPU::GK_GFX9_4_GENERIC
@ GK_GFX9_4_GENERIC
Definition TargetParser.h:126

llvm::AMDGPU::GK_GFX1151
@ GK_GFX1151
Definition TargetParser.h:109

llvm::AMDGPU::GK_GFX805
@ GK_GFX805
Definition TargetParser.h:78

llvm::AMDGPU::GK_GFX10_1_GENERIC
@ GK_GFX10_1_GENERIC
Definition TargetParser.h:122

llvm::AMDGPU::GK_BARTS
@ GK_BARTS
Definition TargetParser.h:55

llvm::AMDGPU::GK_GFX801
@ GK_GFX801
Definition TargetParser.h:75

llvm::AMDGPU::GK_CEDAR
@ GK_CEDAR
Definition TargetParser.h:50

llvm::AMDGPU::GK_GFX1153
@ GK_GFX1153
Definition TargetParser.h:111

llvm::AMDGPU::GK_GFX602
@ GK_GFX602
Definition TargetParser.h:66

llvm::AMDGPU::GK_CAICOS
@ GK_CAICOS
Definition TargetParser.h:56

llvm::AMDGPU::GK_GFX1012
@ GK_GFX1012
Definition TargetParser.h:94

llvm::AMDGPU::GK_GFX601
@ GK_GFX601
Definition TargetParser.h:65

llvm::AMDGPU::GK_RS880
@ GK_RS880
Definition TargetParser.h:45

llvm::AMDGPU::GK_GFX700
@ GK_GFX700
Definition TargetParser.h:68

llvm::AMDGPU::GK_GFX90C
@ GK_GFX90C
Definition TargetParser.h:88

llvm::AMDGPU::GK_GFX1152
@ GK_GFX1152
Definition TargetParser.h:110

llvm::AMDGPU::GK_GFX906
@ GK_GFX906
Definition TargetParser.h:84

llvm::AMDGPU::GK_GFX1034
@ GK_GFX1034
Definition TargetParser.h:100

llvm::AMDGPU::GK_GFX1010
@ GK_GFX1010
Definition TargetParser.h:92

llvm::AMDGPU::GK_GFX1201
@ GK_GFX1201
Definition TargetParser.h:114

llvm::AMDGPU::GK_GFX1103
@ GK_GFX1103
Definition TargetParser.h:107

llvm::AMDGPU::GK_GFX1036
@ GK_GFX1036
Definition TargetParser.h:102

llvm::AMDGPU::GK_GFX11_GENERIC
@ GK_GFX11_GENERIC
Definition TargetParser.h:124

llvm::AMDGPU::GK_RV770
@ GK_RV770
Definition TargetParser.h:49

llvm::AMDGPU::GK_GFX1011
@ GK_GFX1011
Definition TargetParser.h:93

llvm::AMDGPU::GK_GFX900
@ GK_GFX900
Definition TargetParser.h:81

llvm::AMDGPU::GK_GFX1032
@ GK_GFX1032
Definition TargetParser.h:98

llvm::AMDGPU::GK_R600
@ GK_R600
Definition TargetParser.h:43

llvm::AMDGPU::printAMDGPUMCExpr
void printAMDGPUMCExpr(const MCExpr *Expr, raw_ostream &OS, const MCAsmInfo *MAI)
Definition AMDGPUMCExpr.cpp:695

llvm::AMDGPU::AMDHSA_COV4
@ AMDHSA_COV4
Definition AMDGPUBaseInfo.h:61

llvm::AMDGPU::AMDHSA_COV5
@ AMDHSA_COV5
Definition AMDGPUBaseInfo.h:61

llvm::AMDGPU::isHsaAbi
bool isHsaAbi(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:198

llvm::AMDGPU::getIsaVersion
LLVM_ABI IsaVersion getIsaVersion(StringRef GPU)
Definition TargetParser.cpp:276

llvm::AMDGPU::isGFX90A
bool isGFX90A(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2574

llvm::AMDGPU::parseArchAMDGCN
LLVM_ABI GPUKind parseArchAMDGCN(StringRef CPU)
Definition TargetParser.cpp:235

llvm::AMDGPU::hasArchitectedFlatScratch
bool hasArchitectedFlatScratch(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2582

llvm::AMDGPU::isGFX11Plus
bool isGFX11Plus(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2522

llvm::AMDGPU::foldAMDGPUMCExpr
const MCExpr * foldAMDGPUMCExpr(const MCExpr *Expr, MCContext &Ctx)
Definition AMDGPUMCExpr.cpp:686

llvm::AMDGPU::getArchNameAMDGCN
LLVM_ABI StringRef getArchNameAMDGCN(GPUKind AK)
Definition TargetParser.cpp:223

llvm::AMDGPU::isGFX1250
bool isGFX1250(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2534

llvm::AMDGPU::hasKernargPreload
unsigned hasKernargPreload(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2598

llvm::AMDGPU::supportsWGP
bool supportsWGP(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2538

llvm::AMDGPU::getELFABIVersion
uint8_t getELFABIVersion(const Triple &T, unsigned CodeObjectVersion)
Definition AMDGPUBaseInfo.cpp:228

llvm::AMDGPU::parseArchR600
LLVM_ABI GPUKind parseArchR600(StringRef CPU)
Definition TargetParser.cpp:244

llvm::ELF::NT_AMDGPU_METADATA
@ NT_AMDGPU_METADATA
Definition ELF.h:1985

llvm::ELF::SHN_AMDGPU_LDS
@ SHN_AMDGPU_LDS
Definition ELF.h:1968

llvm::ELF::SHF_ALLOC
@ SHF_ALLOC
Definition ELF.h:1248

llvm::ELF::SHT_NOTE
@ SHT_NOTE
Definition ELF.h:1153

llvm::ELF::STB_GLOBAL
@ STB_GLOBAL
Definition ELF.h:1405

llvm::ELF::STT_AMDGPU_HSA_KERNEL
@ STT_AMDGPU_HSA_KERNEL
Definition ELF.h:1430

llvm::ELF::STT_OBJECT
@ STT_OBJECT
Definition ELF.h:1417

llvm::ELF::EF_AMDGPU_GENERIC_VERSION_MAX
@ EF_AMDGPU_GENERIC_VERSION_MAX
Definition ELF.h:924

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_ANY_V4
@ EF_AMDGPU_FEATURE_XNACK_ANY_V4
Definition ELF.h:901

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX703
@ EF_AMDGPU_MACH_AMDGCN_GFX703
Definition ELF.h:811

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1035
@ EF_AMDGPU_MACH_AMDGCN_GFX1035
Definition ELF.h:835

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_V3
@ EF_AMDGPU_FEATURE_SRAMECC_V3
Definition ELF.h:892

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1031
@ EF_AMDGPU_MACH_AMDGCN_GFX1031
Definition ELF.h:829

llvm::ELF::EF_AMDGPU_GENERIC_VERSION_OFFSET
@ EF_AMDGPU_GENERIC_VERSION_OFFSET
Definition ELF.h:922

llvm::ELF::EF_AMDGPU_MACH_R600_CAYMAN
@ EF_AMDGPU_MACH_R600_CAYMAN
Definition ELF.h:793

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4
@ EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4
Definition ELF.h:912

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX704
@ EF_AMDGPU_MACH_AMDGCN_GFX704
Definition ELF.h:812

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX902
@ EF_AMDGPU_MACH_AMDGCN_GFX902
Definition ELF.h:819

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX810
@ EF_AMDGPU_MACH_AMDGCN_GFX810
Definition ELF.h:817

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX950
@ EF_AMDGPU_MACH_AMDGCN_GFX950
Definition ELF.h:853

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1036
@ EF_AMDGPU_MACH_AMDGCN_GFX1036
Definition ELF.h:843

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1102
@ EF_AMDGPU_MACH_AMDGCN_GFX1102
Definition ELF.h:845

llvm::ELF::EF_AMDGPU_MACH_R600_RV730
@ EF_AMDGPU_MACH_R600_RV730
Definition ELF.h:782

llvm::ELF::EF_AMDGPU_MACH_R600_RV710
@ EF_AMDGPU_MACH_R600_RV710
Definition ELF.h:781

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX908
@ EF_AMDGPU_MACH_AMDGCN_GFX908
Definition ELF.h:822

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1011
@ EF_AMDGPU_MACH_AMDGCN_GFX1011
Definition ELF.h:826

llvm::ELF::EF_AMDGPU_MACH_R600_CYPRESS
@ EF_AMDGPU_MACH_R600_CYPRESS
Definition ELF.h:786

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1032
@ EF_AMDGPU_MACH_AMDGCN_GFX1032
Definition ELF.h:830

llvm::ELF::EF_AMDGPU_MACH_R600_R600
@ EF_AMDGPU_MACH_R600_R600
Definition ELF.h:776

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1250
@ EF_AMDGPU_MACH_AMDGCN_GFX1250
Definition ELF.h:847

llvm::ELF::EF_AMDGPU_MACH_R600_TURKS
@ EF_AMDGPU_MACH_R600_TURKS
Definition ELF.h:794

llvm::ELF::EF_AMDGPU_MACH_R600_JUNIPER
@ EF_AMDGPU_MACH_R600_JUNIPER
Definition ELF.h:787

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_OFF_V4
@ EF_AMDGPU_FEATURE_SRAMECC_OFF_V4
Definition ELF.h:916

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4
@ EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4
Definition ELF.h:899

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX601
@ EF_AMDGPU_MACH_AMDGCN_GFX601
Definition ELF.h:807

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX942
@ EF_AMDGPU_MACH_AMDGCN_GFX942
Definition ELF.h:850

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1152
@ EF_AMDGPU_MACH_AMDGCN_GFX1152
Definition ELF.h:859

llvm::ELF::EF_AMDGPU_MACH_R600_R630
@ EF_AMDGPU_MACH_R600_R630
Definition ELF.h:777

llvm::ELF::EF_AMDGPU_MACH_R600_REDWOOD
@ EF_AMDGPU_MACH_R600_REDWOOD
Definition ELF.h:788

llvm::ELF::EF_AMDGPU_MACH_R600_RV770
@ EF_AMDGPU_MACH_R600_RV770
Definition ELF.h:783

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_OFF_V4
@ EF_AMDGPU_FEATURE_XNACK_OFF_V4
Definition ELF.h:903

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX600
@ EF_AMDGPU_MACH_AMDGCN_GFX600
Definition ELF.h:806

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_V3
@ EF_AMDGPU_FEATURE_XNACK_V3
Definition ELF.h:887

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX602
@ EF_AMDGPU_MACH_AMDGCN_GFX602
Definition ELF.h:832

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1101
@ EF_AMDGPU_MACH_AMDGCN_GFX1101
Definition ELF.h:844

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1100
@ EF_AMDGPU_MACH_AMDGCN_GFX1100
Definition ELF.h:839

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1033
@ EF_AMDGPU_MACH_AMDGCN_GFX1033
Definition ELF.h:831

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX801
@ EF_AMDGPU_MACH_AMDGCN_GFX801
Definition ELF.h:814

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX705
@ EF_AMDGPU_MACH_AMDGCN_GFX705
Definition ELF.h:833

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC
Definition ELF.h:865

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1153
@ EF_AMDGPU_MACH_AMDGCN_GFX1153
Definition ELF.h:862

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1010
@ EF_AMDGPU_MACH_AMDGCN_GFX1010
Definition ELF.h:825

llvm::ELF::EF_AMDGPU_MACH_R600_RV670
@ EF_AMDGPU_MACH_R600_RV670
Definition ELF.h:779

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX701
@ EF_AMDGPU_MACH_AMDGCN_GFX701
Definition ELF.h:809

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC
Definition ELF.h:857

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1012
@ EF_AMDGPU_MACH_AMDGCN_GFX1012
Definition ELF.h:827

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1151
@ EF_AMDGPU_MACH_AMDGCN_GFX1151
Definition ELF.h:848

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1030
@ EF_AMDGPU_MACH_AMDGCN_GFX1030
Definition ELF.h:828

llvm::ELF::EF_AMDGPU_MACH_R600_CEDAR
@ EF_AMDGPU_MACH_R600_CEDAR
Definition ELF.h:785

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1200
@ EF_AMDGPU_MACH_AMDGCN_GFX1200
Definition ELF.h:846

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX700
@ EF_AMDGPU_MACH_AMDGCN_GFX700
Definition ELF.h:808

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC
Definition ELF.h:858

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX803
@ EF_AMDGPU_MACH_AMDGCN_GFX803
Definition ELF.h:816

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX802
@ EF_AMDGPU_MACH_AMDGCN_GFX802
Definition ELF.h:815

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX90C
@ EF_AMDGPU_MACH_AMDGCN_GFX90C
Definition ELF.h:824

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_ON_V4
@ EF_AMDGPU_FEATURE_XNACK_ON_V4
Definition ELF.h:905

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX900
@ EF_AMDGPU_MACH_AMDGCN_GFX900
Definition ELF.h:818

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX909
@ EF_AMDGPU_MACH_AMDGCN_GFX909
Definition ELF.h:823

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX906
@ EF_AMDGPU_MACH_AMDGCN_GFX906
Definition ELF.h:821

llvm::ELF::EF_AMDGPU_MACH_NONE
@ EF_AMDGPU_MACH_NONE
Definition ELF.h:771

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC
Definition ELF.h:855

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1103
@ EF_AMDGPU_MACH_AMDGCN_GFX1103
Definition ELF.h:842

llvm::ELF::EF_AMDGPU_MACH_R600_CAICOS
@ EF_AMDGPU_MACH_R600_CAICOS
Definition ELF.h:792

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX90A
@ EF_AMDGPU_MACH_AMDGCN_GFX90A
Definition ELF.h:837

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1034
@ EF_AMDGPU_MACH_AMDGCN_GFX1034
Definition ELF.h:836

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1013
@ EF_AMDGPU_MACH_AMDGCN_GFX1013
Definition ELF.h:840

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC
Definition ELF.h:863

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC
@ EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC
Definition ELF.h:856

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX904
@ EF_AMDGPU_MACH_AMDGCN_GFX904
Definition ELF.h:820

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1251
@ EF_AMDGPU_MACH_AMDGCN_GFX1251
Definition ELF.h:864

llvm::ELF::EF_AMDGPU_MACH_R600_RS880
@ EF_AMDGPU_MACH_R600_RS880
Definition ELF.h:778

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX805
@ EF_AMDGPU_MACH_AMDGCN_GFX805
Definition ELF.h:834

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1201
@ EF_AMDGPU_MACH_AMDGCN_GFX1201
Definition ELF.h:852

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX1150
@ EF_AMDGPU_MACH_AMDGCN_GFX1150
Definition ELF.h:841

llvm::ELF::EF_AMDGPU_MACH_R600_SUMO
@ EF_AMDGPU_MACH_R600_SUMO
Definition ELF.h:789

llvm::ELF::EF_AMDGPU_MACH_R600_BARTS
@ EF_AMDGPU_MACH_R600_BARTS
Definition ELF.h:791

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_ANY_V4
@ EF_AMDGPU_FEATURE_SRAMECC_ANY_V4
Definition ELF.h:914

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_ON_V4
@ EF_AMDGPU_FEATURE_SRAMECC_ON_V4
Definition ELF.h:918

llvm::ELF::EF_AMDGPU_MACH_AMDGCN_GFX702
@ EF_AMDGPU_MACH_AMDGCN_GFX702
Definition ELF.h:810

llvm::ELF::NT_AMD_HSA_ISA_NAME
@ NT_AMD_HSA_ISA_NAME
Definition ELF.h:1978

llvm::ELF::STV_PROTECTED
@ STV_PROTECTED
Definition ELF.h:1437

llvm::ELF::STV_DEFAULT
@ STV_DEFAULT
Definition ELF.h:1434

llvm::amdhsa
Definition AMDHSAKernelDescriptor.h:53

llvm::cl::ReallyHidden
@ ReallyHidden
Definition CommandLine.h:140

llvm::cl::init
initializer< Ty > init(const Ty &Val)
Definition CommandLine.h:445

llvm::sframe::Flags
Flags
Definition SFrame.h:39

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition AddressRanges.h:18

llvm::Version
FunctionAddr VTableAddr uintptr_t uintptr_t Version
Definition InstrProf.h:302

llvm::report_fatal_error
LLVM_ABI void report_fatal_error(Error Err, bool gen_crash_diag=true)
Definition Error.cpp:167

llvm::toString
std::string toString(const APInt &I, unsigned Radix, bool Signed, bool formatAsCLiteral=false, bool UpperCase=true, bool InsertSeparators=false)
Definition StringExtras.h:344

llvm::AMDGPU::AMDGPUMCKernelCodeT
Definition AMDKernelCodeTUtils.h:33

llvm::AMDGPU::IsaVersion
Instruction set architecture version.
Definition TargetParser.h:133

llvm::AMDGPU::IsaVersion::Major
unsigned Major
Definition TargetParser.h:134

llvm::AMDGPU::MCKernelDescriptor
Definition AMDGPUMCKernelDescriptor.h:27

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc2
const MCExpr * compute_pgm_rsrc2
Definition AMDGPUMCKernelDescriptor.h:33

llvm::AMDGPU::MCKernelDescriptor::kernarg_size
const MCExpr * kernarg_size
Definition AMDGPUMCKernelDescriptor.h:30

llvm::AMDGPU::MCKernelDescriptor::kernarg_preload
const MCExpr * kernarg_preload
Definition AMDGPUMCKernelDescriptor.h:35

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc3
const MCExpr * compute_pgm_rsrc3
Definition AMDGPUMCKernelDescriptor.h:31

llvm::AMDGPU::MCKernelDescriptor::private_segment_fixed_size
const MCExpr * private_segment_fixed_size
Definition AMDGPUMCKernelDescriptor.h:29

llvm::AMDGPU::MCKernelDescriptor::bits_get
static const MCExpr * bits_get(const MCExpr *Src, uint32_t Shift, uint32_t Mask, MCContext &Ctx)
Definition AMDGPUMCKernelDescriptor.cpp:97

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc1
const MCExpr * compute_pgm_rsrc1
Definition AMDGPUMCKernelDescriptor.h:32

llvm::AMDGPU::MCKernelDescriptor::group_segment_fixed_size
const MCExpr * group_segment_fixed_size
Definition AMDGPUMCKernelDescriptor.h:28

llvm::AMDGPU::MCKernelDescriptor::kernel_code_properties
const MCExpr * kernel_code_properties
Definition AMDGPUMCKernelDescriptor.h:34

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition Alignment.h:39

llvm::Align::value
constexpr uint64_t value() const
This is a hole in the type system and should not be abused.
Definition Alignment.h:77

llvm::amdhsa::kernel_descriptor_t
Definition AMDHSAKernelDescriptor.h:267

llvm::amdhsa::kernel_descriptor_t::group_segment_fixed_size
uint32_t group_segment_fixed_size
Definition AMDHSAKernelDescriptor.h:268

llvm::amdhsa::kernel_descriptor_t::reserved3
uint8_t reserved3[4]
Definition AMDHSAKernelDescriptor.h:279

llvm::amdhsa::kernel_descriptor_t::reserved1
uint8_t reserved1[20]
Definition AMDHSAKernelDescriptor.h:273

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc1
uint32_t compute_pgm_rsrc1
Definition AMDHSAKernelDescriptor.h:275

llvm::amdhsa::kernel_descriptor_t::private_segment_fixed_size
uint32_t private_segment_fixed_size
Definition AMDHSAKernelDescriptor.h:269

llvm::amdhsa::kernel_descriptor_t::kernarg_size
uint32_t kernarg_size
Definition AMDHSAKernelDescriptor.h:270

llvm::amdhsa::kernel_descriptor_t::kernarg_preload
uint16_t kernarg_preload
Definition AMDHSAKernelDescriptor.h:278

llvm::amdhsa::kernel_descriptor_t::reserved0
uint8_t reserved0[4]
Definition AMDHSAKernelDescriptor.h:271

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc2
uint32_t compute_pgm_rsrc2
Definition AMDHSAKernelDescriptor.h:276

llvm::amdhsa::kernel_descriptor_t::kernel_code_properties
uint16_t kernel_code_properties
Definition AMDHSAKernelDescriptor.h:277

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc3
uint32_t compute_pgm_rsrc3
Definition AMDHSAKernelDescriptor.h:274

llvm::amdhsa::kernel_descriptor_t::kernel_code_entry_byte_offset
int64_t kernel_code_entry_byte_offset
Definition AMDHSAKernelDescriptor.h:272

llvm::cl::desc
Definition CommandLine.h:411