doxygen/SIModeRegisterDefaults_8h_source.html

//===-- SIModeRegisterDefaults.h --------------------------------*- C++ -*-===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//


#ifndef LLVM_LIB_TARGET_AMDGPU_SIMODEREGISTERDEFAULTS_H

#define LLVM_LIB_TARGET_AMDGPU_SIMODEREGISTERDEFAULTS_H


#include "Utils/AMDGPUBaseInfo.h"

#include "llvm/ADT/FloatingPointMode.h"


namespace llvm {


class GCNSubtarget;


// Track defaults for fields in the MODE register.


struct SIModeRegisterDefaults {

  /// Floating point opcodes that support exception flag gathering quiet and

  /// propagate signaling NaN inputs per IEEE 754-2008. Min_dx10 and max_dx10

  /// become IEEE 754- 2008 compliant due to signaling NaN propagation and

  /// quieting.

  bool IEEE : 1;


  /// Used by the vector ALU to force DX10-style treatment of NaNs: when set,

  /// clamp NaN to zero; otherwise, pass NaN through.

  bool DX10Clamp : 1;


  /// If this is set, neither input or output denormals are flushed for most f32

  /// instructions.

  DenormalMode FP32Denormals;


  /// If this is set, neither input or output denormals are flushed for both f64

  /// and f16/v2f16 instructions.

  DenormalMode FP64FP16Denormals;


  SIModeRegisterDefaults() :

    IEEE(true),

    DX10Clamp(true),

    FP32Denormals(DenormalMode::getIEEE()),

    FP64FP16Denormals(DenormalMode::getIEEE()) {}


  SIModeRegisterDefaults(const Function &F, const GCNSubtarget &ST);


  static SIModeRegisterDefaults getDefaultForCallingConv(CallingConv::ID CC) {

    SIModeRegisterDefaults Mode;

    Mode.IEEE = !AMDGPU::isShader(CC);

    return Mode;

  }


  bool operator==(const SIModeRegisterDefaults Other) const {

    return IEEE == Other.IEEE && DX10Clamp == Other.DX10Clamp &&

           FP32Denormals == Other.FP32Denormals &&

           FP64FP16Denormals == Other.FP64FP16Denormals;

  }


  /// Get the encoding value for the FP_DENORM bits of the mode register for the

  /// FP32 denormal mode.


  uint32_t fpDenormModeSPValue() const {

    if (FP32Denormals == DenormalMode::getPreserveSign())

      return FP_DENORM_FLUSH_IN_FLUSH_OUT;

    if (FP32Denormals.Output == DenormalMode::PreserveSign)

      return FP_DENORM_FLUSH_OUT;

    if (FP32Denormals.Input == DenormalMode::PreserveSign)

      return FP_DENORM_FLUSH_IN;

    return FP_DENORM_FLUSH_NONE;

  }


  /// Get the encoding value for the FP_DENORM bits of the mode register for the

  /// FP64/FP16 denormal mode.


  uint32_t fpDenormModeDPValue() const {

    if (FP64FP16Denormals == DenormalMode::getPreserveSign())

      return FP_DENORM_FLUSH_IN_FLUSH_OUT;

    if (FP64FP16Denormals.Output == DenormalMode::PreserveSign)

      return FP_DENORM_FLUSH_OUT;

    if (FP64FP16Denormals.Input == DenormalMode::PreserveSign)

      return FP_DENORM_FLUSH_IN;

    return FP_DENORM_FLUSH_NONE;

  }


  // FIXME: Inlining should be OK for dx10-clamp, since the caller's mode should

  // be able to override.


  bool isInlineCompatible(SIModeRegisterDefaults CalleeMode) const {

    return DX10Clamp == CalleeMode.DX10Clamp && IEEE == CalleeMode.IEEE;

  }


};


namespace AMDGPU {


/// Return values used for llvm.get.rounding

///

/// When both the F32 and F64/F16 modes are the same, returns the standard

/// values. If they differ, returns an extended mode starting at 8.


enum AMDGPUFltRounds : int8_t {

  // Inherit everything from RoundingMode

  TowardZero = static_cast<int8_t>(RoundingMode::TowardZero),

  NearestTiesToEven = static_cast<int8_t>(RoundingMode::NearestTiesToEven),

  TowardPositive = static_cast<int8_t>(RoundingMode::TowardPositive),

  TowardNegative = static_cast<int8_t>(RoundingMode::TowardNegative),

  NearestTiesToAwayUnsupported =

      static_cast<int8_t>(RoundingMode::NearestTiesToAway),


  Dynamic = static_cast<int8_t>(RoundingMode::Dynamic),


  // Permute the mismatched rounding mode cases.  If the modes are the same, use

  // the standard values, otherwise, these values are sorted such that higher

  // hardware encoded values have higher enum values.

  NearestTiesToEvenF32_NearestTiesToEvenF64 = NearestTiesToEven,

  NearestTiesToEvenF32_TowardPositiveF64 = 8,

  NearestTiesToEvenF32_TowardNegativeF64 = 9,

  NearestTiesToEvenF32_TowardZeroF64 = 10,


  TowardPositiveF32_NearestTiesToEvenF64 = 11,

  TowardPositiveF32_TowardPositiveF64 = TowardPositive,

  TowardPositiveF32_TowardNegativeF64 = 12,

  TowardPositiveF32_TowardZeroF64 = 13,


  TowardNegativeF32_NearestTiesToEvenF64 = 14,

  TowardNegativeF32_TowardPositiveF64 = 15,

  TowardNegativeF32_TowardNegativeF64 = TowardNegative,

  TowardNegativeF32_TowardZeroF64 = 16,


  TowardZeroF32_NearestTiesToEvenF64 = 17,

  TowardZeroF32_TowardPositiveF64 = 18,

  TowardZeroF32_TowardNegativeF64 = 19,

  TowardZeroF32_TowardZeroF64 = TowardZero,


  Invalid = static_cast<int8_t>(RoundingMode::Invalid)

};


/// Offset of nonstandard values for llvm.get.rounding results from the largest

/// supported mode.

static constexpr uint32_t ExtendedFltRoundOffset = 4;


/// Offset in mode register of f32 rounding mode.

static constexpr uint32_t F32FltRoundOffset = 0;


/// Offset in mode register of f64/f16 rounding mode.

static constexpr uint32_t F64FltRoundOffset = 2;


// Bit indexed table to convert from hardware rounding mode values to FLT_ROUNDS

// values.

extern const uint64_t FltRoundConversionTable;


// Bit indexed table to convert from FLT_ROUNDS values to hardware rounding mode

// values

extern const uint64_t FltRoundToHWConversionTable;


/// Read the hardware rounding mode equivalent of a AMDGPUFltRounds value.

uint32_t decodeFltRoundToHWConversionTable(uint32_t FltRounds);


} // end namespace AMDGPU


} // end namespace llvm


#endif // LLVM_LIB_TARGET_AMDGPU_SIMODEREGISTERDEFAULTS_H

AMDGPUBaseInfo.h

FloatingPointMode.h
Utilities for dealing with flags related to floating point properties and mode controls.

F
#define F(x, y, z)
Definition MD5.cpp:54

Mode
static cl::opt< RegAllocEvictionAdvisorAnalysisLegacy::AdvisorMode > Mode("regalloc-enable-advisor", cl::Hidden, cl::init(RegAllocEvictionAdvisorAnalysisLegacy::AdvisorMode::Default), cl::desc("Enable regalloc advisor mode"), cl::values(clEnumValN(RegAllocEvictionAdvisorAnalysisLegacy::AdvisorMode::Default, "default", "Default"), clEnumValN(RegAllocEvictionAdvisorAnalysisLegacy::AdvisorMode::Release, "release", "precompiled"), clEnumValN(RegAllocEvictionAdvisorAnalysisLegacy::AdvisorMode::Development, "development", "for training")))

FP_DENORM_FLUSH_OUT
#define FP_DENORM_FLUSH_OUT
Definition SIDefines.h:1271

FP_DENORM_FLUSH_NONE
#define FP_DENORM_FLUSH_NONE
Definition SIDefines.h:1273

FP_DENORM_FLUSH_IN_FLUSH_OUT
#define FP_DENORM_FLUSH_IN_FLUSH_OUT
Definition SIDefines.h:1270

FP_DENORM_FLUSH_IN
#define FP_DENORM_FLUSH_IN
Definition SIDefines.h:1272

llvm::Function
Definition Function.h:65

llvm::GCNSubtarget
Definition GCNSubtarget.h:34

uint32_t

uint64_t

llvm::AMDGPU::isShader
LLVM_READNONE constexpr bool isShader(CallingConv::ID CC)
Definition AMDGPUBaseInfo.h:1450

llvm::AMDGPU::FltRoundToHWConversionTable
const uint64_t FltRoundToHWConversionTable
Definition SIModeRegisterDefaults.cpp:188

llvm::AMDGPU::F64FltRoundOffset
static constexpr uint32_t F64FltRoundOffset
Offset in mode register of f64/f16 rounding mode.
Definition SIModeRegisterDefaults.h:141

llvm::AMDGPU::ExtendedFltRoundOffset
static constexpr uint32_t ExtendedFltRoundOffset
Offset of nonstandard values for llvm.get.rounding results from the largest supported mode.
Definition SIModeRegisterDefaults.h:135

llvm::AMDGPU::AMDGPUFltRounds
AMDGPUFltRounds
Return values used for llvm.get.rounding.
Definition SIModeRegisterDefaults.h:96

llvm::AMDGPU::Dynamic
@ Dynamic
Definition SIModeRegisterDefaults.h:105

llvm::AMDGPU::NearestTiesToEvenF32_NearestTiesToEvenF64
@ NearestTiesToEvenF32_NearestTiesToEvenF64
Definition SIModeRegisterDefaults.h:110

llvm::AMDGPU::TowardPositive
@ TowardPositive
Definition SIModeRegisterDefaults.h:100

llvm::AMDGPU::NearestTiesToEven
@ NearestTiesToEven
Definition SIModeRegisterDefaults.h:99

llvm::AMDGPU::TowardZeroF32_NearestTiesToEvenF64
@ TowardZeroF32_NearestTiesToEvenF64
Definition SIModeRegisterDefaults.h:125

llvm::AMDGPU::TowardNegativeF32_NearestTiesToEvenF64
@ TowardNegativeF32_NearestTiesToEvenF64
Definition SIModeRegisterDefaults.h:120

llvm::AMDGPU::TowardPositiveF32_NearestTiesToEvenF64
@ TowardPositiveF32_NearestTiesToEvenF64
Definition SIModeRegisterDefaults.h:115

llvm::AMDGPU::TowardPositiveF32_TowardZeroF64
@ TowardPositiveF32_TowardZeroF64
Definition SIModeRegisterDefaults.h:118

llvm::AMDGPU::TowardNegativeF32_TowardZeroF64
@ TowardNegativeF32_TowardZeroF64
Definition SIModeRegisterDefaults.h:123

llvm::AMDGPU::NearestTiesToEvenF32_TowardNegativeF64
@ NearestTiesToEvenF32_TowardNegativeF64
Definition SIModeRegisterDefaults.h:112

llvm::AMDGPU::Invalid
@ Invalid
Definition SIModeRegisterDefaults.h:130

llvm::AMDGPU::NearestTiesToEvenF32_TowardZeroF64
@ NearestTiesToEvenF32_TowardZeroF64
Definition SIModeRegisterDefaults.h:113

llvm::AMDGPU::TowardPositiveF32_TowardPositiveF64
@ TowardPositiveF32_TowardPositiveF64
Definition SIModeRegisterDefaults.h:116

llvm::AMDGPU::TowardZero
@ TowardZero
Definition SIModeRegisterDefaults.h:98

llvm::AMDGPU::NearestTiesToAwayUnsupported
@ NearestTiesToAwayUnsupported
Definition SIModeRegisterDefaults.h:102

llvm::AMDGPU::TowardNegativeF32_TowardPositiveF64
@ TowardNegativeF32_TowardPositiveF64
Definition SIModeRegisterDefaults.h:121

llvm::AMDGPU::NearestTiesToEvenF32_TowardPositiveF64
@ NearestTiesToEvenF32_TowardPositiveF64
Definition SIModeRegisterDefaults.h:111

llvm::AMDGPU::TowardZeroF32_TowardNegativeF64
@ TowardZeroF32_TowardNegativeF64
Definition SIModeRegisterDefaults.h:127

llvm::AMDGPU::TowardZeroF32_TowardZeroF64
@ TowardZeroF32_TowardZeroF64
Definition SIModeRegisterDefaults.h:128

llvm::AMDGPU::TowardZeroF32_TowardPositiveF64
@ TowardZeroF32_TowardPositiveF64
Definition SIModeRegisterDefaults.h:126

llvm::AMDGPU::TowardNegativeF32_TowardNegativeF64
@ TowardNegativeF32_TowardNegativeF64
Definition SIModeRegisterDefaults.h:122

llvm::AMDGPU::TowardNegative
@ TowardNegative
Definition SIModeRegisterDefaults.h:101

llvm::AMDGPU::TowardPositiveF32_TowardNegativeF64
@ TowardPositiveF32_TowardNegativeF64
Definition SIModeRegisterDefaults.h:117

llvm::AMDGPU::decodeFltRoundToHWConversionTable
uint32_t decodeFltRoundToHWConversionTable(uint32_t FltRounds)
Read the hardware rounding mode equivalent of a AMDGPUFltRounds value.
Definition SIModeRegisterDefaults.cpp:235

llvm::AMDGPU::F32FltRoundOffset
static constexpr uint32_t F32FltRoundOffset
Offset in mode register of f32 rounding mode.
Definition SIModeRegisterDefaults.h:138

llvm::AMDGPU::FltRoundConversionTable
const uint64_t FltRoundConversionTable
Definition SIModeRegisterDefaults.cpp:74

llvm::CallingConv::ID
unsigned ID
LLVM IR allows to use arbitrary numbers as calling convention identifiers.
Definition CallingConv.h:24

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition FunctionInfo.h:25

llvm::IRMemLocation::Other
@ Other
Any other memory.
Definition ModRef.h:68

llvm::RoundingMode::TowardZero
@ TowardZero
roundTowardZero.
Definition FloatingPointMode.h:40

llvm::RoundingMode::NearestTiesToEven
@ NearestTiesToEven
roundTiesToEven.
Definition FloatingPointMode.h:41

llvm::RoundingMode::Invalid
@ Invalid
Denotes invalid value.
Definition FloatingPointMode.h:48

llvm::RoundingMode::Dynamic
@ Dynamic
Denotes mode unknown at compile time.
Definition FloatingPointMode.h:47

llvm::RoundingMode::TowardPositive
@ TowardPositive
roundTowardPositive.
Definition FloatingPointMode.h:42

llvm::RoundingMode::NearestTiesToAway
@ NearestTiesToAway
roundTiesToAway.
Definition FloatingPointMode.h:44

llvm::RoundingMode::TowardNegative
@ TowardNegative
roundTowardNegative.
Definition FloatingPointMode.h:43

true
Definition SPIRVConvergenceRegionAnalysis.cpp:41

llvm::DenormalMode
Represent subnormal handling kind for floating point instruction inputs and outputs.
Definition FloatingPointMode.h:71

llvm::DenormalMode::PreserveSign
@ PreserveSign
The sign of a flushed-to-zero number is preserved in the sign of 0.
Definition FloatingPointMode.h:81

llvm::DenormalMode::getPreserveSign
static constexpr DenormalMode getPreserveSign()
Definition FloatingPointMode.h:119

llvm::SIModeRegisterDefaults::SIModeRegisterDefaults
SIModeRegisterDefaults()
Definition SIModeRegisterDefaults.h:39

llvm::SIModeRegisterDefaults::DX10Clamp
bool DX10Clamp
Used by the vector ALU to force DX10-style treatment of NaNs: when set, clamp NaN to zero; otherwise,...
Definition SIModeRegisterDefaults.h:29

llvm::SIModeRegisterDefaults::fpDenormModeSPValue
uint32_t fpDenormModeSPValue() const
Get the encoding value for the FP_DENORM bits of the mode register for the FP32 denormal mode.
Definition SIModeRegisterDefaults.h:61

llvm::SIModeRegisterDefaults::FP64FP16Denormals
DenormalMode FP64FP16Denormals
If this is set, neither input or output denormals are flushed for both f64 and f16/v2f16 instructions...
Definition SIModeRegisterDefaults.h:37

llvm::SIModeRegisterDefaults::IEEE
bool IEEE
Floating point opcodes that support exception flag gathering quiet and propagate signaling NaN inputs...
Definition SIModeRegisterDefaults.h:25

llvm::SIModeRegisterDefaults::getDefaultForCallingConv
static SIModeRegisterDefaults getDefaultForCallingConv(CallingConv::ID CC)
Definition SIModeRegisterDefaults.h:47

llvm::SIModeRegisterDefaults::fpDenormModeDPValue
uint32_t fpDenormModeDPValue() const
Get the encoding value for the FP_DENORM bits of the mode register for the FP64/FP16 denormal mode.
Definition SIModeRegisterDefaults.h:73

llvm::SIModeRegisterDefaults::isInlineCompatible
bool isInlineCompatible(SIModeRegisterDefaults CalleeMode) const
Definition SIModeRegisterDefaults.h:85

llvm::SIModeRegisterDefaults::operator==
bool operator==(const SIModeRegisterDefaults Other) const
Definition SIModeRegisterDefaults.h:53

llvm::SIModeRegisterDefaults::FP32Denormals
DenormalMode FP32Denormals
If this is set, neither input or output denormals are flushed for most f32 instructions.
Definition SIModeRegisterDefaults.h:33