doxygen/DeviceOffload_8cpp_source.html

//===---------- DeviceOffload.cpp - Device Offloading------------*- C++ -*-===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file implements offloading to CUDA devices.

//

//===----------------------------------------------------------------------===//


#include "DeviceOffload.h"


#include "clang/Basic/TargetOptions.h"

#include "clang/CodeGen/ModuleBuilder.h"

#include "clang/Frontend/CompilerInstance.h"

#include "clang/Interpreter/PartialTranslationUnit.h"


#include "llvm/IR/LegacyPassManager.h"

#include "llvm/IR/Module.h"

#include "llvm/MC/TargetRegistry.h"

#include "llvm/Target/TargetMachine.h"


namespace clang {


IncrementalCUDADeviceParser::IncrementalCUDADeviceParser(

    std::unique_ptr<CompilerInstance> DeviceInstance,

    CompilerInstance &HostInstance,

    llvm::IntrusiveRefCntPtr<llvm::vfs::InMemoryFileSystem> FS,

    llvm::Error &Err, const std::list<PartialTranslationUnit> &PTUs)

    : IncrementalParser(*DeviceInstance, Err), PTUs(PTUs), VFS(FS),

      CodeGenOpts(HostInstance.getCodeGenOpts()),

      TargetOpts(HostInstance.getTargetOpts()) {

  if (Err)

    return;

  DeviceCI = std::move(DeviceInstance);

  StringRef Arch = TargetOpts.CPU;

  if (!Arch.starts_with("sm_") || Arch.substr(3).getAsInteger(10, SMVersion)) {

    Err = llvm::joinErrors(std::move(Err), llvm::make_error<llvm::StringError>(

                                               "Invalid CUDA architecture",

                                               llvm::inconvertibleErrorCode()));

    return;

  }

}


llvm::Expected<TranslationUnitDecl *>

IncrementalCUDADeviceParser::Parse(llvm::StringRef Input) {

  auto PTU = IncrementalParser::Parse(Input);

  if (!PTU)

    return PTU.takeError();


  auto PTX = GeneratePTX();

  if (!PTX)

    return PTX.takeError();


  auto Err = GenerateFatbinary();

  if (Err)

    return std::move(Err);


  std::string FatbinFileName =

      "/incr_module_" + std::to_string(PTUs.size()) + ".fatbin";

  VFS->addFile(FatbinFileName, 0,

               llvm::MemoryBuffer::getMemBuffer(

                   llvm::StringRef(FatbinContent.data(), FatbinContent.size()),

                   "", false));


  CodeGenOpts.CudaGpuBinaryFileName = FatbinFileName;


  FatbinContent.clear();


  return PTU;

}


llvm::Expected<llvm::StringRef> IncrementalCUDADeviceParser::GeneratePTX() {

  auto &PTU = PTUs.back();

  std::string Error;


  const llvm::Target *Target = llvm::TargetRegistry::lookupTarget(

      PTU.TheModule->getTargetTriple(), Error);

  if (!Target)

    return llvm::make_error<llvm::StringError>(std::move(Error),

                                               std::error_code());

  llvm::TargetOptions TO = llvm::TargetOptions();

  llvm::TargetMachine *TargetMachine = Target->createTargetMachine(

      PTU.TheModule->getTargetTriple(), TargetOpts.CPU, "", TO,

      llvm::Reloc::Model::PIC_);

  PTU.TheModule->setDataLayout(TargetMachine->createDataLayout());


  PTXCode.clear();

  llvm::raw_svector_ostream dest(PTXCode);


  llvm::legacy::PassManager PM;

  if (TargetMachine->addPassesToEmitFile(PM, dest, nullptr,

                                         llvm::CodeGenFileType::AssemblyFile)) {

    return llvm::make_error<llvm::StringError>(

        "NVPTX backend cannot produce PTX code.",

        llvm::inconvertibleErrorCode());

  }


  if (!PM.run(*PTU.TheModule))

    return llvm::make_error<llvm::StringError>("Failed to emit PTX code.",

                                               llvm::inconvertibleErrorCode());


  PTXCode += '\0';

  while (PTXCode.size() % 8)

    PTXCode += '\0';

  return PTXCode.str();

}


llvm::Error IncrementalCUDADeviceParser::GenerateFatbinary() {

  enum FatBinFlags {

    AddressSize64 = 0x01,

    HasDebugInfo = 0x02,

    ProducerCuda = 0x04,

    HostLinux = 0x10,

    HostMac = 0x20,

    HostWindows = 0x40

  };


  struct FatBinInnerHeader {

    uint16_t Kind;             // 0x00

    uint16_t unknown02;        // 0x02

    uint32_t HeaderSize;       // 0x04

    uint32_t DataSize;         // 0x08

    uint32_t unknown0c;        // 0x0c

    uint32_t CompressedSize;   // 0x10

    uint32_t SubHeaderSize;    // 0x14

    uint16_t VersionMinor;     // 0x18

    uint16_t VersionMajor;     // 0x1a

    uint32_t CudaArch;         // 0x1c

    uint32_t unknown20;        // 0x20

    uint32_t unknown24;        // 0x24

    uint32_t Flags;            // 0x28

    uint32_t unknown2c;        // 0x2c

    uint32_t unknown30;        // 0x30

    uint32_t unknown34;        // 0x34

    uint32_t UncompressedSize; // 0x38

    uint32_t unknown3c;        // 0x3c

    uint32_t unknown40;        // 0x40

    uint32_t unknown44;        // 0x44

    FatBinInnerHeader(uint32_t DataSize, uint32_t CudaArch, uint32_t Flags)

        : Kind(1 /*PTX*/), unknown02(0x0101), HeaderSize(sizeof(*this)),

          DataSize(DataSize), unknown0c(0), CompressedSize(0),

          SubHeaderSize(HeaderSize - 8), VersionMinor(2), VersionMajor(4),

          CudaArch(CudaArch), unknown20(0), unknown24(0), Flags(Flags),

          unknown2c(0), unknown30(0), unknown34(0), UncompressedSize(0),

          unknown3c(0), unknown40(0), unknown44(0) {}

  };


  struct FatBinHeader {

    uint32_t Magic;      // 0x00

    uint16_t Version;    // 0x04

    uint16_t HeaderSize; // 0x06

    uint32_t DataSize;   // 0x08

    uint32_t unknown0c;  // 0x0c

  public:

    FatBinHeader(uint32_t DataSize)

        : Magic(0xba55ed50), Version(1), HeaderSize(sizeof(*this)),

          DataSize(DataSize), unknown0c(0) {}

  };


  FatBinHeader OuterHeader(sizeof(FatBinInnerHeader) + PTXCode.size());

  FatbinContent.append((char *)&OuterHeader,

                       ((char *)&OuterHeader) + OuterHeader.HeaderSize);


  FatBinInnerHeader InnerHeader(PTXCode.size(), SMVersion,

                                FatBinFlags::AddressSize64 |

                                    FatBinFlags::HostLinux);

  FatbinContent.append((char *)&InnerHeader,

                       ((char *)&InnerHeader) + InnerHeader.HeaderSize);


  FatbinContent.append(PTXCode.begin(), PTXCode.end());


  return llvm::Error::success();

}


IncrementalCUDADeviceParser::~IncrementalCUDADeviceParser() {}


} // namespace clang

Kind
enum clang::sema::@1724::IndirectLocalPathEntry::EntryKind Kind

CompilerInstance.h

DeviceOffload.h

Target
llvm::MachO::Target Target
Definition: MachO.h:51

ModuleBuilder.h

PartialTranslationUnit.h

TargetOptions.h
Defines the clang::TargetOptions class.

clang::CodeGenOptions::CudaGpuBinaryFileName
std::string CudaGpuBinaryFileName
Name of file passed with -fcuda-include-gpubinary option to forward to CUDA runtime back-end for inco...
Definition: CodeGenOptions.h:308

clang::CompilerInstance
CompilerInstance - Helper class for managing a single instance of the Clang compiler.
Definition: CompilerInstance.h:80

clang::IncrementalCUDADeviceParser::FatbinContent
llvm::SmallVector< char, 1024 > FatbinContent
Definition: DeviceOffload.h:50

clang::IncrementalCUDADeviceParser::PTXCode
llvm::SmallString< 1024 > PTXCode
Definition: DeviceOffload.h:49

clang::IncrementalCUDADeviceParser::IncrementalCUDADeviceParser
IncrementalCUDADeviceParser(std::unique_ptr< CompilerInstance > DeviceInstance, CompilerInstance &HostInstance, llvm::IntrusiveRefCntPtr< llvm::vfs::InMemoryFileSystem > VFS, llvm::Error &Err, const std::list< PartialTranslationUnit > &PTUs)
Definition: DeviceOffload.cpp:27

clang::IncrementalCUDADeviceParser::DeviceCI
std::unique_ptr< CompilerInstance > DeviceCI
Definition: DeviceOffload.h:47

clang::IncrementalCUDADeviceParser::Parse
llvm::Expected< TranslationUnitDecl * > Parse(llvm::StringRef Input) override
Parses incremental input by creating an in-memory file.
Definition: DeviceOffload.cpp:48

clang::IncrementalCUDADeviceParser::CodeGenOpts
CodeGenOptions & CodeGenOpts
Definition: DeviceOffload.h:52

clang::IncrementalCUDADeviceParser::VFS
llvm::IntrusiveRefCntPtr< llvm::vfs::InMemoryFileSystem > VFS
Definition: DeviceOffload.h:51

clang::IncrementalCUDADeviceParser::GeneratePTX
llvm::Expected< llvm::StringRef > GeneratePTX()
Definition: DeviceOffload.cpp:75

clang::IncrementalCUDADeviceParser::~IncrementalCUDADeviceParser
~IncrementalCUDADeviceParser()
Definition: DeviceOffload.cpp:178

clang::IncrementalCUDADeviceParser::GenerateFatbinary
llvm::Error GenerateFatbinary()
Definition: DeviceOffload.cpp:111

clang::IncrementalCUDADeviceParser::TargetOpts
const TargetOptions & TargetOpts
Definition: DeviceOffload.h:53

clang::IncrementalCUDADeviceParser::SMVersion
int SMVersion
Definition: DeviceOffload.h:48

clang::IncrementalParser
Provides support for incremental compilation.
Definition: IncrementalParser.h:33

clang::IncrementalParser::Parse
virtual llvm::Expected< TranslationUnitDecl * > Parse(llvm::StringRef Input)
Parses incremental input by creating an in-memory file.
Definition: IncrementalParser.cpp:98

clang::TargetOptions::CPU
std::string CPU
If given, the name of the target CPU to generate code for.
Definition: TargetOptions.h:36

llvm::Expected
Definition: LLVM.h:37

llvm::IntrusiveRefCntPtr
Definition: LLVM.h:43

clang
The JSON file list parser is used to communicate input to InstallAPI.
Definition: CalledOnceCheck.h:17