課程簡介

介紹

  • 什麼是ROCm?
  • 什麼是HIP?
  • ROCm 與 CUDA 與 OpenCL
  • ROCm 和 HIP 功能和體系結構概述
  • ROCm for Windows 與 ROCm 的 Linux

安裝

  • 在 Windows 上安裝 ROCm
  • 驗證安裝並檢查設備相容性
  • 在 Windows 上更新或卸載 ROCm
  • 常見安裝問題疑難解答

開始

  • 在 Windows 上使用 Visual Studio 代碼創建新的 ROCm 專案
  • 瀏覽項目結構和檔
  • 編譯並運行程式
  • 使用 printf 和 fprintf 顯示輸出

ROCm API

  • 在主機程式中使用 ROCm API
  • 查詢設備資訊和功能
  • 分配和解除分配設備記憶體
  • 在主機和設備之間複製數據
  • 啟動內核並同步線程
  • 處理錯誤和異常

HIP 語言

  • 在設備程式中使用 HIP 語言
  • 編寫在 GPU 上執行並操作數據的內核
  • 使用數據類型、限定子、運算符和表達式
  • 使用內置函數、變數和庫

ROCm 和 HIP 記憶體模型

  • 使用不同的記憶體空間,例如全域記憶體空間、共用記憶體空間、常量記憶體空間和局部記憶體空間
  • 使用不同的記憶體物件,例如指標、陣列、紋理和表面
  • 使用不同的記憶體訪問模式,如唯讀、只寫、讀寫等。
  • 使用記憶體一致性模型和同步機制

ROCm 和 HIP 執行模型

  • 使用不同的執行模型,例如線程、塊和網格
  • 使用線程函數,如hipThreadIdx_x、hipBlockIdx_x、hipBlockDim_x等。
  • 使用塊函數,如 __syncthreads、__threadfence_block 等。
  • 使用網格函數,如hipGridDim_x、hipGridSync、合作組等。

調試

  • 在 Windows 上調試 ROCm 和 HIP 程式
  • 使用 Visual Studio 代碼調試器檢查變數、斷點、調用堆疊等。
  • 使用 ROCm 除錯器除錯 AMD 裝置上的 ROCm 和 HIP 程式
  • 使用 ROCm Profiler 分析 AMD 設備上的 ROCm 和 HIP 程式

優化

  • 在 Windows 上優化 ROCm 和 HIP 程式
  • 使用合併技術提高記憶體輸送量
  • 使用緩存和預取技術來減少記憶體延遲
  • 使用共用記憶體和本地記憶體技術來優化記憶體訪問和頻寬
  • 使用分析和分析工具來衡量和改進執行時間和資源利用率

總結和下一步

最低要求

  • 瞭解 C/C++ 語言和並行程式設計概念
  • 計算機體系結構和記憶體層次結構的基礎知識
  • 具有命令行工具和代碼編輯器的經驗
  • 熟悉 Windows 作業系統和 PowerShell

觀眾

  • 希望瞭解如何在 Windows 上安裝和使用 ROCm 對 AMD GPU 進行程式設計並利用其並行性的開發人員
  • 希望編寫可在不同 AMD 設備上運行的高性能和可擴展代碼的開發人員
  • 希望探索 GPU 程式設計的低級方面並優化其代碼性能的程式師
 21 時間:

人數



每位參與者的報價

客戶評論 (1)

相關課程

課程分類