Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
介紹
- 什麼是ROCm?
- 什麼是HIP?
- ROCm 與 CUDA 與 OpenCL
- ROCm 和 HIP 功能和體系結構概述
- ROCm for Windows 與 ROCm 的 Linux
安裝
- 在 Windows 上安裝 ROCm
- 驗證安裝並檢查設備相容性
- 在 Windows 上更新或卸載 ROCm
- 常見安裝問題疑難解答
開始
- 在 Windows 上使用 Visual Studio 代碼創建新的 ROCm 專案
- 瀏覽項目結構和檔
- 編譯並運行程式
- 使用 printf 和 fprintf 顯示輸出
ROCm API
- 在主機程式中使用 ROCm API
- 查詢設備資訊和功能
- 分配和解除分配設備記憶體
- 在主機和設備之間複製數據
- 啟動內核並同步線程
- 處理錯誤和異常
HIP 語言
- 在設備程式中使用 HIP 語言
- 編寫在 GPU 上執行並操作數據的內核
- 使用數據類型、限定子、運算符和表達式
- 使用內置函數、變數和庫
ROCm 和 HIP 記憶體模型
- 使用不同的記憶體空間,例如全域記憶體空間、共用記憶體空間、常量記憶體空間和局部記憶體空間
- 使用不同的記憶體物件,例如指標、陣列、紋理和表面
- 使用不同的記憶體訪問模式,如唯讀、只寫、讀寫等。
- 使用記憶體一致性模型和同步機制
ROCm 和 HIP 執行模型
- 使用不同的執行模型,例如線程、塊和網格
- 使用線程函數,如hipThreadIdx_x、hipBlockIdx_x、hipBlockDim_x等。
- 使用塊函數,如 __syncthreads、__threadfence_block 等。
- 使用網格函數,如hipGridDim_x、hipGridSync、合作組等。
調試
- 在 Windows 上調試 ROCm 和 HIP 程式
- 使用 Visual Studio 代碼調試器檢查變數、斷點、調用堆疊等。
- 使用 ROCm 除錯器除錯 AMD 裝置上的 ROCm 和 HIP 程式
- 使用 ROCm Profiler 分析 AMD 設備上的 ROCm 和 HIP 程式
優化
- 在 Windows 上優化 ROCm 和 HIP 程式
- 使用合併技術提高記憶體輸送量
- 使用緩存和預取技術來減少記憶體延遲
- 使用共用記憶體和本地記憶體技術來優化記憶體訪問和頻寬
- 使用分析和分析工具來衡量和改進執行時間和資源利用率
總結和下一步
最低要求
- 瞭解 C/C++ 語言和並行程式設計概念
- 計算機體系結構和記憶體層次結構的基礎知識
- 具有命令行工具和代碼編輯器的經驗
- 熟悉 Windows 作業系統和 PowerShell
觀眾
- 希望瞭解如何在 Windows 上安裝和使用 ROCm 對 AMD GPU 進行程式設計並利用其並行性的開發人員
- 希望編寫可在不同 AMD 設備上運行的高性能和可擴展代碼的開發人員
- 希望探索 GPU 程式設計的低級方面並優化其代碼性能的程式師
21 時間:
客戶評論 (2)
與各種示例非常互動,在培訓開始和結束之間的複雜性進展良好。
Jenny - Andheo
Course - GPU Programming with CUDA and Python
機器翻譯
培訓師精力充沛,幽默風趣。
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Course - NVIDIA GPU Programming - Extended
機器翻譯