首頁
計算機圖形學培訓
GPU 培訓
NVIDIA GPU Programming - Extended培訓

NVIDIA GPU Programming - Extended培訓

(1 客戶評論)

這門由講師帶領的現場培訓課程涵蓋 GPU 平行運算的程式設計方法、如何使用各種平台、如何操作 CUDA 平台及其功能，以及如何運用 CUDA 執行多種最佳化技術。應用領域包含深度學習、數據分析、影像處理及工程應用等。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

引言

異質運算方法的基本原理

何謂平行運算？理解平行運算的需求

多核處理器 - 架構與設計

執行緒介紹、基礎觀念與平行程式設計基本概念

GPU 軟體最佳化流程的基本原理

OpenMP - 指令導向平行程式設計的標準

多核機器上各種程式的實作與示範

GPU 運算簡介

用於平行運算的 GPU

GPU 程式設計模型

GPU 上各種程式的實作與示範

GPU 的 SDK、工具包與環境安裝

使用各種函式庫

結合範例程式與 OpenACC 的 GPU 及工具展示

理解 CUDA 程式設計模型

學習 CUDA 架構

探索並設定 CUDA 開發環境

操作 CUDA Runtime API

理解 CUDA 記憶體模型

探索額外的 CUDA API 功能

在 CUDA 中高效存取全域記憶體：全域記憶體最佳化

使用 CUDA Streams 優化 CUDA 中的資料傳輸

在 CUDA 中使用共用記憶體

理解並使用 CUDA 中的原子操作與指令

案例研究：使用 CUDA 進行基礎數位影像處理

多 GPU 程式設計

NVIDIA / CUDA 上的進階硬體剖析與取樣

使用 CUDA Dynamic Parallelism API 進行動態 Kernel 啟動

總結與結論

最低要求

C 語言程式設計
Linux GCC

21 小時

人數

在線

課堂

選擇地點

請選擇一個場地

每位參與者的報價

公開培訓課程需要5名以上參與者。

NVIDIA GPU Programming - Extended培訓 - 訂單

全名 *

郵件 *

電話 *

職務

公司名稱

地址1 *

市 *

州/省

國家 *

郵編 *

開始日期

稅號

日期視乎可用性而定，將在 09:30 和 16:30 之間舉行。

支付 *

銀行轉帳（發票，收據）

借記卡 / 信用卡

預訂摘要

人數: —
課程時數: 21 小時
總價: —

評論

條款與條件 *

我是上述客戶的授權代表，我希望根據 NobleProg 條款和條件以及隱私政策預訂上述課程或服務。

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

NVIDIA GPU Programming - Extended培訓 - 詢問

全名 *

郵件 *

電話 *

人數

公司名稱

公司地址

您想以何種方式參加課程？

客戶場地

线上

課堂

評論

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

NVIDIA GPU Programming - Extended - 咨詢詢問

全名 *

電話 *

郵件 *

公司名稱

諮詢主題 *

諮詢目標

諮詢師將會和什麼人合作

緊急諮詢服務 *

評論

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

客戶評論 (1)

培訓師的活力和幽默感。

Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.

課程 - NVIDIA GPU Programming - Extended

完成本培訓後，學員將能夠：

設置並配置CANN開發環境。
使用MindSpore和CloudMatrix工作流開發AI應用。
使用自定義算子和分塊技術優化昇騰NPU的性能。
將模型部署至邊緣或雲端環境。

課程格式

互動式授課與討論。
在樣本應用中實踐操作華為昇騰和CANN工具包。
聚焦於模型構建、訓練及部署的引導式練習。

課程自定義選項

如需根據您的基礎設施或數據集為本課程要求客製化培訓，請聯繫我們進行安排。

更多...

使用 CANN 和昇騰 AI 處理器部署 AI 模型

14 小時

CANN（神經網絡計算架構）是華為專為在昇騰 AI 處理器上部署和优化 AI 模型而設計的 AI 計算棧。

本課程由導師指導，提供線上或線下直播培訓形式，主要面向希望使用 CANN 工具包及 MindSpore、TensorFlow 或 PyTorch 等工具，高效地將訓練好的 AI 模型部署到華為昇騰硬件上的中級 AI 開發人員和工程師。

通過本課程的學習，參與者將能夠：

理解 CANN 架構及其在 AI 部署流程中的作用。
將來自主流框架的模型轉換並適應為昇騰兼容格式。
使用 ATC、OM 模型轉換和 MindSpore 等工具進行端側和雲側推理。
診斷部署問題並優化昇騰硬件上的性能。

課程形式

互動式講授與演示。
使用 CANN 工具和昇騰模擬器或設備的實操實驗。
基於真實世界 AI 模型的實際部署場景。

課程客製化選項

如需申請本課程的客製化培訓，請聯繫我們進行安排。

更多...

使用 CloudMatrix 進行 AI 推論與部署

21 小時

CloudMatrix 是華為統一的 AI 開發與部署平台，旨在支援可擴展的生產級推論流程。

本課程為實體或線上直播培訓（由導師主導），針對初學者至中階 AI 專業人士，協助他們使用整合 CANN 與 MindSpore 的 CloudMatrix 平台來部署並監控 AI 模型。

完成本培訓後，學員將能夠：

使用 CloudMatrix 進行模型封裝、部署及服務化。
為 Ascend 晶片組轉換並最佳化模型。
建立即時與批次推論任務的流程。
監控部署狀況，並在生產環境中微調效能。

課程形式

互動式講授與討論。
結合實際部署情境的 CloudMatrix 實作練習。
聚焦於轉換、最佳化及擴展的引導式練習。

課程客製化選項

若您希望根據自身的 AI 基礎架構或雲端環境，為此課程申請客製化培訓，請聯繫我們以安排。

更多...

Biren AI加速器的GPU編程

21 小時

Biren AI加速器是專為AI和HPC工作負載設計的高效能GPU，支援大規模訓練與推論。

此培訓由專業講師主導，提供線上或線下課程（線上培訓或線下培訓），適合具備中高級開發經驗的開發人員，旨在教授如何使用Biren專屬GPU堆疊進行應用程式編程與優化，並與CUDA環境進行實務比較。

完成本課程後，學員將能夠：

理解Biren GPU架構與記憶體層級。
設定開發環境，並使用Biren的編程模型。
移植並優化CUDA風格程式碼至Biren平台。
應用效能調校除錯技術。

課程格式

互動式講授與討論。
透過範例GPU工作負載實際操作Biren SDK。
引導練習，專注於移植與效能調優。

課程客製化選項

如需基於您的應用程式堆疊或整合需求，為本課程請求客製化培訓，請聯繫我們安排。

更多...

使用 BANGPy 和 Neuware 進行寒武紀 MLU 開發

21 小時

寒武紀 MLU（機器學習單元）是專為邊緣運算和數據中心場景中的推論與訓練而優化的 AI 晶片。

本課程由講師帶領，提供線上或線下直播培訓，適合希望利用 BANGPy 框架和 Neuware SDK 在寒武紀 MLU 硬體上構建及部署 AI 模型的初級開發人員。

完成此培訓後，參與者將能夠：

設置並配置 BANGPy 和 Neuware 開發環境。
為寒武紀 MLU 開發並優化基於 Python 和 C++ 的模型。
將模型部署到運行 Neuware 運行時的邊緣設備及數據中心設備上。
將機器學習工作流程與針對 MLU 專屬加速功能進行整合。

課程格式

互動式講授與討論。
實際操作使用 BANGPy 和 Neuware 進行開發與部署。
重點指導優化、整合及測試的練習。

課程客製化選項

如需基於您的寒武紀設備型號或使用案例申請本課程的客製化培訓，請聯繫我們以安排事宜。

更多...

CANN for AI Framework Developers 入門

7 小時

CANN（Compute Architecture for Neural Networks）是華為的AI計算工具包，用於在昇騰AI處理器上編譯、優化並部署AI模型。

此課程為導師帶領的實地培訓（線上或線下）。對象為初級AI開發人員，旨在讓他們了解CANN如何融入從訓練到部署的整個模型生命週期，以及它如何與MindSpore、TensorFlow和PyTorch等框架協作。

完成此培訓後，學員將能夠：

理解CANN工具包的宗旨與架構。
使用CANN和MindSpore設置開發環境。
將簡單的AI模型轉換並部署至昇騰硬體。
獲得未來進行CANN優化或整合專案的基礎知識。

課程形式

互動式講授與討論。
結合簡單模型部署的實作演練。
CANN工具鏈及其整合點的逐步解說。

課程客製化選項

如需為本課程要求客製化培訓，請聯繫我們以安排。

更多...

CANN 邊緣 AI 部署

14 小時

華為的 Ascend CANN 套件讓 Ascend 310 等邊緣設備能夠進行強大的 AI 推理。CANN 提供編譯、優化與部署模型所必需的essential工具，適用於運算能力和記憶體受限的環境。

這堂由講師主導的培訓課程（線上或線下），旨在協助初級至中級的 AI 開發人員與整合專家，學習如何使用 CANN 工具鏈在 Ascend 邊緣設備上部署並優化模型。

完成本課程後，學員將能夠：

使用 CANN 工具準備並轉換 AI 模型以供 Ascend 310 使用。
利用 MindSpore Lite 和 AscendCL 建立輕量級推理管線。
為受限的運算與記憶體環境優化模型效能。
在真實世界的邊緣應用場景中部署並監控 AI 應用程式。

課程格式

互動式講授與示範。
針對邊緣特定模型與情境的實作實驗。
在虛擬或實體邊緣硬體上的即時部署範例。

課程客製化選項

如需為此課程申請客製化培訓，請聯繫我們以安排相關事宜。

更多...

理解華為的 AI 計算堆疊：從 CANN 到 MindSpore

14 小時

華為的 AI 堆疊——從底層的 CANN SDK 到高階的 MindSpore 框架——提供了一個緊密整合的 AI 開發與部署環境，並針對昇騰硬體進行了最佳化。

本課程由導師進行 live 培訓（線上或線下），旨在幫助初級至中級技術專業人士了解 CANN 和 MindSpore 組件如何協同工作，以支援 AI 生命週期管理和基礎設施決策。

參加完本課程後，學員將能夠：

理解華為 AI 計算堆疊的分層架構。
識別 CANN 如何支援模型最佳化及硬體級別的部署。
評估 MindSpore 框架及其工具鏈相對於業界其他選擇的優勢。
將華為的 AI 堆疊定位於企業或雲端/本機環境中。

課程形式

互動式講授與討論。
live 系統演示和基於案例的逐步解說。
可選的引導式實驗，展示從 MindSpore 到 CANN 的模型流程。

課程客製化選項

如需為本課程申請客製化培訓，請聯繫我們以安排。

更多...

利用 CANN SDK 優化神經網路效能

14 小時

CANN SDK（Compute Architecture for Neural Networks，神經網路計算架構）是華為的 AI 運算基礎設施，讓開發者能夠微調並最佳化部署於昇騰（Ascend）AI 處理器的神經網路效能。

本課程由講師帶隊進行，提供線上或線下培訓。目標對象為希望使用 CANN 進階工具組（包括圖形引擎、TIK 與自訂運算子開發）來最佳化推論效能的高階 AI 開發者與系統工程師。

完成本課程後，參與者將能夠：

理解 CANN 的執行階段架構與效能生命週期。
使用剖析工具與圖形引擎進行效能分析與最佳化。
使用 TIK 和 TVM 建立並最佳化自訂運算子。
解決記憶體瓶頸，並提升模型吞吐量。

課程形式

互動式講授與討論。
實作實驗室，包含即時剖析與運算子微調。
透過邊緣部署範例進行最佳化練習。

課程客製化選項

如需針對本課程進行客製化培訓，請聯繫我們以安排。

更多...

CANN SDK 用於電腦視覺與自然語言處理管線

14 小時

CANN SDK（神經網路計算架構）為電腦視覺和 NLP 的即時 AI 應用提供強大的部署與優化工具，特別是在華為昇騰硬體上。

這項由講師指導的現場培訓（線上或線下），旨在幫助中階 AI 從業人員使用 CANN SDK 建立、部署及優化視覺與語言模型，以滿足生產用例需求。

完成本課程後，學員將能夠：

使用 CANN 和 AscendCL 部署並優化 CV 和 NLP 模型。
使用 CANN 工具轉換模型，並將它們整合到即時管線中。
優化檢測、分類及情感分析等任務的推論效能。
為邊緣或雲端部署場景建立實時的 CV/NLP 管線。

課程格式

互動式講授與示範。
實作實驗室，包含模型部署與效能分析。
使用真實 CV 和 NLP 用例設計即時管線。

課程客製化選項

如需為本課程請求客製化培訓，請聯絡我們安排。

更多...

使用 CANN TIK 和 TVM 構建自訂 AI 運算元

14 小時

CANN TIK（張量指令核心）與 Apache TVM 能夠針對華為 Ascend 硬體進行先進的 AI 模型運算元最佳化與客製化。

本課程提供講師指導及線上或線下即時培訓，目標受眾為進階系統開發人員，旨在協助其使用 CANN 的 TIK 程式設計模型與 TVM 編譯器整合功能，建立、部署並微調 AI 模型的自訂運算元。

完成本課程後，學員將能夠：

使用適用於 Ascend 處理器的 TIK DSL 撰寫並測試自訂 AI 運算元。
將自訂運算元整合至 CANN 執行階段與執行圖形。
使用 TVM 進行運算元排程、自動微調及基準測試。
除錯並最佳化自訂計算模式的指令層級效能。

課程格式

互動式講授與示範。
使用 TIK 和 TVM 管線進行運算元實作編碼。
在 Ascend 硬體或模擬器上進行測試與微調。

課程客製化選項

若需針對此課程申請客製化培訓，請聯繫我們安排。

更多...

將 CUDA 應用程式遷移至中國 GPU 架構

21 小時

中國的 GPU 架構（如華為昇騰、必易科技及寒武紀 MLU）為當地 AI 和高性能運算市場提供了針對性的 CUDA 替代方案。

本課程由講師進行現場或線上實作培訓，旨在協助進階等級的 GPU 程式設計師和基礎設施專家遷移並優化現有的 CUDA 應用程式，以部署至中國硬體平台。

完成本培訓後，學員將能夠：

評估現有 CUDA 工作負載與中國晶片替代方案的相容性。
將 CUDA 程式碼庫移植至華為 CANN、必易科技 SDK 及寒武紀 BANGPy 環境。
比較不同平台的效能並找出優化點。
解決跨架構支援和部署中的實際挑戰。

課程格式

互動式講座與討論。
實作程式碼移植及效能比較實驗室。
指導式練習，專注於多 GPU 適應策略。

課程客製化選項

若需根據您的平台或 CUDA 專案申請此課程的客製化培訓，請聯繫我們進行安排。

更多...

Ascend、Biren與寒武紀的性能優化

21 小時

Ascend、Biren和寒武紀是中國領先的AI硬體平台，各自提供獨特的加速和分析工具，以支援生產級別的AI工作負載。

本課程由講師現場授課，可採線上或線下方式進行。對象為進階級的AI基礎設施與效能工程師，旨在協助學員優化跨多個中國AI晶片平台的模型推理與訓練工作流程。

完成本課程後，學員將能夠：

在Ascend、Biren和寒武紀平台上對模型進行基準測試。
識別系統瓶頸及記憶體/運算效率低下之處。
套用圖層、核心層及運算子層級的優化策略。
調整部署流程，以提升吞吐量並降低延遲。

課程形式

互動式講授與討論。
動手使用各平台的分析與優化工具。
聚焦於實際調參場景的引導式練習。

課程自訂選項

若需根據您的效能環境或模型類型，為此課程安排客製化培訓，請聯繫我們以便安排。

更多...

課程分類

NVIDIA GPU Programming - Extended培訓

課程簡介

最低要求

客戶評論 (1)

Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.

課程 - NVIDIA GPU Programming - Extended

即將到來的課程

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

NVIDIA GPU Programming - Extended培訓

課程簡介

最低要求

客戶評論 (1)

Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.

課程 - NVIDIA GPU Programming - Extended

即將到來的課程

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

NVIDIA GPU Programming - Extended

相關課程

使用華為昇騰和CANN開發AI應用

使用 CANN 和昇騰 AI 處理器部署 AI 模型

使用 CloudMatrix 進行 AI 推論與部署

Biren AI加速器的GPU編程

使用 BANGPy 和 Neuware 進行寒武紀 MLU 開發

CANN for AI Framework Developers 入門

CANN 邊緣 AI 部署

理解華為的 AI 計算堆疊：從 CANN 到 MindSpore

利用 CANN SDK 優化神經網路效能

CANN SDK 用於電腦視覺與自然語言處理管線

使用 CANN TIK 和 TVM 構建自訂 AI 運算元

將 CUDA 應用程式遷移至中國 GPU 架構

Ascend、Biren與寒武紀的性能優化

課程分類

GPU

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites