首頁
Artificial Intelligence (AI) 培訓
自然語言處理（NLP）培訓
Large Language Models (LLMs) 培訓
生產環境中部署騰訊混元：低延遲推理與成本優化培訓

生產環境中部署騰訊混元：低延遲推理與成本優化培訓

生產環境中部署騰訊混元：低延遲推理與成本優化是一門實用課程，旨在幫助學員在大規模場景下可靠地部署騰訊混元模型。

本次講師指導的培訓（線上或線下）面向中級工程師和架構師，幫助他們使用騰訊混元部署大型和MoE模型，降低延遲，提高GPU利用率，並控制運營成本。

培訓結束後，學員將能夠：

解釋部署騰訊混元模型時面臨的主要生產挑戰。
應用實用的推理優化技術，如TensorRT、KV緩存調優、量化和批處理。
設計可擴展的部署方案，包括自動擴展、監控和容量規劃。
在實際生產負載中優化延遲與成本的權衡。

課程形式

互動式講座與討論。
大量練習與實踐。
在實驗環境中進行動手操作。

課程定製選項

如需定製本課程，請聯繫我們安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

騰訊混元生產基礎

騰訊混元模型服務場景概述
大型和MoE模型的生產特性
常見的延遲、吞吐量和成本瓶頸
定義推理工作負載的服務級別目標

部署架構與服務流程

生產推理堆棧的核心組件
在容器化、本地和雲部署模型之間選擇
模型加載、請求路由和GPU分配基礎
設計可靠且操作簡單的系統

實踐中的延遲優化

使用優化的推理引擎（如TensorRT）
KV緩存概念及實際緩存調優
減少啓動、預熱和響應開銷
測量首令牌時間和令牌生成速度

吞吐量、批處理與GPU效率

連續批處理和請求批處理策略
管理併發和隊列行爲
在不影響用戶體驗的情況下提高GPU利用率
處理長上下文和混合工作負載請求

量化與成本控制

量化在生產服務中的重要性
FP16、INT8和其他常見精度選項的實際權衡
平衡模型質量、延遲和基礎設施成本
構建簡單的成本優化清單

運營、監控與準備審查

推理服務的自動擴展觸發器
監控延遲、吞吐量、緩存使用和GPU健康狀況
日誌記錄、告警和事件響應基礎
審查參考部署並制定改進計劃

最低要求

對大型語言模型部署和推理工作流程有基本瞭解。
具備容器、雲或本地基礎設施以及基於API的服務經驗。
熟悉Python或系統工程任務。

受衆

將LLM部署到生產環境的ML工程師。
負責基於GPU推理服務的平臺工程師。
設計可擴展AI服務平臺的技術架構師。

14 小時

人數

在線

課堂

選擇地點

請選擇一個場地

每位參與者的報價

公開培訓課程需要5名以上參與者。

生產環境中部署騰訊混元：低延遲推理與成本優化培訓 - 訂單

全名 *

郵件 *

電話 *

職務

公司名稱

地址1 *

市 *

州/省

國家 *

郵編 *

開始日期

稅號

日期視乎可用性而定，將在 09:30 和 16:30 之間舉行。

支付 *

銀行轉帳（發票，收據）

借記卡 / 信用卡

評論

條款與條件 *

我是上述客戶的授權代表，我希望根據 NobleProg 條款和條件以及隱私政策預訂上述課程或服務。

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

生產環境中部署騰訊混元：低延遲推理與成本優化培訓 - 詢問

全名 *

郵件 *

電話 *

人數

公司名稱

公司地址

您想以何種方式參加課程？

客戶場地

线上

課堂

評論

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

生產環境中部署騰訊混元：低延遲推理與成本優化 - 咨詢詢問

全名 *

電話 *

郵件 *

公司名稱

諮詢主題 *

諮詢目標

諮詢師將會和什麼人合作

35 小時

LangGraph 是一個用於構建具狀態、多參與者 LLM 應用程式的框架，其特點是可組合的圖結構、持久狀態以及對執行的控制。

這是一個由講師主導的培訓課程（線上或線下），旨在為高階 AI 平台工程師、AI DevOps 工程師以及處理生產級 LangGraph 系統的 ML 架構師提供優化、調試、監控和運營的相關技能。

在本課程結束時，參與者將能夠：

設計並優化複雜的 LangGraph 拓撲結構，以實現速度、成本和可擴展性的最佳化。
通過重試、超時、冪等性和基於檢查點的恢復來實現可靠性工程。
調試和追蹤圖執行過程，檢查狀態，並系統性地重現生產問題。
為圖添加日誌、指標和追蹤，部署到生產環境，並監控 SLA 和成本。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗環境中進行實作。

課程定制選項

如需定制本課程，請聯繫我們進行安排。

更多...

使用 Devstral 構建編碼代理：從代理設計到工具化

14 小時

Devstral 是一個開源框架，旨在構建和運行編碼代理，這些代理可以與代碼庫、開發者工具和 API 交互，以提升工程效率。

本課程由講師指導，採用線上或線下培訓形式，面向中高級 ML 工程師、開發者工具團隊以及 SRE，幫助他們使用 Devstral 設計、實現和優化編碼代理。

通過本課程，學員將能夠：

設置和配置 Devstral 以進行編碼代理開發。
設計用於代碼庫探索和修改的代理工作流。
將編碼代理與開發者工具和 API 集成。
實施安全和高效代理部署的最佳實踐。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗室環境中進行動手操作。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

開源模型運維：使用Devstral和Mistral模型進行自託管、微調和治理

14 小時

Devstral 和 Mistral 模型是開源 AI 技術，專爲靈活部署、微調和可擴展集成而設計。

本次由講師指導的培訓（線上或線下）面向中級到高級的機器學習工程師、平臺團隊和研究工程師，旨在幫助他們在生產環境中自託管、微調和管理 Mistral 和 Devstral 模型。

培訓結束後，參與者將能夠：

設置和配置 Mistral 和 Devstral 模型的自託管環境。
應用微調技術以提升特定領域的性能。
實現版本控制、監控和生命週期治理。
確保開源模型的安全性、合規性和負責任的使用。

課程形式

互動講座和討論。
自託管和微調的實踐練習。
治理和監控管道的即時實驗室實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

LangGraph在金融領域的應用

35 小時

LangGraph 是一個用於構建有狀態、多參與者 LLM 應用的框架，通過可組合的圖結構實現持久狀態和執行控制。

本次由講師主導的培訓（線上或線下）面向中級到高級專業人士，旨在幫助他們設計、實施和運營基於 LangGraph 的金融解決方案，確保其具備適當的治理、可觀測性和合規性。

通過本次培訓，參與者將能夠：

設計與監管和審計要求一致的金融專用 LangGraph 工作流。
將金融數據標準和本體集成到圖狀態和工具中。
爲關鍵流程實施可靠性、安全性和人工介入控制。
部署、監控和優化 LangGraph 系統，以滿足性能、成本和 SLA 要求。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗室環境中進行實際操作。

課程定製選項

如需定製本課程，請聯繫我們安排。

更多...

LangGraph基礎：基於圖的LLM提示與鏈式編程

14 小時

LangGraph 是一個用於構建圖結構 LLM 應用的框架，支持規劃、分支、工具使用、內存和可控執行。

本次由講師指導的培訓（線上或線下）面向初級開發者、提示工程師和數據從業者，旨在幫助他們使用 LangGraph 設計和構建可靠的多步驟 LLM 工作流。

培訓結束後，參與者將能夠：

解釋 LangGraph 的核心概念（節點、邊、狀態）及其使用場景。
構建支持分支、調用工具和保持內存的提示鏈。
將檢索和外部 API 集成到圖工作流中。
測試、調試和評估 LangGraph 應用的可靠性和安全性。

課程形式

互動講座和引導討論。
在沙盒環境中進行指導實驗和代碼演練。
基於場景的設計、測試和評估練習。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

LangGraph在醫療保健中的應用：受監管環境中的工作流編排

35 小時

LangGraph 支持由 LLM 驅動的有狀態、多參與者工作流，並能精確控制執行路徑和狀態持久化。在醫療領域，這些功能對於合規性、互操作性以及構建符合醫療工作流的決策支持系統至關重要。

本次講師主導的培訓（線上或線下）面向中高級專業人員，旨在幫助他們設計、實施和管理基於 LangGraph 的醫療解決方案，同時應對監管、道德和操作挑戰。

培訓結束後，參與者將能夠：

設計符合合規性和可審計性的醫療專用 LangGraph 工作流。
將 LangGraph 應用與醫療本體和標準（FHIR、SNOMED CT、ICD）集成。
在敏感環境中應用可靠性、可追溯性和可解釋性的最佳實踐。
在醫療生產環境中部署、監控和驗證 LangGraph 應用。

課程形式

互動式講座與討論。
基於真實案例的實踐練習。
在即時實驗環境中進行實施實踐。

課程定製選項

如需定製本課程，請聯繫我們安排。

更多...

LangGraph法律應用

35 小時

LangGraph是一個用於構建有狀態、多參與者LLM應用的框架，它通過可組合的圖結構實現持久狀態，並對執行過程進行精確控制。

本課程爲講師指導的培訓（線上或線下），面向中高級專業人員，旨在幫助他們設計、實施和操作基於LangGraph的法律解決方案，並確保必要的合規性、可追溯性和治理控制。

培訓結束後，學員將能夠：

設計特定於法律的LangGraph工作流程，確保可審計性和合規性。
將法律本體和文檔標準集成到圖狀態和處理中。
實施護欄、人工審批和可追溯的決策路徑。
在生產環境中部署、監控和維護LangGraph服務，並確保可觀測性和成本控制。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗室環境中進行動手操作。

課程定製選項

如需定製本課程，請聯繫我們進行安排。

更多...

使用LangGraph和LLM代理構建動態工作流

14 小時

LangGraph 是一個用於構建圖結構 LLM 工作流的框架，支持分支、工具使用、內存和可控執行。

本次由講師指導的培訓（線上或線下）面向中級工程師和產品團隊，他們希望將 LangGraph 的圖邏輯與 LLM 代理循環相結合，以構建動態、上下文感知的應用程序，如客戶支持代理、決策樹和信息檢索系統。

在培訓結束時，參與者將能夠：

設計基於圖的工作流，協調 LLM 代理、工具和內存。
實現條件路由、重試和回退，以確保穩健執行。
將檢索、API 和結構化輸出集成到代理循環中。
評估、監控並強化代理行爲，以確保可靠性和安全性。

課程形式

互動講座和引導討論。
在沙盒環境中進行引導實驗和代碼演練。
基於場景的設計練習和同行評審。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

LangGraph用於營銷自動化

14 小時

LangGraph是一個基於圖的編排框架，支持條件化、多步驟的LLM和工具工作流，非常適合自動化和個性化內容管道。

本次由講師指導的培訓（線上或線下）面向中級營銷人員、內容策略師和自動化開發人員，旨在幫助他們使用LangGraph實現動態、分支的電子郵件營銷活動和內容生成管道。

培訓結束後，學員將能夠：

使用條件邏輯設計圖結構的內容和電子郵件工作流。
集成LLM、API和數據源以實現自動化個性化。
在多步驟活動中管理狀態、內存和上下文。
評估、監控和優化工作流性能和交付結果。

課程形式

互動講座和小組討論。
動手實驗，實現電子郵件工作流和內容管道。
基於場景的練習，涵蓋個性化、分段和分支邏輯。

課程定製選項

如需定製本課程，請聯繫我們進行安排。

更多...

Le Chat Enterprise：私有ChatOps、集成與管理控制

14 小時

Le Chat Enterprise 是一款私有的 ChatOps 解決方案，爲組織提供安全、可定製且受管控的對話式 AI 功能，支持 RBAC、SSO、連接器以及企業應用集成。

本次由講師主導的培訓（線上或線下）面向中級產品經理、IT 負責人、解決方案工程師以及安全/合規團隊，旨在幫助他們部署、配置和管理企業環境中的 Le Chat Enterprise。

培訓結束後，參與者將能夠：

爲安全部署設置和配置 Le Chat Enterprise。
啓用 RBAC、SSO 和合規驅動的控制。
將 Le Chat 與企業應用程序和數據存儲集成。
爲 ChatOps 設計和實施治理和管理手冊。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗環境中進行實際操作。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

高性價比LLM架構：大規模Mistral（性能/成本工程）

14 小時

Mistral 是一個高性能的大型語言模型系列，專爲經濟高效的大規模生產部署而優化。

本課程爲講師指導的培訓（線上或線下），面向高級基礎設施工程師、雲架構師和 MLOps 負責人，旨在幫助他們設計、部署和優化基於 Mistral 的架構，以實現最大吞吐量和最低成本。

通過本培訓，參與者將能夠：

爲 Mistral Medium 3 實施可擴展的部署模式。
應用批處理、量化和高效服務策略。
在保持性能的同時優化推理成本。
爲企業工作負載設計生產就緒的服務拓撲。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗室環境中進行實際操作。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

使用Mistral連接器和集成實現對話助手產品化

14 小時

Mistral AI 是一個開放的人工智能平臺，使團隊能夠構建對話助手，並將其集成到企業和麪向客戶的工作流程中。

本次講師指導的培訓（線上或線下）面向初級到中級的產品經理、全棧開發人員和集成工程師，旨在幫助他們使用 Mistral 連接器和集成設計、集成併產品化對話助手。

培訓結束後，參與者將能夠：

將 Mistral 對話模型與企業及 SaaS 連接器集成。
實現檢索增強生成（RAG）以提供基於上下文的響應。
爲內部和外部聊天助手設計用戶體驗模式。
將助手部署到產品工作流程中，用於實際應用場景。

課程形式

互動式講座與討論。
動手集成練習。
即時實驗室開發對話助手。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

企業級部署與Mistral Medium 3

14 小時

Mistral Medium 3 是一款高性能、多模態的大型語言模型，專爲在企業環境中進行生產級部署而設計。

本課程爲講師指導的線下或線上培訓，面向希望在企業用例中部署、優化和保護 Mistral Medium 3 的中級到高級 AI/ML 工程師、平臺架構師和 MLOps 團隊。

培訓結束後，參與者將能夠：

使用 API 和自託管選項部署 Mistral Medium 3。
優化推理性能和成本。
使用 Mistral Medium 3 實現多模態用例。
在企業環境中應用安全和合規最佳實踐。

課程形式

互動講座和討論。
大量練習和實踐。
在即時實驗室環境中進行動手實踐。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

Mistral for Responsible AI: Privacy, Data Residency & Enterprise Controls

14 小時

Mistral AI 是一個開放且企業就緒的 AI 平臺，提供安全、合規且負責任的 AI 部署功能。

本次由講師主導的培訓（線上或線下）面向中級合規負責人、安全架構師以及法律/運營相關方，旨在通過利用隱私、數據駐留和企業控制機制，在 Mistral 中實施負責任的 AI 實踐。

培訓結束後，參與者將能夠：

在 Mistral 部署中實施隱私保護技術。
應用數據駐留策略以滿足法規要求。
設置企業級控制，如 RBAC、SSO 和審計日誌。
評估供應商和部署選項以實現合規性。

課程形式

互動講座和討論。
以合規爲重點的案例研究和練習。
企業 AI 控制的實際操作實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

多模態應用與Mistral模型（視覺、OCR與文檔理解）

14 小時

Mistral模型是開源的人工智能技術，現已擴展到多模態工作流程，支持企業和研究應用中的語言和視覺任務。

本次由講師主導的培訓（線上或線下）面向中級ML研究人員、應用工程師和產品團隊，旨在幫助他們使用Mistral模型構建多模態應用，包括OCR和文檔理解流程。

培訓結束後，參與者將能夠：

爲多模態任務設置和配置Mistral模型。
實施OCR工作流程，並將其與NLP管道集成。
爲企業用例設計文檔理解應用。
開發視覺文本搜索和輔助UI功能。

課程形式

互動講座和討論。
動手編碼練習。
多模態管道的即時實驗室實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

生產環境中部署騰訊混元：低延遲推理與成本優化培訓

課程簡介

最低要求

即將到來的課程

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

生產環境中部署騰訊混元：低延遲推理與成本優化培訓

課程簡介

最低要求

即將到來的課程

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

生產環境中部署騰訊混元：低延遲推理與成本優化

相關課程

高級LangGraph：複雜圖的優化、調試與監控

使用 Devstral 構建編碼代理：從代理設計到工具化

開源模型運維：使用Devstral和Mistral模型進行自託管、微調和治理

LangGraph在金融領域的應用

LangGraph基礎：基於圖的LLM提示與鏈式編程

LangGraph在醫療保健中的應用：受監管環境中的工作流編排

LangGraph法律應用

使用LangGraph和LLM代理構建動態工作流

LangGraph用於營銷自動化

Le Chat Enterprise：私有ChatOps、集成與管理控制

高性價比LLM架構：大規模Mistral（性能/成本工程）

使用Mistral連接器和集成實現對話助手產品化

企業級部署與Mistral Medium 3

Mistral for Responsible AI: Privacy, Data Residency & Enterprise Controls

多模態應用與Mistral模型（視覺、OCR與文檔理解）

課程分類

Large Language Models (LLMs)

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites