課程簡介

詳細的培訓大綱

    NLP簡介 瞭解 NLP NLP 框架 NLP的商業應用 從 Web 抓取數據 使用各種 API 檢索文本數據 處理和存儲文本語料庫,保存內容和相關元數據 使用 Python 和 NLTK 速成班的優勢 對語料庫和數據集的實際理解 為什麼我們需要語料庫? 語料庫分析 數據屬性的類型 語料庫的不同檔格式 為 NLP 應用程式準備數據集 理解句子的結構 NLP的組成部分 自然語言理解 形態學分析 - 詞幹、單詞、標記、語音標籤 句法分析 語義分析 處理歧義 文本數據預處理 語料庫 - 原始文本 句子標記化 原始文字的詞幹提取 原始文本的引述 停用詞刪除 語料庫原始句子 Word 代幣化 Word 詞形還原 使用 Term-Document/Document-Term 矩陣 將文本標記化為 n-gram 和句子 實用和定製的預處理 分析文字數據 NLP的基本特徵 解析器和解析器 POS 標記和標記器 名稱實體識別 N-gram 一袋字 NLP的統計特徵 NLP 線性代數的概念 NLP的概率理論 TF-IDF型 矢量化 編碼器和解碼器 正常化 概率模型 高級特徵工程和 NLP word2vec 的基礎知識 word2vec 模型的元件 word2vec 模型的邏輯 word2vec 概念的擴展 word2vec模型的應用 案例研究:詞袋的應用:使用簡化和真實的 Luhn 演算法進行自動文本摘要 文檔聚類、分類和主題建模 文件聚類和模式挖掘(分層聚類、k-means、聚類等) 使用 TFIDF、Jaccard 和餘弦距離測量值對文檔進行比較和分類 使用樸素貝葉斯和最大熵進行文檔分類 識別重要的文本元素 降維:主成分分析、奇異值分解、非負矩陣分解 使用潛在語義分析進行主題建模和資訊檢索 實體提取、情感分析和高級主題建模 積極與消極:情緒程度 項目反應理論 詞性標註及其應用:查找文本中提到的人物、地點和組織 高級主題建模:潛在狄利克雷分配 案例研究 挖掘非結構化用戶評論 產品評論數據的情緒分類和可視化 挖掘使用模式的搜索日誌 文本分類 主題建模

最低要求

對NLP 原理的了解和認識,以及對人工智慧在商業中的應用的理解

 21 時間:

人數



每位參與者的報價

客戶評論 (2)

相關課程

Smart Robots for Developers

84 時間:

課程分類