大數據培訓 | Big Data培訓

大數據培訓

由講師進行實時指導的大數據本地培訓課程將首先介紹大數據的元素概念,然後介紹用于執行數據分析的編程語言和方法。在課程的演示練習環節,我們會討論、比較並使用用于實現大數據存儲、分布式處理、可伸縮性的工具和基礎架構。

大數據培訓形式包括“現場實時培訓”和“遠程實時培訓”。現場實時培訓可在客戶位于台灣的所在場所或NobleProg位于台灣的企業培訓中心進行,遠程實時培訓可通過交互式遠程桌面進行。

NobleProg -- 您的本地培訓提供商

客戶評論

★★★★★
★★★★★

大數據課程大綱

標題
Duration
Overview
標題
Duration
Overview
21 hours
Overview
Apache Accumulo是一個經過排序的分布式密鑰/值存儲,可提供強大的可擴展數據存儲和檢索功能。它基于Google BigTable的設計,並且由Apache Hadoop,Apache Zookeeper和Apache Thrift提供支持。 本課程涵蓋了Accumulo背後的工作原理,並通過在Apache Accumulo上開發示例應用程序向參與者介紹。 聽衆 應用開發者軟件工程師技術顧問 課程的格式 部分講座,部分討論,簡單的開發和實施,偶爾的測試以衡量理解 。
21 hours
Overview
流處理指的是“運動中的數據”的實時處理,即對數據進行接收時的計算。這些數據是從傳感器事件,網站用戶活動,金融交易,信用卡刷卡,點擊流等數據源中讀取的連續數據流。流處理框架能夠讀取大量傳入數據並幾乎同時提供有價值的見解。 在這個有指導意義的現場培訓(現場或遠程)中,參與者將學習如何設置和集成不同的流處理框架與現有的大數據存儲系統以及相關的軟件應用程序和微服務。 在培訓結束後,參與者將能夠: 安裝和配置不同的流處理框架,例如Spark Streaming和Kafka Streaming 理解並選擇最合適的工作框架數據處理不斷,同時進行,並以記錄方式記錄將流處理解決方案與現有數據庫,數據倉庫,數據湖等集成將最合適的流處理庫與企業應用程序和微服務集成在一起 聽衆 開發商軟件架構師 課程的 格式 部分講座,部分討論,練習和沈重的練習 筆記 要請求本課程的定制培訓,請聯系我們安排。
28 hours
Overview
MemSQL是一個內存,分布式,用于雲和onPremises的SQL數據庫管理系統。這是一個實時數據倉庫,可立即提供實時和曆史數據的見解。 在這個有指導意義的現場培訓中,參與者將學習MemSQL的開發和管理基本知識。 在培訓結束後,參與者將能夠: 了解MemSQL的關鍵概念和特性安裝,設計,維護和操作MemSQL 在MemSQL中優化模式在MemSQL中改進查詢 MemSQL的基准性能使用MemSQL構建實時數據應用程序 聽衆 開發商管理員操作工程師 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
預測性分析是使用數據分析來預測未來的過程。此過程使用數據以及數據挖掘、統計和機器學習技術創建可用來預測未來事件的預測模型。

在這一由講師引導的現場培訓中,參與者將學習如何使用Matlab建立預測模型,並將其應用于大樣本數據集,以根據數據預測未來事件。

在培訓結束後,參與者將能夠:

- 創建預測模型來分析曆史和交易數據中的規律
- 使用預測建模來識別風險和機會
- 建立捕捉重要趨勢的數學模型
- 使用來自設備和業務系統的數據來減少浪費、節省時間或降低成本

受衆

- 開發人員
- 工程師
- 領域專家

課程形式

- 部分講座、部分討論、練習和大量實操
7 hours
Overview
在這個有指導意義的現場培訓中,參與者將學習MapR流體系結構背後的核心概念,因爲他們開發的是實時流式傳輸應用程序。 到培訓結束時,參與者將能夠構建實時流數據處理的生産者和消費者應用程序。 聽衆 開發商管理員 課程的格式 部分講座,部分討論,練習和沈重的練習 注意 要請求本課程的定制培訓,請聯系我們安排。
14 hours
Overview
Magellan是一個開源分布式執行引擎,用于處理大數據的地理空間分析。它在Apache Spark之上實現,它擴展了Spark SQL並爲地理空間分析提供了關系抽象。 這種有指導意義的實時培訓介紹了實施地理空間分析的概念和方法,並通過在Spark上使用Magellan創建預測分析應用程序來引導參與者。 在培訓結束後,參與者將能夠: 按比例高效地查詢,解析和加入地理空間數據集在商業智能和預測分析應用程序中實施地理空間數據使用空間上下文來擴展移動設備,傳感器,日志和可穿戴設備的功能 聽衆 應用開發者 課程的格式 部分講座,部分討論,練習和沈重的練習
14 hours
Overview
Apache Kylin是一款針對大數據的極端分布式分析引擎。 在這個有指導的現場培訓中,參與者將學習如何使用Apache Kylin建立實時數據倉庫。 在培訓結束後,參與者將能夠: 使用Kylin實時流式傳輸數據利用Apache Kylin強大的功能,包括雪花模式支持,豐富的SQL界面,火花立方體和亞秒查詢延遲 注意 我們使用最新版本的Kylin(截至撰寫本文時爲Apache Kylin v20) 聽衆 大數據工程師大數據分析師 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
數據庫中的知識發現(KDD)是從一組數據中發現有用知識的過程。這種數據挖掘技術的再生應用包括市場營銷,欺詐檢測,電信和制造。 在本課程中,我們將介紹KDD中涉及的過程,並執行一系列練習來練習這些過程的實施。 聽衆 數據分析師或任何有興趣學習如何解釋數據來解決問題的人 課程的格式 在對KDD進行理論討論之後,講師將介紹需要應用KDD來解決問題的重現案例。參與者將准備,選擇和清理樣本數據集,並利用其關于數據的先前知識根據觀察結果提出解決方案。
7 hours
Overview
Kafka Streams是一個用于構建應用程序和微服務的客戶端庫,其數據傳遞到Kafka消息傳遞系統。傳統上,Apache Kafka依靠Apache Spark或Apache Storm來處理消息生産者和消費者之間的數據。通過在應用程序內調用Kafka Streams API,可以在Kafka內直接處理數據,而無需將數據發送到單獨的群集進行處理。 在這個有指導意義的實時培訓中,參與者將學習如何將Kafka Streams集成到一組樣本Java應用程序中,這些應用程序將數據傳入和傳出Apache Kafka進行流處理。 在培訓結束後,參與者將能夠: 了解Kafka Streams與其他流處理框架相比的特性和優勢在Kafka集群中直接處理流數據編寫與Kafka和Kafka Streams集成的Java或Scala應用程序或微服務編寫簡潔的代碼,將輸入的Kafka主題轉化爲輸出的Kafka主題構建,打包和部署應用程序 聽衆 開發商 課程的 格式 部分講座,部分討論,練習和沈重的練習 筆記 要請求本課程的定制培訓,請聯系我們安排
21 hours
Overview
對物聯網或物聯網市場價值的估計是巨大的,因爲根據定義,物聯網是一個集成和擴散的設備,傳感器和計算能力層,覆蓋整個消費者,企業對企業和政府行業。物聯網將占據越來越多的連接:今天的設備數量達到19億台,到2018年達到90億次。那一年,它將大致相當于智能手機,智能電視,平板電腦,可穿戴計算機和個人電腦的數量。&nbsp ; 在消費領域,許多産品和服務已經越過物聯網,包括廚房和家用電器,停車場,RFID,照明和加熱産品,以及工業互聯網中的許多應用。  然而,物聯網的基礎技術並不是什麽新事物,因爲自互聯網誕生以來,M2M通信已經存在。然而,在過去幾年中發生的變化是,在每個家庭中通過壓倒性地改編智能手機和平板電腦而增加了許多廉價無線技術。移動設備的爆炸性增長導致了物聯網的當前需求。  由于物聯網業務無限機會,大量中小型企業家紛紛加入物聯網淘金熱潮。此外,由于開源電子和物聯網平台的出現,物聯網系統的開發成本和進一步管理其大規模生産的成本越來越低。現有的電子産品所有者正面臨將其設備與互聯網或移動應用集成的壓力。 此培訓旨在對新興行業進行技術和業務審核,以便物聯網愛好者/企業家能夠掌握物聯網技術和業務的基礎知識。 課程目標  本課程的主要目標是介紹家庭和辦公室中物聯網實施的新興技術選擇,平台和案例研究。城市自動化(智能家居和城市),工業互聯網,醫療保健,政府,移動手機和其他領域。  IoT-Mechanical,電子/傳感器平台,無線和有線協議,移動到電子集成,移動到企業集成,數據分析和總控制平面的所有元素的基本介紹。 M2M無線協議,適用于物聯網 - WiFi,Zigbee / Zwave,藍牙,ANT +:何時何地使用哪一種?  移動/桌面/網絡應用程序 - 用于注冊,數據采集和控制–可用于物聯網的M2M數據采集平台 - – Xively,Omega和NovoTech等 物聯網安全問題和安全解決方案 IoT-Rasberry Pi,Adruino,ArmMbedLPC等的開源/商業電子平台  IoT-Ayla,iO Bridge,Libellium,Axeda,思科青蛙雲的開源/商業企業雲平台 一些常見物聯網設備的業務和技術研究,如家庭自動化,煙霧報警器,車輛,軍隊,家庭健康等。 目標受衆 投資者和物聯網企業家  公司正在冒險進入物聯網領域的經理和工程師 商業分析師&投資者
14 hours
Overview
本課程適用于開發商課程的格式講座,實踐練習,一路上的小測試來衡量理解
21 hours
Overview
Apache NiFi(Hortonworks DataFlow)是一個實時綜合數據物流和簡單的事件處理平台,可以在系統之間移動,跟蹤和自動化數據。它使用基于流程的編程編寫,並提供基于Web的用戶界面來實時管理數據流。 在這個有指導的實時培訓中,參與者將學習如何在實驗室環境中部署和管理Apache NiFi。 在培訓結束後,參與者將能夠: 安裝並配置Apachi NiFi 來源,轉換和管理來自不同分布式數據源的數據,包括數據庫和大數據湖泊自動化數據流啓用流式分析應用各種方法進行數據攝取將大數據轉化爲商業洞察 聽衆 系統管理員數據工程師開發商 DevOps的 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
Cloudera Impala是Apache Hadoop集群的開源大規模並行處理(MPP)SQL查詢引擎。 Impala使用戶能夠對存儲在Hadoop分布式文件系統和Apache Hbase中的數據發出低延遲SQL查詢,而無需數據移動或轉換。 聽衆 本課程面向分析師和數據科學家,通過商業智能或SQL工具對存儲在Hadoop中的數據進行分析。 此課程後,代表們將能夠 使用Impala從Hadoop集群提取有意義的信息。 編寫特定程序以促進Impala SQL Dialect中的商業智能。 排查Impala故障。
7 hours
Overview
本課程介紹如何爲從Hive提取數據的人員使用Hive SQL語言(又名:Hive HQL,Hive上的SQL,HiveQL)
21 hours
Overview
Hortonworks Data Platform是一個開源的Apache Hadoop支持平台,爲在Apache Hadoop生態系統上開發大數據解決方案提供了穩定的基礎。 這個有指導性的實時培訓介紹Hortonworks,並通過部署Spark + Hadoop解決方案向參與者介紹。 在培訓結束後,參與者將能夠: 使用Hortonworks可以大規模可靠地運行Hadoop 使用Spark的敏捷分析工作流程統一Hadoop的安全性,治理和操作功能。 使用Hortonworks來調查,驗證,驗證和支持Spark項目中的每個組件處理不同類型的數據,包括結構化,非結構化,動態和特定。 聽衆 Hadoop管理員 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
本課程介紹Hadoop之上的HBase - NoSQL存儲。本課程面向將要使用HBase開發應用程序的開發人員以及將管理HBase集群的管理員。 我們將通過HBase架構和數據建模和應用程序開發走向開發人員。它還將討論在HBase中使用MapReduce,以及與性能優化相關的一些管理主題。該課程非常適合大量實驗練習。 持續時間 :3天 受衆 :開發人員和管理員
28 hours
Overview
Hadoop是一個流行的大數據處理框架。 Python是一種高級編程語言,因其清晰的語法和代碼可讀性而聞名。 在這個有指導意義的實時培訓中,參與者將學習如何使用Python處理Hadoop,MapReduce,Pig和Spark,因爲他們逐步了解了多個示例和用例。 在培訓結束後,參與者將能夠: 了解Hadoop,MapReduce,Pig和Spark背後的基本概念在Hadoop分布式文件系統(HDFS),MapReduce,Pig和Spark中使用Python 使用Snakebite以編程方式訪問Python中的HDFS 使用mrjob在Python中編寫MapReduce作業用Python編寫Spark程序使用Python UDF擴展豬的功能使用Luigi管理MapReduce作業和Pig腳本 聽衆 開發商 IT專業人員 課程的格式 部分講座,部分討論,練習和沈重的練習
28 hours
Overview
聽衆:

本課程旨在揭開大數據/ hadoop技術的神秘面紗,並表明它不難理解。
14 hours
Overview
隨著越來越多的軟件和IT項目從本地處理和數據管理轉向分布式處理和大數據存儲,項目經理們正在意識到需要升級他們的知識和技能,以掌握與大數據項目和機會相關的概念和實踐。

本課程將向項目經理介紹當下最流行的大數據處理框架:Hadoop。

在這一由講師引導的培訓中,學員將學習Hadoop生態系統的核心組件,以及這些技術如何用于解決大規模問題。在學習這些基礎的過程中,學員還將提高他們與這些系統的開發人員和實施人員以及許多IT項目涉及的數據科學家和分析師溝通的能力。

受衆

- 希望將Hadoop應用到其現有開發或IT基礎架構中的項目經理
- 需要與包括大數據工程師、數據科學家和業務分析師在內的跨職能團隊進行溝通的項目經理

課程形式

- 部分講座、部分討論、練習和大量實操
21 hours
Overview
Hadoop是最受歡迎的大數據處理框架。
21 hours
Overview
Apache Hadoop是用于在服務器集群上處理大數據的最流行的框架之一。本課程深入研究HDFS,高級Pig,Hive和HBase中的數據管理。這些高級編程技術將對經驗豐富的Hadoop開發人員有所幫助。 受衆 :開發者 持續時間:三天 格式:講座(50%)和實驗室(50%)。
28 hours
Overview
MonetDB是開源數據庫,開創了列存儲技術方法。 在這個有指導意義的現場培訓中,參與者將學習如何使用MonetDB以及如何從中獲得最大價值。 在培訓結束後,參與者將能夠: 了解MonetDB及其功能安裝並開始使用MonetDB 在MonetDB中探索和執行不同的功能和任務通過最大限度地發揮MonetDB功能加速他們項目的交付 聽衆 開發商技術專家 課程的格式 部分講座,部分討論,練習和沈重的練習
7 hours
Overview
Apache NiFi(Hortonworks DataFlow)是一個實時綜合數據物流和簡單的事件處理平台,可以在系統之間移動,跟蹤和自動化數據。它使用基于流程的編程編寫,並提供基于Web的用戶界面來實時管理數據流。 在這個有指導意義的現場培訓中,參與者將學習基于流程編程的基礎知識,因爲他們使用Apache NiFi開發了大量演示擴展,組件和處理器。 在培訓結束後,參與者將能夠: 了解NiFi的架構和數據流概念使用NiFi和第三方API開發擴展自定義開發自己的Apache Nifi處理器從不同和不常見的文件格式和數據源中獲取和處理實時數據 聽衆 開發商數據工程師 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
Apache Hadoop是處理大數據最流行的框架。 Hadoop提供豐富而深入的分析功能,並且正在進入傳統BI分析世界。本課程將向分析師介紹Hadoop生態系統的核心組件及其分析聽衆業務分析師持續時間三天格式講座和實驗室之手。
7 hours
Overview
Spark SQL是Apache Spark用于處理結構化和非結構化數據的模塊。 Spark SQL提供了關于數據結構以及正在執行的計算的信息。該信息可用于執行優化。 Spark SQL的兩個常見用途是: 執行SQL查詢。 從現有的Hive安裝中讀取數據。 在這個有指導意義的現場培訓(現場或遠程)中,參與者將學習如何使用Spark SQL分析各種類型的數據集。 在培訓結束後,參與者將能夠: 安裝並配置Spark SQL。 使用Spark SQL執行數據分析。 查詢不同格式的數據集。 可視化數據和查詢結果。 聽衆 數據分析師數據科學家數據工程師 課程的 格式 部分講座,部分討論,練習和沈重的練習 筆記 要請求本課程的定制培訓,請聯系我們安排。
14 hours
Overview
Apache Zeppelin是一款基于Web的筆記本,用于捕獲,探索,可視化和共享基于Hadoop和Spark的數據。 這種有指導性的實時培訓引入了交互式數據分析背後的概念,並讓參與者通過在單用戶或多用戶環境中部署和使用Zeppelin。 在培訓結束後,參與者將能夠: 安裝並配置Zeppelin 在基于浏覽器的界面中開發,組織,執行和共享數據在不參考命令行或群集細節的情況下可視化結果在長時間的工作流程上執行並協作可以使用許多插件語言/數據處理後端,例如Scala(使用Apache Spark),Python(使用Apache Spark),Spark SQL,JDBC,Markdown和Shell。 將Zeppelin與Spark,Flink和Map Reduce集成用Apache Shiro保護Zeppelin的多用戶實例 聽衆 數據工程師數據分析師數據科學家軟件開發商 課程的格式 部分講座,部分討論,練習和沈重的練習
14 hours
Overview
Vespa是由雅虎創建的開源大數據處理和服務引擎。它用于響應用戶查詢,提出建議,並實時提供個性化內容和廣告。 這種有指導意義的實時培訓引入了服務大型數據的挑戰,並通過創建可實時計算大型數據集中的用戶請求響應的應用程序來引導參與者。 在培訓結束後,參與者將能夠: 使用Vespa可以在用戶等待時在服務時間快速計算數據(存儲,搜索,排名,組織) 將Vespa實施到涉及功能搜索,建議和個性化的現有應用程序中將Vespa與現有的大數據系統(如Hadoop和Storm)集成並部署。 聽衆 開發商 課程的格式 部分講座,部分討論,練習和沈重的練習
14 hours
Overview
Tigon是一款開源,實時,低延遲,高吞吐量,本地YARN,位于HDFS和HBase之上的流處理框架,用于實現持久性。 Tigon應用程序可以解決網絡入侵檢測和分析,社交媒體市場分析,位置分析以及用戶實時推薦等使用案例。 這個有指導意義的現場培訓介紹了Tigon的混合實時和批處理的方法,因爲它會讓參與者通過創建示例應用程序。 在培訓結束後,參與者將能夠: 創建強大的流處理應用程序來處理大量數據流程流源,例如Twitter和Web服務器日志使用Tigon快速連接,過濾和聚合流 聽衆 開發商 課程的格式 部分講座,部分討論,練習和沈重的練習
21 hours
Overview
Teradata是流行的關系數據庫管理系統之一。它主要適用于構建大型數據倉庫應用程序。 Teradata通過並行性的概念實現了這一點。 本課程向Teradata介紹了代表
28 hours
Overview
Talend Open Studio for Data Integration是一款開源數據集成産品,用于整合,轉換和更新企業各個位置的數據。 在這個有指導意義的現場培訓中,參與者將學習如何使用Talend ETL工具進行數據轉換,數據提取以及與Hadoop,Hive和Pig的連接。 通過這次培訓的結束,參與者將能夠解釋ETL(提取,轉換,加載)和傳播背後的概念定義ETL方法和ETL工具以與Hadoop連接根據業務需求高效地積累,檢索,消化,消費,轉換和塑造大數據上傳並從Hadoop(可選),Hive(可選)和NoSQL數據庫提取大型記錄 聽衆 商業情報專家項目經理數據庫專家 SQL開發人員 ETL開發人員解決方案架構師數據架構師數據倉庫專業人員系統管理員和集成商 課程的格式 部分講座,部分討論,練習和沈重的練習 注意 要請求本課程的定制培訓,請聯系我們安排。

近期大數據培訓課程

大數據,培訓,課程,培訓課程, 企業大數據培訓, 短期大數據培訓, 大數據課程, 大數據周末培訓, 大數據晚上培訓, 大數據訓練, 學習大數據, 大數據老師, 學大數據班, 大數據遠程教育, 一對一大數據課程, 小組大數據課程, 大數據培訓師, 大數據輔導班, 大數據教程, 大數據私教, 大數據輔導, 大數據講師 Big Data,培訓,課程,培訓課程, 企業Big Data培訓, 短期Big Data培訓, Big Data課程, Big Data周末培訓, Big Data晚上培訓, Big Data訓練, 學習Big Data, Big Data老師, 學Big Data班, Big Data遠程教育, 一對一Big Data課程, 小組Big Data課程, Big Data培訓師, Big Data輔導班, Big Data教程, Big Data私教, Big Data輔導, Big Data講師

促銷課程

訂閱促銷課程

為尊重您的隱私,我公司不會把您的郵箱地址提供給任何人。您可以享有優先權和隨時取消訂閱的權利。

我們的客戶

is growing fast!

We are looking to expand our presence in Taiwan!

As a Business Development Manager you will:

  • expand business in Taiwan
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!