Hadoop培訓

Hadoop培訓

在線或現場、由講師指導的實時 Apache Hadoop 培訓課程通過交互式實踐演示 Hadoop 生態系統的核心組件以及如何使用這些技術來解決大規模問題。 Hadoop 培訓可作為“在線實時培訓”或“現場實時培訓”。在線實時培訓(又名“遠程實時培訓”)是通過交互式遠程桌面進行的。現場現場培訓可以在 台灣 中的客戶場所本地進行,也可以在 台灣 中的 NobleProg 公司培訓中心進行。 NobleProg——您當地的培訓提供商

Machine Translated

Apache Hadoop課程大綱

課程名稱
課程時長
概覽
課程名稱
課程時長
概覽
21小時
Python is a scalable, flexible, and widely used programming language for data science and machine learning. Spark is a data processing engine used in querying, analyzing, and transforming big data, while Hadoop is a software library framework for large-scale data storage and processing. This instructor-led, live training (online or onsite) is aimed at developers who wish to use and integrate Spark, Hadoop, and Python to process, analyze, and transform large and complex data sets. By the end of this training, participants will be able to:
  • Set up the necessary environment to start processing big data with Spark, Hadoop, and Python.
  • Understand the features, core components, and architecture of Spark and Hadoop.
  • Learn how to integrate Spark, Hadoop, and Python for big data processing.
  • Explore the tools in the Spark ecosystem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, and Flume).
  • Build collaborative filtering recommendation systems similar to Netflix, YouTube, Amazon, Spotify, and Google.
  • Use Apache Mahout to scale machine learning algorithms.
Format of the Course
  • Interactive lecture and discussion.
  • Lots of exercises and practice.
  • Hands-on implementation in a live-lab environment.
Course Customization Options
  • To request a customized training for this course, please contact us to arrange.
7小時
本課程介紹如何從Hive提取數據的人員使用Hive SQL語言(AKA: Hive HQL, Hive SQL , Hive QL)
14小時
Datameer是基于Hadoop構建的商業智能和分析平台。它允許最終用戶以易用的方式訪問,探索和關聯大規模,結構化,半結構化和非結構化數據。 在這個有指導意義的實時培訓中,參與者將學習如何使用Datameer來克服Hadoop陡峭的學習曲線,因爲他們將逐步完成對一系列大數據源的設置和分析。 在培訓結束後,參與者將能夠: 創建,策劃和交互式地探索企業數據湖訪問商業智能數據倉庫,交易數據庫和其他分析商店使用電子表格用戶界面設計端對端數據處理管道訪問預建功能來探索複雜的數據關系使用拖放式向導來可視化數據並創建儀表板使用表格,圖表,圖形和地圖來分析查詢結果 聽衆 數據分析師 課程的格式 部分講座,部分討論,練習和沈重的練習
7小時
Alluxio是一個開源虛擬分佈式存儲系統,它統一了不同的存儲系統,使應用程序能夠以內存速度與數據交互。它被英特爾,百度和阿里巴巴等公司使用。 在這個以講師為主導的現場培訓中,參與者將學習如何使用Alluxio將不同的計算框架與存儲系統聯繫起來,並在他們逐步創建Alluxio應用程序時有效管理多PB級數據。 在培訓結束時,參與者將能夠:
  • 使用Alluxio開發應用程序
  • 連接大數據系統和應用程序,同時保留一個名稱空間
  • 以任何存儲格式有效地從大數據中提取價值
  • 改善工作負載性能
  • 部署和管理Alluxio獨立或集群
聽眾
  • 數據科學家
  • 開發人員
  • 系統管理員
課程形式
  • 部分講座,部分討論,練習和繁重的實踐練習
35小時
聽眾: 本課程面向尋求在分佈式系統環境中存儲和處理大型數據集的解決方案的IT專家 Go : 深入了解Hadoop集群管理。
21小時

本課程面向開發人員,架構師,數據科學家或任何需要密集或定期訪問數據的配置文件。 該課程的主要重點是數據處理和轉換。 在Hadoop生態系統的工具中,本課程包括Pig和Hive的使用,這兩者都大量用於數據轉換和操作。 此培訓還涉及性能指標和性能優化。 該課程完全是實踐性的,並通過理論方面的介紹來打斷。
21小時
大數據分析涉及檢查大量不同數據集的過程,以便發現相關性,隱藏模式和其他有用的見解。 健康產業擁有大量複雜的異構醫學和臨床數據。對健康數據應用大數據分析在獲得改善醫療保健服務的見解方面具有巨大潛力。然而,這些數據集的巨大性給分析和臨床環境的實際應用帶來了巨大挑戰。 在這個以講師為主導的現場培訓(遠程)中,參與者將學習如何在健康狀況下進行大數據分析,因為他們將逐步進行一系列動手實踐練習。 在培訓結束時,參與者將能夠:
  • 安裝和配置大數據分析工具,如Hadoop MapReduce和Spark
  • 了解醫療數據的特徵
  • 應用大數據技術處理醫療數據
  • 在健康應用的背景下研究大數據系統和算法
聽眾
  • 開發商
  • 數據科學家
課程格式
  • 部分講座,部分討論,練習和繁重的實踐練習。
注意
  • 要申請本課程的定制培訓,請聯繫我們安排。
21小時
本課程專門面向尋求在分佈式系統環境中存儲和處理大型數據集的解決方案的IT專家課程目標: 獲取有關Hadoop集群管理的知識
21小時
Apache Hadoop是用於處理服務器群集上的Big Data的最流行的框架。在這三天(可選擇四天)課程中,與會者將了解Hadoop及其生態系統的業務優勢和用例,如何規劃群集部署和增長,如何安裝,維護,監控,排除故障和優化Hadoop 。他們還將練習集群批量數據加載,熟悉各種Hadoop發行版,並練習安裝和管理Hadoop生態系統工具。本課程結束時討論了使用Kerberos保護集群。 “......材料準備得很充分,並且要徹底覆蓋。該實驗室非常有幫助,組織良好“
- Andrew Nguyen,微軟在線Advertising首席集成DW工程師聽眾 Hadoop管理員格式講座和動手實驗,大約平衡60%的講座,40%的實驗室。
21小時
Apache Hadoop是處理大數據最流行的框架。 Hadoop提供豐富而深入的分析功能,並且正在進入傳統BI分析世界。本課程將向分析師介紹Hadoop生態系統的核心組件及其分析聽衆業務分析師持續時間三天格式講座和實驗室之手。
28小時
Apache Hadoop是用於處理服務器群集上的Big Data的最流行的框架。本課程將向開發人員介紹各種組件(HDFS,MapReduce,Pig, Hive和HBase)的Hadoop生態系統。
    21小時
    Apache Hadoop是用於處理服務器群集上的Big Data的最流行的框架之一。本課程深入研究HDFS,高級Pig, Hive和HBase中的數據管理。這些高級編程技術將有益於經驗豐富的Hadoop開發人員。 觀眾 :開發者 持續時間:三天 格式:講座(50%)和動手實驗室(50%)。
    21小時
    Hadoop是最受歡迎的大數據處理框架。
    14小時
    隨著越來越多的軟件和IT項目從本地處理和數據管理轉向分布式處理和大數據存儲,項目經理們正在意識到需要升級他們的知識和技能,以掌握與大數據項目和機會相關的概念和實踐。 本課程將向項目經理介紹當下最流行的大數據處理框架:Hadoop。   在這一由講師引導的培訓中,學員將學習Hadoop生態系統的核心組件,以及這些技術如何用于解決大規模問題。在學習這些基礎的過程中,學員還將提高他們與這些系統的開發人員和實施人員以及許多IT項目涉及的數據科學家和分析師溝通的能力。 受衆
    • 希望將Hadoop應用到其現有開發或IT基礎架構中的項目經理
    • 需要與包括大數據工程師、數據科學家和業務分析師在內的跨職能團隊進行溝通的項目經理
    課程形式
    • 部分講座、部分討論、練習和大量實操
    28小時
    聽眾: 本課程旨在揭開大數據/ hadoop技術的神秘面紗,並表明它不難理解。
    28小時
    Hadoop是一種流行的Big Data處理框架。 Python是一種高級編程語言,以其清晰的語法和代碼可讀性而聞名。 在這個以講師為主導的現場培訓中,參與者將學習如何使用Python來處理Hadoop ,MapReduce,Pig和Spark,因為他們會逐步完成多個示例和用例。 在培訓結束時,參與者將能夠:
    • 了解Hadoop ,MapReduce,Pig和Spark背後的基本概念
    • 將Python與Hadoop分佈式文件系統(HDFS),MapReduce,Pig和Spark結合使用
    • 使用Snakebite以編程方式訪問Python HDFS
    • 使用mrjob在Python編寫MapReduce作業
    • 用Python編寫Spark程序
    • 使用Python UDF擴展pig的功能
    • 使用Luigi管理MapReduce作業和Pig腳本
    聽眾
    • 開發商
    • IT專業人士
    課程形式
    • 部分講座,部分討論,練習和繁重的實踐練習
    35小時
    Apache Hadoop is a popular data processing framework for processing large data sets across many computers. This instructor-led, live training (online or onsite) is aimed at system administrators who wish to learn how to set up, deploy and manage Hadoop clusters within their organization. By the end of this training, participants will be able to:
    • Install and configure Apache Hadoop.
    • Understand the four major components in the Hadoop ecoystem: HDFS, MapReduce, YARN, and Hadoop Common.
    • Use Hadoop Distributed File System (HDFS) to scale a cluster to hundreds or thousands of nodes.  
    • Set up HDFS to operate as storage engine for on-premise Spark deployments.
    • Set up Spark to access alternative storage solutions such as Amazon S3 and NoSQL database systems such as Redis, Elasticsearch, Couchbase, Aerospike, etc.
    • Carry out administrative tasks such as provisioning, management, monitoring and securing an Apache Hadoop cluster.
    Format of the Course
    • Interactive lecture and discussion.
    • Lots of exercises and practice.
    • Hands-on implementation in a live-lab environment.
    Course Customization Options
    • To request a customized training for this course, please contact us to arrange.
    21小時
    本課程介紹HBase - 一個基於Hadoop的無SQL存儲。本課程面向將使用HBase開發應用程序的開發人員以及將管理HBase集群的管理員。 我們將通過HBase的HBase架構和數據建模以及應用程序開發向開發人員展示。它還將討論將MapReduce與HBase一起使用,以及與性能優化相關的一些管理主題。該課程非常實用,包含大量實驗練習。
    持續時間 :3天 受眾 :開發人員和管理員
    14小時
    受眾
    • 開發人員
    課程 的 格式
    • 講座, 動手實踐, 小測試的過程中, 以衡量理解
    21小時
    Apache NiFi (Hortonworks DataFlow)是一個實時集成的數據物流和簡單的事件處理平台,可以在系統之間移動,跟踪和自動化數據。它使用基於流的編程編寫,並提供基於Web的用戶界面,以實時管理數據流。 在這個由講師指導的現場培訓(現場或遠程)中,參與者將學習如何在實驗室環境中部署和管理Apache NiFi 。 在培訓結束時,參與者將能夠:
    • 安裝和配置Apachi NiFi。
    • 從不同的分佈式數據源(包括數據庫和大數據湖)獲取,轉換和管理數據。
    • 自動化數據流。
    • 啟用流式分析。
    • 應用各種方法進行數據攝取。
    • 將Big Data轉化為業務洞察力。
    課程格式
    • 互動講座和討論。
    • 大量的練習和練習。
    • 在實時實驗室環境中親自實施。
    課程自定義選項
    • 要申請本課程的定制培訓,請聯繫我們安排。
    7小時
    Apache NiFi (Hortonworks DataFlow)是一個實時集成的數據物流和簡單的事件處理平台,可以在系統之間移動,跟踪和自動化數據。它使用基於流的編程編寫,並提供基於Web的用戶界面,以實時管理數據流。 在這個以講師為主導的現場培訓中,參與者將學習基於流程的編程的基礎知識,因為他們使用Apache NiFi開發了許多演示擴展,組件和處理器。 在培訓結束時,參與者將能夠:
    • 了解NiFi的架構和數據流概念。
    • 使用NiFi和第三方API開發擴展。
    • 定制開發自己的Apache Nifi處理器。
    • 從不同的和不常見的文件格式和數據源中提取和處理實時數據。
    課程格式
    • 互動講座和討論。
    • 大量的練習和練習。
    • 在實時實驗室環境中親自實施。
    課程自定義選項
    • 要申請本課程的定制培訓,請聯繫我們安排。
    14小時
    Apache Samza是一個用於流處理的開源近實時異步計算框架。它使用Apache Kafka進行消息傳遞,使用Apache Kafka Hadoop YARN進行容錯,處理器隔離,安全性和資源管理。 這個由講師指導的實時培訓介紹了消息傳遞系統和分佈式流處理背後的原理,同時通過創建基於Samza的示例項目和作業執行來引導參與者。 在培訓結束時,參與者將能夠:
    • 使用Samza簡化生成和使用消息所需的代碼。
    • 解耦來自應用程序的消息處理。
    • 使用Samza實現近實時異步計算。
    • 使用流處理為消息傳遞系統提供更高級別的抽象。
    聽眾
    • 開發商
    課程形式
    • 部分講座,部分討論,練習和繁重的實踐練習
    14小時
    Sqoop是一個開源軟件工具,用於在Hadoop和關係數據庫或大型機之間傳輸數據。它可用於將數據從關係數據庫管理系統(RDBMS)(如My SQL或Oracle或大型機)導入Hadoop分佈式文件系統(HDFS)。此後,可以在Hadoop MapReduce中轉換數據,然後將其重新導出回RDBMS。 在這個由講師指導的實時培訓中,參與者將學習如何使用Sqoop將數據從傳統的關係數據庫導入Hadoop存儲,如HDFS或Hive ,反之亦然。 在培訓結束時,參與者將能夠:
    • 安裝並配置Sqoop
    • 將數據從My SQL導入HDFS和Hive
    • 將數據從HDFS和Hive導入My SQL
    聽眾
    • 系統管理員
    • 數據工程師
    課程 格式
    • 部分講座,部分討論,練習和繁重的實踐練習
    注意
    • 要申請本課程的定制培訓,請聯繫我們安排。
    14小時
    Tigon是一款開源,實時,低延遲,高吞吐量,本地YARN,位于HDFS和HBase之上的流處理框架,用于實現持久性。 Tigon應用程序可以解決網絡入侵檢測和分析,社交媒體市場分析,位置分析以及用戶實時推薦等使用案例。 這個有指導意義的現場培訓介紹了Tigon的混合實時和批處理的方法,因爲它會讓參與者通過創建示例應用程序。 在培訓結束後,參與者將能夠: 創建強大的流處理應用程序來處理大量數據流程流源,例如Twitter和Web服務器日志使用Tigon快速連接,過濾和聚合流 聽衆 開發商 課程的格式 部分講座,部分討論,練習和沈重的練習
    21小時
    Cloudera Impala 是一個用於 Apache Hadoop 集群的開源大規模並行處理 (MPP) SQL 查詢引擎。 Impala 使用戶能夠 對存儲在 Hadoop 分散式文件系統 和 Apache Hbase 中的數據發出低延遲 SQL 查詢,而無需數據移動或轉換。 觀眾 本課程面向分析師和數據科學家,通過 商業智慧或SQL工具對 存儲在Hadoop中的數據進行分析。 完成本課程后,代表們將能夠
      使用 Impala 從 Hadoop 集群中提取有意義的資訊。 編寫特定的程式,以促進斑羚SQL方言的商業智慧。 排查黑斑羚問題。
    21小時
    Apache Ambari是一個開源管理平台,用於配置,管理,監控和保護Apache Hadoop集群。 在這個由講師指導的實時培訓中,參與者將學習Ambari提供的管理工具和實踐,以成功管理Hadoop集群。 在培訓結束時,參與者將能夠:
    • 使用Ambari設置實時Big Data集群
    • 將Ambari的高級功能和功能應用於各種用例
    • 根據需要無縫添加和刪除節點
    • 通過調整和調整來改善Hadoop集群的性能
    聽眾
    • DevOps
    • 系統管理員
    • 數據庫管理員
    • Hadoop測試專業人士
    課程形式
    • 部分講座,部分討論,練習和繁重的實踐練習
    21小時
    Hortonworks Data Platform (HDP)是一個開源的Apache Hadoop支持平台,為在Apache Hadoop生態系統上開發大數據解決方案提供了穩定的基礎。 這個由講師指導的現場培訓(現場或遠程)介紹了Hortonworks Data Platform (HDP)並引導參與者完成Spark + Hadoop解決方案的部署。 在培訓結束時,參與者將能夠:
    • 使用Hortonworks可以大規模可靠地運行Hadoop 。
    • 使用Spark的敏捷分析工作流統一Hadoop的安全性,治理和運營功能。
    • 使用Hortonworks調查,驗證,認證和支持Spark項目中的每個組件。
    • 處理不同類型的數據,包括結構化,非結構化,動態和靜止。
    課程格式
    • 互動講座和討論。
    • 大量的練習和練習。
    • 在實時實驗室環境中親自實施。
    課程自定義選項
    • 要申請本課程的定制培訓,請聯繫我們安排。

    Last Updated:

    Hadoop,培訓,課程,培訓課程, 企業Hadoop培訓, 短期Apache Hadoop培訓, Apache Hadoop課程, Apache Hadoop周末培訓, Hadoop晚上培訓, Hadoop訓練, 學習Hadoop, Apache Hadoop老師, 學Apache Hadoop班, Hadoop遠程教育, 一對一Apache Hadoop課程, 小組Apache Hadoop課程, Apache Hadoop培訓師, Hadoop輔導班, Apache Hadoop教程, Hadoop私教, Hadoop輔導, Hadoop講師

    Course Discounts

    No course discounts for now.

    訂閱促銷課程

    為尊重您的隱私,我公司不會把您的郵箱地址提供給任何人。您可以享有優先權和隨時取消訂閱的權利。

    Some of our clients

    is growing fast!

    We are looking to expand our presence in Taiwan!

    As a Business Development Manager you will:

    • expand business in Taiwan
    • recruit local talent (sales, agents, trainers, consultants)
    • recruit local trainers and consultants

    We offer:

    • Artificial Intelligence and Big Data systems to support your local operation
    • high-tech automation
    • continuously upgraded course catalogue and content
    • good fun in international team

    If you are interested in running a high-tech, high-quality training and consulting business.

    Apply now!

    This site in other countries/regions