現實世界流浪課程 – 建立一個Apache Spark開發環境!

為Apache Spark創建高性能開發環境!

學習如何在短短幾分鐘內創建功能齊全的Apache Spark開發環境!

只需一個簡單的命令,您就可以輕鬆地為Scala和Spark創建一個集成的開發環境(IDE)(1.6.2或2.0.1)。體驗設置自己的2.3GB自定義流浪漢盒的便利,專門為火花開發而設計。

您不再需要經歷設置Windows機器來使用Spark的不適。我們的全面解決方案使您可以在不到3分鐘的時間內初始化完整的Apache Spark環境!

本課程基於Toyin Akin的著名“現實世界流浪者分發計算”課程。我們享受您的經驗並擴展,以提供更簡化和有效的學習經驗。

當您參加此課程時,您將能夠安裝任何版本的火花。儘管我們專注於1.6.2或2.0.1,但您會發現很容易適應這裡教授的技術以適應新版本。

為什麼要火花?

Apache Spark是一種功能強大的工具,可以在內存中執行時運行的程序比Hadoop MapReduce快100倍,或在磁盤上快10倍。它的高級DAG執行機制支持記憶中的循環數據流和計算,使其成為高性能計算任務的理想選擇。擁有80多個高級運營商,並行應用的構建變得非常容易。此外,您可以從Shells Scala,Python和R進行交互式使用Spark。您的多功能性使您可以完美地組合SQL,流和復雜分析。

此外,Apache Spark還提供了各種庫,包括SQL和DataFrames,用於機器學習的MLLIB,GraphX和Spark流。掌握Spark時,您將能夠利用這些庫並創建可以處理各種數據處理任務的功能強大的應用程序。

您將學到什麼:

  • 輕鬆使用單個命令配置分佈式環境以進行集群部署
  • 自動在各種虛擬機上安裝軟件
  • 深入了解Apache Spark及其各種組件
  • 開發技能以使用強大的火花庫,包括SQL和DataFrames,Mllib,GraphX和Spark流媒體

    不要錯過這一機會提高您的開發技能並精通Apache Spark。立即訂閱並解鎖這種最先進的技術的潛力!”

Scroll to Top