帶有Scala和Spark的可擴展編程課程

”“”

使用Scala和Spark

可擴展的編程

<

h2>學習如何使用Scala和Spark進行數據分析,機器學習和分析

評估:4.0 of 5451評論

總小時:9

類:55

難度級別:所有級別

由一支由四個專家組成的團隊教授,其中包括在斯坦福大學接受過培訓的兩名專業人士和一家著名公司的兩名前領導人。該團隊在Java編程和對大眾集合的操縱方面具有豐富的實踐經驗。

發現Spark和Scala的力量,以進行分析,機器學習和數據科學。借助Spark,您可以通過單個機制合併數據分析任務,使您可以探索大型數據集,執行機器學習算法並實現從代碼到生產的完美過渡。

Scala是一種類似於Java和C ++的多功能編程語言,特別適合分佈式計算結構,例如Spark,其功能性編程性質和REPP環境。

通過利用Spark和Scala,您可以在快速反饋的交互式環境中分析和探索數據。本課程將教您如何使用RDD和DataFrames輕鬆操縱數據。

此外,您將學習使用替代最小值和AudiosCrobbler數據集實現複雜的算法,例如音樂推薦。您還將獲得使用DataFrames和Spark SQL的Twitter數據的實用經驗,並將Pagerank算法與Google Web Graph數據集一起使用。此外,您還將使用Spark流媒體探索流量處理,並使用Marvel社交網絡數據集使用圖表數據。

在整個課程中,您將解決Spark的基本和高級資源,包括有彈性的分佈式數據集,轉換(地圖,過濾器,Flatmap),動作(減少,匯總),對數據庫,降低bykey,bombinebykey,bombinebykey ,廣播變量和累加器,用於MAPREDREDUCE的Spark ,用於火花的Java API,Spark SQL,Spark Streaming,Mllib和GraphX。

在本課程結束時,您將購買在各種機器分析和學習任務中使用SPARK的技能。您還將對功能規模編程建築物以及實施複雜算法(例如Pagerank或音樂推薦)的能力有牢固的了解。此外,您將熟練使用從航空公司延遲到Twitter,網絡圖,社交網絡和產品評分的各種數據集。最後,您將能夠在Scala回复環境中編寫代碼,並使用IDE構建Scala應用程序。

Scroll to Top