統治課程Presto:實踐學習

”“”

主導PRESTO:實踐學習

學習PRESTO -SQL查詢引擎分發到大數據!

課程概述

在這個全面的課程中,您將對PRESTO有深刻的了解,Presto是一種功能強大的分佈式SQL查詢引擎,旨在在各種尺寸的數據源中執行交互式分析查詢。無論是處理千兆字節還是數據的數據,商品都可以處理所有問題。從頭開始開發的側重於交互式分析,與商業數據倉庫的速度持續競爭對手,同時將尺寸降低到像Facebook這樣的組織級別。

課程內容

在課程的第一部分中,您將深入研究Presto背後的理論。您將了解您的體系結構和組件,包括協調員,工人,連接器和諮詢模型。此外,您還將深入了解諸如Kafka,Cassandra,Hive,PostgreSQL和RedShift之類的流行數據源,並了解它們與善良的整合。

該課程的第二部分致力於實踐練習。您將創建一個開發環境,並配有用於Hive和Presto的Docker Images,以及Presto所有基礎架構的掌舵圖表。然後,您將在本地的Kubernetes群集中部署此圖表。通過真實的世界示例,您將學習如何使用單個SQL查詢從PostgreSQL表中加入AWS S3上的Parquet文件。

掌握了本地特徵的執行和使用後,該課程將指導您在AWS帳戶的配置中,並在亞馬遜上託管的Kubernetes cluster(EKS)上實現群集Prestoes。這將使您可以大規模分析數據的數據甚至數據。

最後,該課程將概述市場上可用的各種託管和非管理服務。您將通過使您能夠做出明智的決定來了解每種服務的利弊。

您將學到什麼

  • 在AWS S3上諮詢PATQUET文件
  • 在AWS的Kubernetes群集中實現Presto
  • 在S3中將鑲木quet文件與來自PostgreSQL表的數據
  • 深入了解Presto的內部體系結構
  • 了解Cassandra,Kafka,Redshift,Hive和Postgresql
  • 使用Minikube在當地的Kubernetes群集中執行開發環境
  • 了解PRESTIVE設置
  • 探索服務提供商
  • 為Presto和Hive創建Docker圖像
  • 為Presto創建Helm圖
Scroll to Top