跳至內容

ApacheBeam

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

Apache Beam是一个開源統一編程模型,用佇定義佮執行資料處理管道,包括講 ETL、批次處理佮流(連紲)處理。Beam 管線是使用提供的 SDK 之一定義的,並佇咧 Beam 支援的一个執行器(散分式處理後端)中執行,包括講 Apache Apex、Apache Flink、Apache Gearpump(孵出來)、 Apache Samza、Apache Spark 和 Google Cloud Dataflow。

伊予人叫做「大數據的有夠 API」。

歷史

Apache Beam 是資料流模型檔案的一種實現。資料流模型因為較早有關於 Google 彼號分散式處理抽象的工課,特別是 FlumeJava 和 Millwheel。

Google 佇二空一四年釋出了資料流模型的開放式 SDK,猶閣有佇咧本地(非分散式)和 Google 雲平台服務中執行資料流的環境。

二空一六年,Google 向 Apache 軟體基金會捐贈核心 SDK 猶閣有本地執行程式的實現,猶閣有用存取 Google 雲平台資料服務的一組 IO(資料連接器)。 其他公司和社群成員為這馬的分散式執行平台提供了執行器,閣有新的將 Beam Runners 佮這馬有資料庫、維值儲存佮訊息系統整合的 IO。此外,閣提出新的 DSL,來共支援 Beam 模型之上的特定領域需求。

時間線

參見

  • Apache 軟體基金會的專案列表

參考文獻