1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          TDH中的Transporter

          來源:互聯網轉載 時間:2023-09-05 03:49:42

          本文主要介紹Transwarp的etl工具——Transporter,本文依托于星環的官方文檔,通過一個簡單的實例來讓大家熟悉Transporter的使用。關注專欄《Transwarp系列》了解更多Transwarp的技術知識~


          目錄

          一、Transporter簡介

          1.1?簡介

          1.2?Transporter的特點

          二、Transporter實例

          2.1?案例一

          2.1.1?業務需求

          2.1.2?業務實現

          2.2?案例二

          2.2.1?業務需求

          2.2.2?業務實現


          一、Transporter簡介

          1.1?簡介

          Transporter是一個數據etl工具,支持從不同數據源獲取數據,對數據的復雜轉換操作,并最終將數據落地成不同格式。Transporter左側連接數據源,如關系型數據庫,右側連接目標系統,如Inceptor。支持用戶將數據從RDBMS遷移到Hadoop,再進行數據分析和挖掘工作。

          1.2?Transporter的特點

          1、支持豐富的數據源

          Transporter支持跨集群的數據導入,并且可直接從Oracle/DB2等傳統關系數據庫將數據導入至TDH,同Sqoop相比,可以在不失效率的情況下簡化繁瑣的數據流定義步驟以及復雜的類型轉換等問題。支持導入CSV、定長文件、JSON、XML等文件。同時支持導入OGG、Shareplex、DataStage產生的增量文件,實現準實時的數據同步。此外,還支持通過Kafka等方式讀入流數據。

          2、支持豐富的導出格式

          用戶可以通過Transporter直接導出數據至傳統關系數據庫、ElasticSearch,以及實現跨集群導出。Transporter支持多種數據導出格式,如CSV、JSON、XML,并且支持Inceptor中所有類型的表:普通ORC、ORC交易表、Holodesk、Hbase、Hyperdrive。

          3、支持多種數據轉換操作

          提供多種常見的數據轉換操作,幫助實現數據的清洗,加工。其中的關鍵操作有:字段映射功能、數據關聯、集合操作、聚合操作、過濾、去重。

          4、輕量的應用

          采用Web交互的方式,實現數據流的設計。Transporter只是用于數據流設計和調度工作流的服務平臺,本身不包含執行引擎,不負責任務實現,而是將工作任務提交到Inceptor或者其他計算引擎來完成,因此是極為輕量的應用。

          5、高度并發

          利用分布式集群進行數據流的并行計算,自動分析數據流依賴,實現數據流作業中最大可能的并行化。

          6、高吞吐

          擅長大數據量的同步,峰值數據吞吐率可達到40M/秒/節點。

          7、數據質量和安全保障

          提供事務級別的數據同步,確保目標表與原表擁有相同的數據一致性。另外還提供了完整的權限控制機制,用于保證數據的安全。

          二、Transporter實例

          2.1?案例一

          2.1.1?業務需求

          現在有兩份人員名單,需要將其合并后寫入Inceptor。?

          ?

          2.1.2?業務實現

          1、為了方便測試,首先將兩份數據上傳到hdfs的目錄下,如下所示 :

          2、新建數據流,進入設計模式。

          3、選擇并拖出CSVReader模塊并修改Reader參數。

          同樣的方法將two.csv文件讀進來,如下:

          4、選中轉換模塊中的union模塊,并連接數據源模塊與union模塊。

          5、拖出TextWriter,并連接轉換模塊與目標模塊

          6、修改TextWriter的參數

          7、完成后,點擊右上角的保存按鈕進行保存,并進入調試模式。

          如果調試沒有問題,此處所有組件圖表均為綠色。

          查詢數據庫中的數據可以發現數據已經入庫到對應的表中:

          8、調試無誤后點擊下面的圖表進行發布。

          2.2?案例二

          2.2.1?業務需求

          查詢得到年齡大于24歲的人員名單并將數據導出到csv文件。

          2.2.2?業務實現

          1、同樣的,新建數據源

          2、選擇CSVWriter模塊并修改參數,如下:

          3、選擇過濾模塊并編輯參數

          4、選擇CSVWriter目標模塊并編輯參數

          5、保存并調試,發現數據已經導出到對應的目錄中

          ?

          以上就是本文的所有內容了,通過兩個簡單的實例,大家一定對Transporter有了一個初步的認識,本文到此已經接近尾聲了,你們在此過程中遇到了什么問題,歡迎留言,讓我看看你們都遇到了哪些問題~

          網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...

          在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...

          在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...

          北京國家會議中心在什么地方?公交路線:地鐵4號線大興線地鐵2號線地鐵8號線,全程約23.4公里。1.從公益西橋乘坐地鐵4號線大興線,經過6站到達宣武門站。2.乘坐地鐵2號線,經過7站,到達鼓樓街站。3.乘坐地鐵8號線,經過4站,到達奧林匹克公園站(E出口)。4.步行約440米至國家會議中心。北京國家會議中心在什么地方?我想參加CP05伴侶節…但是不知道國家會議中心在哪里?地鐵可以直達嗎?我住的地方...

          psp如龍有沒有漢化的?possp上的兩個模特像龍。比如龍1新篇章和龍2阿修羅篇章,這兩個游戲之前都是有人填的,然后一直沒有消息,應該是沒有消息,就像多多的軌跡也是有人挖的,但是這個游戲目前還是沒有中文版,可以去攻略游戲對抗攻略。畢竟,在過去的PS1和PS2時代,很少有游戲。更不用說FC時代了。如龍有幾個版本?如龍系列抵得上七部以一馬Kiryu為主角的如龍作品。即如龍1.2.3.4.5.0.6?!?..

          writer和writing的區別?write的進行時態是:writing。根據變化規律,以無聲字母E結尾的動詞刪去E,加上ing。分析:write的結尾是e。當你改變現在進行時,你需要去掉e的結尾。同樣,make to making和use changes to using。我正在寫一本關于我童年的書。是關于一個男孩和他祖父之間的友誼。請問write的進行時態到底是writing還是writti...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>