雲數據遷移CDM,有效降低數據源遷移複雜(zá)性
發布時間:2024-03-28
華爲雲數據遷移(Cloud Data Migration,簡稱CDM)是一(yī)種高效、易用的批量數據遷移服務,提供同構/異構數據源之間批量數據遷移服務,幫助客戶實現數據自由流動。支持客戶自建和公有雲上的文件系統、關系數據庫、數據倉庫、大(dà)數據雲服務、對象存儲等數據源。
在數據治理中(zhōng)心(DataArts Studio)服務中(zhōng),CDM作爲其中(zhōng)的“數據集成”組件使用,産品能力與獨立的CDM服務保持一(yī)緻。CDM服務基于分(fēn)布式計算框架,利用并行化處理技術,支持用戶穩定高效地對海量數據進行移動,實現不停服數據遷移,快速構建所需的數據架構。

産品功能

1.表/文件/整庫遷移

支持批量遷移表或者文件,支持同構/異構數據庫之間的整庫遷移,一(yī)個作業即可遷移幾百張。

2.增量數據遷移

支持文件增量遷移、關系型數據庫增量遷移、HBase/CloudTable增量遷移,以及使用Where條件配合時間變量函數實現增量數據遷移。

3.事務模式遷移

支持當CDM作業執行失敗時,将數據回滾到作業開(kāi)始之前的狀态,自動清理目的表中(zhōng)的數據。

4.字段轉化

支持去(qù)隐私、字符串操作、日期操作等常用字段的數據轉換功能。

5.文件加密
在遷移文件到文件系統時,CDM支持對寫入雲端的文件進行加密。
6.MD5校檢一(yī)緻性
支持使用MD5校驗,檢查端到端文件的一(yī)緻性,并輸出校驗結果。
7.髒數據歸檔
支持将遷移過程中(zhōng)處理失敗的、被清洗過濾掉的、不符合字段轉換或者不符合清洗規則的數據單獨歸檔到髒數據日志(zhì)中(zhōng),便于用戶查看。并支持設置髒數據比例阈值,來決定任務是否成功。
8.正則表達式分(fēn)隔半結構化文本
支持在創建表/文件遷移作業時,對簡單CSV格式的文件,可以使用字段分(fēn)隔符進行字段分(fēn)隔。
 
産品優勢
1.支持多種數據源批量入湖
滿足近20種常用數據源,滿足數據在雲上和雲下(xià)的不同遷移場景。
2.遷移效率高
基于分(fēn)布式計算框架進行數據任務執行和數據傳輸優化,并針對特定數據源寫入做了專項優化,遷移效率高。
3.簡單易用

免編程,向導式任務開(kāi)發界面,通過簡單配置幾分(fēn)鍾即可完成遷移任務開(kāi)發。

4.成本低

按需付費(fèi),根據使用資(zī)源量進行計費(fèi),無須自建專用軟硬件。

5.實時監控

通過雲監控服務實時監控CDM集群的各項性能指标。

 

應用場景

1.大(dà)數據遷移上雲

本地數據是指存儲在用戶自建和租用的IDC中(zhōng)的數據,或者第三方雲環境中(zhōng)的數據,包括關系型數據庫、文件系統等。
用戶使用大(dà)數據雲服務的彈性和按需能力作爲線下(xià)自建大(dà)數據平台的替代或備用,數據量大(dà),全量遷移。

大(dà)數據遷移上雲向導式任務管理,即開(kāi)即用,輕松上手。

大(dà)數據遷移上雲

2.數據批量入湖

數據批量入湖,支持用戶本地數據全量和T+1增量入湖。支持關系型數據庫、大(dà)數據、文件、NoSQL多種數據源。能夠通過遷移作業的where條件配合調度系統實現增量同步,基于數據源特點采取并發拆分(fēn)增強遷移性能。

數據批量入湖