首页>动态 >内容

微软正式推出视觉化资料流处理服务Mapping Data Flows

动态2021-02-19 20:05:01
最佳答案

微软在自家无程式码ETL服务Azure Data Factory上,正式推出Mapping Data Flows功能,供使用者大规模且快速地转换资料,微软提到,Mapping Data Flows是一项变革性的资料整合以及转换服务。

Azure Data Factory是一个无伺服器服务,使用者不需要管理基础设施,就能够在云端进行ETL工作,处理任何规模的资料。而Mapping Data Flows则是专为应对庞大资料处理的複杂性和规模而生的功能,使用者可以直接在浏览器中,存取视觉化的环境,建构弹性资料工作管线,并由Azure Data Factory来处理Spark运作的複杂作业。

Mapping Data Flows提供内建功能来处理不可预测的资料架构后,并维持变更输入资料的弹性,简化使用者资料处理的工作,让使用者可以专注于建构业务资料逻辑,不需要花费时间管理伺服器丛集或是撰写程式码,快速地进行载入事实表格(Fact Table)、维持缓慢的维度变换(Slowly Changing Dimension,SCD)、聚合半结构化的资料,以及使用模糊匹配来配对资料,为建模做準备。

其提供直觉的视觉化介面,可以将使用者的资料逻辑转换成为易读的图(Graph),并建置转换程式函式库,分析原始资料产出业务可用的结果(下图)。当然,使用者也可以不使用Mapping Data Flows的无程式码介面,自己撰写程式码呼叫内建的转换功能,执行连接(Join)、聚合、枢纽分析(Pivot)以及排序等常见操作。

工作管线建置器可让使用者透过滑鼠拖拉操作,来建置工作管线,或是以互动的形式为端到端ETL程序除错,使用者可以为工作管线建置排程,并从Azure Data Factory监控入口网站监控资料流执行,透过Azure Data Factory提供多种可用性监控以及警示功能,来管理资料的可用SLA,还能利用内建的CI/CD,在託管的DataOps环境中储存与管理资料流,透过建立警示和浏览执行计画,就能验证使用者的逻辑是否如计画一样处理资料流。

免责声明:本文由用户上传,如有侵权请联系删除!