首页 >动态 > 内容

Google更新多项资料分析功能释出云端多来源资料融合服务

动态 2021-02-23 16:07:11

Google发布了一系列云端资料服务更新,强化了既有产品BigQuery以及Dataflow,还发布了云端资料融合(Cloud Data Fusion),更新範围涵盖企业整个资料工作管线,从资料整理到资料治理。

针对资料彙整推出的Cloud Data Fusion服务,是一个完全託管的原生云端资料整合服务,内建广泛的开源转换函式库,以及超过一百种的开箱即用连接器,能够适用于各种系统和资料格式。Cloud Data Fusion可以撷取、整合各种资料来源,供BigQuery后续分析之用。而Data Fusion的控制中心可以让企业在单一位置,探索和管理所有资料集和资料工作管线,该控制平台提供简易的操作,使用者不须要撰写程式。

针对串流和批次资料处理服务Dataflow,Google推出了Cloud Dataflow SQL以及Dataflow FlexRS,让使用者在资料工作管线中使用SQL,也让工作调度更加灵活。Google表示,资料分析师对资料工作管线进行分析,建立资料工作管线则必须要依靠资料工程师,而Cloud Dataflow SQL让资料分析师可以直接使用熟悉的SQL语法,建构Dataflow工作管线。

Dataflow SQL使用的SQL语法与BigQuery相同,而这让资料分析师可以在BigQuery的使用者介面中使用Dataflow SQL进行资料分析。另外,Google还发布了Dataflow Flexible Resource Scheduling(FlexRS),让使用者能够设置隔夜作业、批次处理等调度安排,方便企业使用先占式服务。

Google也对分析资料仓储BigQuery进行多项更新,除了之前发布的资料仓储搬迁服务,在去年NEXT大会释出的BigQuery ML,Google也宣布即将释出正式版,最新版本增加不少新的模型支援与更多元的案例,还能直接输入TensorFlow模型使用。

BigQuery现在拥有BI Engine,能快速地执行记忆体分析服务,让企业以次秒级的查询回应时间,以高并行的方式分析複杂资料集。使用者可以透过Data Studio使用互动报告以及仪表板,Google预告,在几个月内,将也能在Looker以及Tableau工具上使用。

而为了要简化BigQuery的使用障碍,Google推出了连接试算表(Connected Sheets),使用者可以使用Google试算表熟悉的介面,但是获得BigQuery的分析能力,连结BigQuery完整的资料集使用,无论是数百万还是数十亿行资料都没问题,不需要SQL语法,就能进行资料分析。

为了要帮助企业管理数位资产,Google推出了Data Catalog服务,使用与Gmail和Drive相同的搜寻技术,提供简单的资料探索搜寻介面,也提供了灵活且功能强大的编目系统,以捕捉技术和商业元资料,并与Cloud DLP整合,能够发现且编列敏感资料资产,也提供以Cloud IAM简化存取控制。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。