开源资料湖专案Delta Lake将交由Linux基金会管理
由Apache Spark技术团队所创立的资料科学公司Databricks宣布,旗下的Delta Lake将由Linux基金会託管,致力成为资料湖泊的开放标準,而原本採用的的Apache 2.0授权许可将不会改变。
Delta Lake是一个资料湖的储存层,简化企业资料工程架构的複杂性,其提供ACID交易、可扩展的元资料处理等功能,以及统一了串流和批次资料处理等功能,该专案的目的,便是要解决资料湖常出现的问题。
Databricks提到,资料湖的使用,常会因为不完整的资料撷取,而造成资料损坏,而Delta Lake的ACID交易功能,则可以在多重资料串流中并行读取和写入资料湖,防止资料损坏问题发生,另外,资料湖的资料来源,可能无法提供完整的栏位资料或是正确的资料类型,而Delta Lake的强制结构(Schema Enforcement)功能,可以防止坏资料毁损其他资料。
由于开放性和可扩展性是Data Lake重要的设计原则,透过开放协定设计,并使用既存JSON和Apache Parquet等开放格式,将所有资料和元资料储存在云端物件储存上,而这种开放性让使用者的资料得以不被特定供应商锁住,且对于建构资料科学、机器学习和SQL等生态系统,也极为重要。
Databricks在4月的时候开源了Delta Lake,现在已经受到了广泛的使用,而为了进一步扩大社群,Databricks因此决定与Linux基金会合作,透过Linux基金会的影响力来发展开源专案。Databricks也与阿里巴巴、Booz Allen Hamilton、英特尔和Starburst合作,让Delta Lake不仅能支援Apache Spark,还能同时支援Apache Hive、Apache Nifi和Presto。
接下来Delta Lake会採取开放治理的模型,鼓励社群参与和贡献技术,藉由长期管理框架,建立Delta Lake社群生态系,并开发资料湖中资料储存的开放标準,以确保储存在Delta Lake的资料,保持开放性与可存取性。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
最新文章
- 今日消息 亚马逊直播“带不动货”
- 今日消息 问天实验舱与火箭组合体转运至发射区 发射前准备进入“最后一公里”
- 今日消息 《Apex 英雄》官方发布虚拟偶像 三位英雄率先登场
- 今日消息 瑞典服装零售商H&M将退出俄罗斯市场 相关成本预计1.9亿美元
- 今日消息 华为Mate 50正面照曝光:采用直屏
- 今日消息 宇宙透镜的“光芒”:哈勃捕捉到一个具有引力透镜现象的星系
- 今日消息 Redmi K50i真机照曝光:屏幕材质为LCD
- 今日消息 机构:今年TikTok美国广告收入将达59.6亿美元 是去年的2.8倍
- 今日消息 吉利旗下总投资超80亿元的武汉路特斯全球智能工厂竣工
- 今日消息 大众丰田正与台积电合作 大众CEO已同台积电高管会面
- 今日消息 红旗纯电H5曝光:搭载一汽自主研发的111kWh多合一CTP动力电池总成
- 今日消息 苹果iPhone 14 Plus受面板供应链影响 生产进度落后
- 今日消息 座椅加热一月120元!硬件付费订阅引热议 宝马回应
- 今日消息 小米专利可对虚拟角色进行基因繁殖 引入区块链技术
- 今日消息 当富士康工人成为网红:一边拧螺丝 一边拍下流水线百态人生
- 今日消息 小米正评估在意大利遭罚款原因 恒指上涨拉动小米股价
- 今日消息 英国外卖平台Deliveroo大幅下调今年增长预期
- 今日消息 价格翻倍、门票“掉包”,摩天轮票务成官方黄牛?
- 今日消息 亚马逊《辐射》真人剧片场图像曝光 或以《辐射3》为原型
- 今日消息 又见商标纠纷:多家“猴头菇”饼干厂被诉侵权
- 在葡萄酒产区的中心拥有一片天堂
- 百老汇的豪华酒店以约2000万美元的价格出售
- 为什么滨水商业物业受到租户和买家的高度重视
- 今日消息 大众汽车等公司投资的 Northvolt 开发出 2170 型圆柱电池