Confluent提供Apache Kafka资料永久留存服务

每日动态2021-02-12 16:02:35
最佳答案

Confluent宣布即将在自家云端平台加入新功能,在其Apache Kafka服务推出无限资料留存功能,现行Confluent所提供的Kafka单位(Confluent Unit for Kafka,CKU)具有资料储存限制,但在之后,无论是标準丛集和专用丛集,资料都将没有储存限制。在AWS上的Confluent Cloud服务可以在7月优先获得这项功能,其他云端平台还需要再等等。

Kafka是由LinkedIn开发,并于2011年开源释出的分散式串流平台,在2014年时,LinkedIn员工离职创立了Confluent,提供企业级的Kafka服务。Apache Kafka可统一、高吞吐量且低延迟地处理即时资料,因此被企业广泛地用来储存应用程式的事件资料。

Kafka丛集会储存自生产者(Producer)程式而来的资料,资料会被以不同的分割区和主题储存,需要资料的消费者(Consumer)程式,便可从丛集的分割区查询资料,Kafka可以在一台或是多台伺服器丛集上运作,而且分割区还能够分散在跨丛集节点上。

典型Kafka的设定是将资料留存数天到数周,但随着企业对于数位资料的需求,历史资料需要留存的时间也就越来越长。Confluent提到,由于现在数位体验对个人化的需求特别高,而企业为了要建构这些应用程式,需要以历史资料来预测即时事件,在考量庞大即时资料的储存成本以及使用複杂度,这对于现在的资料基础结构来说并不容易,事件资料通常在Kafka中保存7天,而这限制了事件串流资料的使用情境,没有足够久的历史资料,就无法进行逐年分析和预测性机器学习应用。

因此Confluent在其云端Kafka服务,提供新的资料无限留存功能来解决这个问题,使企业可以建立资料中枢系统,连结内部所有的系统、SaaS以及微服务等端点,将资料全部储存到中枢系统中,Kafka中的事件资料会成为其他系统的单一事实来源,具扩展能力同时还可确保资料的完整性。

Confluent提到,因为在Kafka中,运算和储存能力被紧密地绑在一起,所以难以在流量上升时灵活地扩展,因此就无法大量地留存资料,而Confluent Cloud新提供的无限留存功能,使运算和储存容量脱钩,还能自动进行扩展,储存可随流量上升而扩展。在没有储存限制的情况下,企业就能将历史事件串流资料,应用到更多的案例上。

Confluent Cloud隔离新旧资料的读取,当应用程式读取历史资料时,不会影响其他读取新资料的应用程式,让丛集中的即时和历史分析能够并存。

AWS上的Confluent Cloud用户在7月就可以开始使用资料无限留存功能,无限留存提供弹性可扩展的储存,Confluent提到,企业不用为预先配置的储存容量付费,仅就储存的资料量支付费用。使用其他云端服务供应商的Confluent Cloud用户,在今年稍晚时候也将能使用新功能。

免责声明:本文由用户上传,如有侵权请联系删除!