重磅:Kafka迎来1.
0.
0版本,正式告别四位数版本号!
Kafka从首次发布之日起,已经走过了七个年头.
从最开始的大规模消息系统,发展成为功能完善的分布式流式处理平台,用于发布和订阅、存储及实时地处理大规模流数据.
来自世界各地的数千家公司在使用Kafka,包括三分之一的500强公司.
Kafka以稳健的步伐向前迈进,首先加入了复制功能和无边界的键值数据存储,接着推出了用于集成外部存储系统的ConnectAPI,后又推出了为实时应用和事件驱动应用提供原生流式处理能力的StreamsAPI,并于今年春季开始支持仅一次处理语义.
如此广泛的应用和完备的功能以及如此悠久的历史,无一不在说明Kafka已经成为一款稳定的企业级产品.
而更为激动人心的是,Kafka现在正式迎来了1.
0.
0版本!
Kafka1.
0.
0主要更新0.
10.
0版本里开始引入的StreamsAPI在1.
0.
0版本里继续演进,改进了builderAPI(KIP-120),新增了用于查看运行时活跃任务的API(KIP-130)和用于聚合分区的cogroupAPI(KIP-150).
增强的print()和writeAsText()方法让调试变得更容易(KIP-160).
其他更多信息可以参考Streams文档.
改进了Connect的度量指标(KIP-196),新增了大量用于健康监测的度量指标(KIP-188),并提供了集群的GloabalTopicCount和GlobalPartitionCount度量指标(KIP-168).
支持Java9,实现更快的TLS和CRC32C,加快了加密速度,降低了计算开销.
调整了SASL认证模块的错误处理逻辑(KIP-152),原先的认证错误信息现在被清晰地记录到日志当中.
更好地支持磁盘容错(KIP-112),更优雅地处理磁盘错误,单个JBOD上的磁盘错误不会导致整个集群崩溃.
0.
11.
0版本中引入的幂等性生产者需要将max.
in.
flight.
requests.
per.
connection参数设置为1,这对吞吐量造成了一定的限制.
而在1.
0.
0版本里,这个参数最大可以被设置为5(KAFKA-5949),极大提升了吞吐量范围.
1/3如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoopApacheKafka1.
0.
0RELEASENOTES下载ApacheKafka1.
0.
0崛起的KafkaKafka起初是由LinkedIn公司开发的一个分布式的消息系统,后成为Apache的一部分,它使用Scala编写,以可水平扩展和高吞吐率而被广泛使用.
目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、Spark等都支持与Kafka集成.
随着微服务的流行,很多公司都在尝试将现有的系统进行架构升级.
促成Movio公司架构改造的一项关键技术就是Kafka消息队列.
Kafka作为分布式消息队列,在可靠性和可扩展性方面有非常大的优势.
它不仅成为了Movio公司基础架构的关键组成部分,还为正在创建的系统架构提供了依据.
Kafka全面解析Kafka数据可靠性深度解读Kafka作为一个商业级消息中间件,消息可靠性的重要性可想而知.
如何确保消息的精确传输如何确保消息的准确存储如何确保消息的正确消费这些都是需要考虑的问题.
唯品会消息中间件团队首先从Kafka的架构着手,解释了Kafka的基本原理,然后通过对kakfa的存储机制、复制原理、同步原理、可靠性和持久性保证等等一步步对其可靠性进行分析,最后2/3通过benchmark来增强对Kafka高可靠性的认知.
KafkaStream设计详解本文介绍了KafkaStream的背景,如KafkaStream是什么,什么是流式计算,以及为什么要有KafkaStream.
接着介绍了KafkaStream的整体架构、并行模型、状态存储以及主要的两种数据集KStream和KTable.
然后分析了KafkaStream如何解决流式系统中的关键问题,如时间定义、窗口操作、Join操作、聚合操作,以及如何处理乱序和提供容错能力.
最后结合示例讲解了如何使用KafkaStream.
Kafka不只是个消息系统Confluent联合创始人兼CEOJayKreps发表了一篇博文,指出了Kafka的真正定位——它不只是个消息系统,它还是个存储系统,而它的终极目标是要让流式处理成为现代企业的主流开发范式.
人们更多的是把Kafka当成了消息队列系统.
消息队列有一些不成文的规则,比如"不要在消息队列里保存消息".
传统的消息系统在设计上存在很多不足.
从根本上讲,任何一个异步消息系统都会保存消息,只是时间很短,有时候只有几秒钟,直到消息被消费为止.
实际上,Kafka并非传统意义上的消息队列,它与RabbitMQ等消息系统并不一样.
它更像是一个分布式的文件系统或数据库.
Kafka与传统消息系统之间有三个关键区别.
Kafka持久化日志,这些日志可以被重复读取和无限期保留Kafka是一个分布式系统:它以集群的方式运行,可以灵活伸缩,在内部通过复制数据提升容错能力和高可用性Kafka支持实时的流式处理以上三点足以将Kafka与传统的消息队列区别开,我们甚至可以把它看成是流式处理平台.
因此,在Kafka里存储数据并不是什么疯狂事,甚至可以说Kafka本来就是设计用来存储数据的.
数据经过校验后被持久化在磁盘上,并通过复制副本提升容错能力.
再多的数据都不会拖慢Kafka,在生产环境中,有些Kafka集群甚至已经保存超过1TB的数据.
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3
Webhosting24宣布自7月1日起开始对日本机房的VPS进行NVMe和流量大升级,几乎是翻倍了硬盘和流量,价格依旧不变。目前来看,日本VPS国内过去走的是NTT直连,服务器托管机房应该是CDN77*(也就是datapacket.com),加上高性能平台(AMD Ryzen 9 3900X+NVMe),还是有相当大的性价比的。此外在6月30日,又新增了洛杉矶机房,CPU为AMD Ryzen 9...
VirMach,成立于2014年的美国IDC商家,知名的低价便宜VPS销售商,支持支付宝、微信、PayPal等方式付款购买,主打美国、欧洲暑假中心产品,拥有包括洛杉矶、西雅图、圣何塞、凤凰城在内的11个数据中心可以选择,可以自由搭配1Gbps、2Gbps、10Gbps带宽端口,有Voxility DDoS高防IP可以选择(500Gbps以上的防御能力),并且支持在控制面板付费切换机房和更换IP(带...
Megalayer是新晋崛起的国外服务器商,成立于2019年,一直都处于稳定发展的状态,机房目前有美国机房,香港机房,菲律宾机房。其中圣何塞包括CN2或者国际线路,Megalayer商家提供了一些VPS特价套餐,譬如15M带宽CN2线路主机最低每月48元起,基于KVM架构,支持windows或者Linux操作系统。。Megalayer技术团队行业经验丰富,分别来自于蓝汛、IBM等知名企业。Mega...
暴风冯鑫被正式提起公诉为你推荐
objectflashyw372:Com帮个忙 这个视频源地址怎么找http://video.kuaiji.com/congye/diansuanhua/372/3097thinkphpthinkphp框架有什么功能及使用方法prohibitedleaning on the door prohibited什么用法(语法),不甚感激163yeah请问网易的163,126,yeah,VIP,188邮箱各有什么特点?95188是什么电话95188是什么号码我刚收到短信是什么支付宝的验证码即时通平台老司机进来 求个直播平台123456hd手机上有电话的标志,后面有个HD是什么意思ie假死我的ie浏览器偶尔出现假死的情况 即打开浏览器时无法显示网页 点了关闭窗口也没反应,请问这是怎么回事啊discuz7.0如何建立Discuz!7.0.0论坛
我的世界服务器租用 免费域名跳转 全球付 php免费空间 河南移动邮件系统 isp服务商 美国网站服务器 如何安装服务器系统 新加坡空间 可外链的相册 双11促销 googlevoice windowsserver2008 免费网站加速 web服务器有哪些 symantec 热云 饭桶 挂马检测工具 大硬盘补丁 更多