集群虚拟内存

虚拟内存  时间:2021-01-15  阅读:()

Kafka集群调优KafkaCluster模式最大的优点:可扩展性和容错性,下图是关于Kafka集群的结构图:KafkaBroker个数决定因素磁盘容量:首先考虑的是所需保存的消息所占用的总磁盘容量和每个broker所能提供的磁盘空间.
如果Kafka集群需要保留10TB数据,单个broker能存储2TB,那么我们需要的最小Kafka集群大小5个broker.
此外,如果启用副本参数,则对应的存储空间需至少增加一倍(取决于副本参数).
这意味着对应的Kafka集群至少需要10个broker.
请求量:另外一个要考虑的是Kafka集群处理请求的能力.
这主要取决于对Kafkaclient请求的网络处理能力,特别是,有多个consumer或者网路流量不稳定.
如果,高峰时刻,单个broker的网络流量达到80%,这时是撑不住两个consumer的,除非有两个broker.
再者,如果启用了副本参数,则需要考虑副本这个额外的consumer.
也可以扩展多个broker来减少磁盘的吞吐量和系统内存.
操作系统优化大部分Linux发布版本默认的内核参数配置能让大部分应用工作的相当好.
但对于实际的Kafkabroker场景来说,做稍些改变会提升broker性能.
主要涉及的配置:虚拟内存、网络和磁盘挂载(用来存储logsegment),一般在/etc/sysctl.
conf(CentOS系统).
VirtualMemory一般来说,Linux的虚拟内存会根据系统负载自动调整.
内存页(page)swap到磁盘会显著1/3的影响Kafka的性能,并且Kafka重度使用pagecache,如果VM系统swap到磁盘,那说明没有足够的内存来分配pagecache.
避免swap的一种方式是设置swap空间为0.
但是,swap会在系统崩溃时提供安全机制,或者会在outofmemory的情况下阻止操作系统kill掉进程.
由于这个原因,推荐vm.
swappiness参数设置为一个非常低的值:1.
这个参数表示VM系统中的多少百分比用来作为swap空间.
另外一种方式是通过内核调节"脏页"(注:"脏页"会被刷到磁盘上).
Kafka依赖磁盘I/O性能来提高producer的响应时间.
这也是为什么通常优先把logsegment功能放在可以快速响应的磁盘中(比如,SSD).
这样使得flush进程把"脏数据"写入磁盘前,"脏页"数目就减少了,可以设置vm.
dirty_background_ratio(表示占用系统内存的百分比)参数的值为10以下.
大部分应用场景下,vm.
dirty_background_ratio设置为5就够用了,要注意了:这个参数值不能设置为0,因为设置为0后会引起内核持续刷"脏页",使得内核的bufferwrite功能没法施展.
"脏页"的总量可以通过vm.
dirty_ratio来改变,默认值是20(此处也是百分比),这个值的设置范围较大,一般建议设置60到80为合理的值.
但是vm.
dirty_ratio参数也引来了不小的风险,会造成大量unflush的数据在硬刷到磁盘时产生较长的I/O停顿.
如果vm.
dirty_ratio值设置的较大时,强烈建议Kafka开启备份功能,以备系统崩溃.
在设置了这些参数后,需要监控Kafka集群运行时"脏页"的数量,当前"脏页"数量可由如下方式查看(/proc/vmstat文件):#cat/proc/vmstat|egrep"dirty|writeback"nr_dirty3875nr_writeback29nr_writeback_temp0磁盘除了考虑磁盘硬件本身和RAID配置外,磁盘的filesystem对Kafka集群的影响最大.
虽然有许多filesystem,但最常用的是EXT4或者XFS.
在这里XFS文件系统比EXT4稍好,具体原因Google下.
另外一点是,建议开启mount的noatimemount选项.
文件系统在文件被访问、创建、修改等的时候会记录文件的一些时间戳,比如:文件创建时间(ctime)、最近一次修改时间(mtime)和最近一次访问时间(atime).
默认情况下,atime的更新会有一次读操作,这会产生大量的磁盘读写,然而atime对Kafka完全没用.
网络Linux发布版本的网络参数对高网络流量不适用.
对于Kafka集群,推荐更改每个socket发送和接收buffer的最大内存:net.
core.
wmem_default和net.
core.
rmem_default为128kb,net.
core.
wmem_max和net.
core.
rmem_max为2Mb.
另外一个socket参数是TCP2/3socket的发送和接收buffer:net.
ipv4.
tcp_wmem和net.
ipv4.
tcp_rmem.
Kafka集群稳定GC调优调GC是门手艺活,幸亏Java7引进了G1垃圾回收,使得GC调优变的没那么难.
G1主要有两个配置选项来调优:MaxGCPauseMillis和InitiatingHeapOccupancyPercent,具体参数设置可以参考Google,这里不赘述.
Kafkabroker能够有效的利用堆内存和对象回收,所以这些值可以调小点.
对于64Gb内存,Kafka运行堆内存5Gb,MaxGCPauseMillis和InitiatingHeapOccupancyPercent分别设置为20毫秒和35.
Kafka的启动脚本使用的不是G1回收,需要在环境变量中加入:#exportJAVA_HOME=/usr/java/jdk1.
8.
0_51#exportKAFKA_JVM_PERFORMANCE_OPTS="-server-XX:+UseG1GC-XX:MaxGCPauseMillis=20-XX:InitiatingHeapOccupancyPercent=35-XX:+DisableExplicitGC-Djava.
awt.
headless=true"#/usr/local/kafka/bin/kafka-server-start.
sh-daemon/usr/local/kafka/config/server.
properties数据中心布局原则上Kafkabroker不建议都在一个机架上,为了容灾,但现实情况大部分公司做不到,此处略去.

HostKvm四月优惠:VPS主机全场八折,香港/美国洛杉矶机房$5.2/月起

HostKvm是一家成立于2013年的国外主机服务商,主要提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,均为国内直连或优化线路,延迟较低,适合建站或者远程办公等。本月商家针对全场VPS主机提供8折优惠码,优惠后美国洛杉矶VPS月付5.2美元起。下面列出几款不同机房VPS主机产品配置信息。套餐:美国US-Plan0CPU:1cores内存:1GB硬...

云步云72.5元/月起云服务器,香港安畅/葵湾/将军澳/沙田/大浦CN2机房,2核2G5M

云步云怎么样?云步云是创建于2021年的品牌,主要从事出售香港vps、美国VPS、日本VPS、香港独立服务器、香港站群服务器等,机房有香港、美国、日本东京等机房,目前在售VPS线路有CN2+BGP、CN2 GIA,香港的线路也是CN2直连大陆,该公司旗下产品均采用KVM虚拟化架构。目前,云步云提供香港安畅、沙田、大浦、葵湾、将军澳、新世界等CN2机房云服务器,2核2G5M仅72.5元/月起。点击进...

Sharktech鲨鱼服务器商提供洛杉矶独立服务器促销 不限流量月99美元

Sharktech(鲨鱼服务器商)我们还是比较懂的,有提供独立服务器和高防服务器,而且性价比都还算是不错,而且我们看到有一些主机商的服务器也是走这个商家渠道分销的。这不看到鲨鱼服务器商家洛杉矶独立服务器纷纷促销,不限制流量的独立服务器起步99美元,这个还未曾有过。第一、鲨鱼机房服务器方案洛杉矶机房,默认1Gbps带宽,不限流量,自带5个IPv4,免费60Gbps / 48Mpps DDoS防御。C...

虚拟内存为你推荐
虚拟空间租用我在网上租用了个虚拟空间。带域名。。想在里面放置AVI,等视频。放在目录里,然后怎么设置才能在域名观看呢免费云主机有永久免费的云主机吗?虚拟主机代理个人适合代理虚拟主机的业务吗网站域名域名和网址有什么区别域名注册服务万网域名注册服务怎么样?域名主机域名,主机空间和网站文件三者之间的区别是什么查询ip怎样查别人的ip地址?空间域名空间和域名是什么?香港虚拟空间香港空间,香港虚拟主机,香港虚拟空间推荐一家,公司要做一个网站,需要1G的,不限流量的,其它的空间不要免备案虚拟主机哪家免备案虚拟主机好,而且便宜点的?
cn域名价格 免费二级域名申请 什么是二级域名 过期已备案域名 westhost godaddy主机 便宜域名 美国主机推荐 美国主机评论 bluehost anylink cdn联盟 91vps 速度云 外贸空间 阿里云邮箱登陆地址 七牛云存储 带宽测速 comodo hosts文件 更多