当前位置:首页 > 短网址资讯

Kafka参数优化 — IO系统优化

www.ft12.com9年前 (2017-07-21)短网址资讯2118

一、 IO Scheduler 
Centos6系统默认的IO调度器是CFQ(Completely Fair Queuing),Kafka是顺序IO读写模型,使用Deadline和NOOP无疑是更好地选择。

Deadline:对于读写操作有截止时间,对读和写操作用两条不同的队列管理,可以解决读取饥饿的现象。因为操作系统对读请求是同步处理的,写入请求可以异步处理。操作系统可以数据写到内存,然后对IO队列中的请求做合并,提高IO的吞吐量。通过设置read_expire < write_expire时间,避免读取操作处于饥饿调度的状态。对于数据库存储应用,Deadline是最佳的IO Scheduler,甚至很多PCIE卡作为设备内置默认参数。

NOOP:是建立在FIFO调度模型之上的,并合相邻IO请求。Noop容易出现读取操作饥饿现象,使用NOOP调度,需要磁盘有足够的IO能力。对于SSD基于闪存技术存储介质和SAN存储,NOOP也是有限选择的调度器。
CFQ是对每个进程维护一个IO队列,IO Scheduler对每个IO队列轮询,对于不同的进程IO请求处理是公平的,平均IO请求响应时间很小。每个进程队列可以设置IO优先级使得有更多的调度时间片。比较适合离散的读写模型。

注意的是,传统的IO Elevator调度算法是基于减小机械盘磁头寻道时间和提高吞吐量目的设计的。IO Scheduler的选用需要根据硬件设备和应用的IO请求模式来决定。


二、 充分利用内存提高kafka读写性能

之前也提到过了,数据写入到磁盘可以异步进行,先把数据放到内存中,在集中的写到外部存储上。dirty_ratio 和 dirty_background_ration适当增大,充分利用内存和文件缓存buffer。

  • dirty_ratio,系统总内存的百分比,太小导致系统强制脏页写回到磁盘,这个会阻塞系统接受写入请求。

  • dirty_background_ratio,文件系统的写入缓冲区的大小,达到这个百分比时,pdflush进程开始启动,把数据写回到磁盘,但是不影响正常的读写请求。

  • 原则:dirty_background_ratio < dirty_ratio


但是还有个疑问,dirty page什么时候写回到磁盘?这个是由dirty_writeback_centisecs和dirty_expire_centisecs两个参数控制的。

dirty_writeback_centisecs,控制 pdflush/flush/kdmflush等进程的唤醒时间。

dirty_expire_centisecs,控制dirty page刷盘时间点。

减小这两个参数,可以使数据快速落盘,避免os crash引起的数据的丢失。另外,减小dirty_writeback_centisecs和dirty_expire_centisecs,解决IO Spike现象。

通过磁盘监控发现写入量wrqm/s和awit时间波动很大。


page cache中dirty apge的数量出现骤减。


对于kafa来说,数据append总以方式追加到文件末尾,因而内存中的dirty page很少被再次更新。合理做法是把dirty page快速的flush到磁盘上,而不是默认的是30s执行一次write back。这样可以大幅度减少单次fluhs操作的数据量,消除io-wait突然增高的现象。

dirty_writeback_centisecs=100,每1s中唤醒一次pdflush进程。

dirty_expire_centisecs=100,dirty page过了一秒就从内存写回到磁盘。

下图是io await的优化效果,经过参数调整之后,IO-await有明显的下降。



三、文件系统

我们生产上常用多块SATA盘做raid10,磁盘容量巨大时,仍然使用ext4文件系统,很容易格式化异常(需要系统补丁支持)。Ext4系统支持最大16TB的分区,而是用XFS文件系统可以达到100TB+。相比Ext4,XFS文件系统性能更好,官方也推荐使用。而稳定稍弱一点,很多参数也不需要优化。主要注意两个参数的优化:

1)nobarrier,XFS可以有数据丢失保护机制,因而可以关闭底层硬件的强制刷盘策略,何况在线机器还有raid卡保护。

2)noatime,完全没有必要的文件系统元数据更新。

推荐的XFS挂载参数:rw,noatime,nodiratime,noikeep,nobarrier,allocsize=128M,attr2,largeio,inode64,swalloc 。关于文件系统方面,主要参考官方的建议。


参考资料:

File Cache:https://lonesysadmin.net/2013/12/22/better-linux-disk-caching-performance-vm-dirty_ratio/

Ext4:https://en.wikipedia.org/wiki/Ext4

Kafka: http://kafka.apache.org/documentation.html#appvsosflush







扫描二维码推送至手机访问。

版权声明:本文由短链接发布,如需转载请注明出处。

本文链接:https://www.ft12.com/article_315.html

标签: KafkaIO优化
分享给朋友:

相关文章

FT12短网址教你如何利用大数据算法定位网站性能瓶颈(BOSS)

FT12短网址教你如何利用大数据算法定位网站性能瓶颈(BOSS)

FT12短网址资讯:架构师非常关注性能问题,上篇文章中我们介绍了京东的自动化压测体系 ForceBot,这篇文章来自 LinkedIn 的技术博客,介绍如何通过大数据算法来分析调用数据,自动定位性能瓶颈。本文由高可用架构翻译。背景我们 FT…

细数互联网产品的开放策略:微信与支付宝走上相反的路子

细数互联网产品的开放策略:微信与支付宝走上相反的路子

小早说:开放不仅仅是一种策略,更是一种能力,不仅有取,更重要的是舍。带着合作方一起共赢,才是更好的选择。 “开放”一直以来都是互联网公司做到一定的量级之后必经的产物,从BAT、TMD到一些新锐企业,都在提开放战略。移动互联网发展到现在这个…

创业者除了没有性生活,还有这些不为人知的隐疾……

创业者除了没有性生活,还有这些不为人知的隐疾……

有一篇名为《最难的时候,刘强东姚劲波是怎么过来的》的文章,生动描述了58同城的姚建波在创业最困难时,在压力下落泪的故事。美剧《硅谷》第二季中剧中主人公、创始人Richard因为创业的压力严重盗汗、甚至可能小便失禁,这一剧情真实反映了很多创业…

从网吧到网咖:80后男生的社交情怀

从网吧到网咖:80后男生的社交情怀

网鱼网咖的电脑区也和传统网吧大相径庭,采取类似阶梯教室的环状布局,摆放清一色的苹果一体机。除了从包房中不时传出“别送别送”(注:意思是告诫队友别送死)的叫声和激动的呼喊声,工作日时间的大厅中并没什么人,穿着印有网鱼logo白衬衫店员时不时驻…

【官方说法】只需两步,正确识别百度蜘蛛

【官方说法】只需两步,正确识别百度蜘蛛

经常听到站长们问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了,最近百度蜘蛛都不来了怎么办,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固定,我们无法对外公布。那怎么才能识别正确的百度蜘蛛呢?来来来,以短网址站为例…

t.cn短链接的今生与前世

也许是无意之作,t.cn短链接就非常突兀的出现在了新浪微博,这个事情还得从新浪微博的发展说起。2010左右,新浪推出了微博并一举威胁到了腾讯的QQ空间,顿时间无人不刷微博。逐渐的,微博成了人们生活中不可或缺的一个应用,无论是吃饭、睡觉、走路…

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。