深入剖析nginx时间缓存

本文适合对nginx实现原理比较感兴趣的同学阅读,需要具备一定的服务端编程知识。

一、背景

在服务器开发领域,时间的准确度关系到系统能否正常运行,尤其是当系统中存在超时事件需要处理时。但是系统时间的获取需要一次昂贵的系统调用,作为一款成熟的服务器软件,Nginx是如何优化这部分的性能开销?

二、时间缓存

接触过系统设计的同学都知道,对于频繁的数据获取,在数据未变化的情形下,可以通过增加缓存来优化性能,因为缓存的访问速度远高于源数据的访问速度。这样的例子有很多,比如CPU设计有二级缓存,在传统的database基础上有了我们今天的redis、memcache等nosql。对于系统时间也一样,既然获取系统时间开销较大,可以尝试着将获取到的时间缓存起来,需要时直接从缓存中取就可以了。但与此同时,也引入了缓存时间与实际时间不一致的可能,下面看看Nginx是如何解决这一问题。

三、设计与实现

Nginx时间缓存设计

如上图所示,Nginx时间缓存包括时间读取和时间写入者,当需要更新时间时,nginx调用gettimeofday系统调用获取时间,然后更新缓存。需要获取时间的代码直接从time cache中取出即可。

这里又产生了新的问题,具体包括:

  • 读写并发,即读和写同时操作时间缓存会造成获取的时间混乱。

  • 多写并发,多个执行体同时更新时间缓存,同样造成时间混乱。

而常见的解决互斥的方案包括:

  • 加锁保证数据串行化

  • 无锁化设计

像Nginx这样对于性能有着极致追求的server来说,自然不会使用系统自带的锁机制。其实现的ngx_lock和ngx_unlock的背后都是无锁化的原子操作。

  1. 对于多写并发,nginx在ngx_time_update函数中通过全局的ngx_time_lock进行互斥,确保同一时刻只会存在一个执行体更新时间缓存。

  2. 对于读写并发,nginx设计了NGX_TIME_SLOTS个slot,用于隔离读写操作的时间缓存。同时引入时间缓存指针,原子地更新当前缓存的指向位置。

Nginx时间缓存实现

下面看具体实现代码(以nginx-1.13.1为例src/core/ngx_times.c):

void ngx_time_update(void)
{
...
//ngx_time_lock用于互斥,避免同时更新时间
    if (!ngx_trylock(&ngx_time_lock)) {
        return;
    }
//获取当前时间
    ngx_gettimeofday(&tv);
    sec = tv.tv_sec;
    msec = tv.tv_usec / 1000;
    ngx_current_msec = (ngx_msec_t) sec * 1000 + msec;
    tp = &cached_time[slot];

//秒值一致则只需要更新当前slot的msec
    if (tp->sec == sec) {
        tp->msec = msec;
        ngx_unlock(&ngx_time_lock);
        return;
    }
//获取下一slot
    if (slot == NGX_TIME_SLOTS - 1) {
        slot = 0;
    } else {
        slot++;
    }
    tp = &cached_time[slot];
    tp->sec = sec;
    tp->msec = msec;
    ngx_gmtime(sec, &gmt);
    p0 = &cached_http_time[slot][0];
    (void) ngx_sprintf(p0, "%s, %02d %s %4d %02d:%02d:%02d GMT",
                       week[gmt.ngx_tm_wday], gmt.ngx_tm_mday,
                       months[gmt.ngx_tm_mon - 1], gmt.ngx_tm_year,
                       gmt.ngx_tm_hour, gmt.ngx_tm_min, gmt.ngx_tm_sec);
    ...//类似更新ngx_cached_err_log_time.data等
    ngx_memory_barrier();

    ngx_cached_time = tp;
    ngx_cached_http_time.data = p0;
    ngx_cached_err_log_time.data = p1;
    ngx_cached_http_log_time.data = p2;
    ngx_cached_http_log_iso8601.data = p3;
    ngx_cached_syslog_time.data = p4;

    ngx_unlock(&ngx_time_lock);
}

ngx_time_update的流程图为: 

值得一提的是,这里采用了ngx_memory_barrier来避免指令重排,这样可以尽可能地保证ngx_cached_time、ngx_cached_http_time.data、ngx_cached_err_log_time.data、ngx_cached_http_log_time.data、ngx_cached_http_log_iso8601.data、ngx_cached_syslog_time.data中存储的时间数据一致。

slot设计

上面谈到了nginx采用slot来从空间上避免读写执行体同时操作时间缓存,slot的设计规则为: 

  • 获取时间的执行体采用ngx_timeofday获取了当前ngx_cached_time的快照,随后读取对应的slot中数据,包括sec和msec。

  • 更新时间的执行体通过ngx_time_update原子更新ngx_cached_time指向,这样更新之后的时间读取就是新的slot中的时间数据。

这里,nginx利用了修改指针的原子性,确保读写不会造成时间数据混乱。而时间数据本身包括sec和msec,无法完成修改的原子性,这种将非原子性修改操作转换为原子性修改操作的手法,值得借鉴。

想要获取最新技术文章?欢迎订阅微信公众号----软件编程之路

发表评论:

Copyright ft12.com All Rights Reserved.