新闻资讯  快讯  焦点  财经  政策  社会
互 联 网   电商  金融  数据  计算  技巧
生活百科  科技  职场  健康  法律  汽车
手机百科  知识  软件  修理  测评  微信
软件技术  应用  系统  图像  视频  经验
硬件技术  知识  技术  测评  选购  维修
网络技术  硬件  软件  设置  安全  技术
程序开发  语言  移动  数据  开源  百科
安全防护  资讯  黑客  木马  病毒  移动
站长技术  搜索  SEO  推广  媒体  移动
财经百科  股票  知识  理财  财务  金融
教育考试  育儿  小学  高考  考研  留学
您当前的位置:首页 > IT百科 > 数据库 > Redis

为什么单线程的Redis却能支撑高并发?

时间:2019-05-14 09:35:26  来源:  作者:

最近在看 UNIX 网络编程并研究了一下 redis 的实现,感觉 Redis 的源代码十分适合阅读和分析,其中 I/O 多路复用(mutiplexing)部分的实现非常干净和优雅,在这里想对这部分的内容进行简单的整理。

 

为什么单线程的Redis却能支撑高并发?

 

 

几种 I/O 模型

为什么 Redis 中要使用 I/O 多路复用这种技术呢?首先,Redis 是跑在单线程中的,所有的操作都是按照顺序线性执行的。

但是由于读写操作等待用户输入或输出都是阻塞的,所以 I/O 操作在一般情况下往往不能直接返回。

这会导致某一文件的 I/O 阻塞导致整个进程无法对其他客户提供服务,而 I/O 多路复用就是为了解决这个问题而出现的。

Blocking I/O

先来看一下传统的阻塞 I/O 模型到底是如何工作的:当使用 Read 或者 Write 对某一个文件描述符(File Descriptor 以下简称 FD)进行读写时。

如果当前 FD 不可读或不可写,整个 Redis 服务就不会对其他的操作作出响应,导致整个服务不可用。

这也就是传统意义上的,我们在编程中使用最多的阻塞模型:

 

为什么单线程的Redis却能支撑高并发?

 

 

阻塞模型虽然开发中非常常见也非常易于理解,但是由于它会影响其他 FD 对应的服务,所以在需要处理多个客户端任务的时候,往往都不会使用阻塞模型。

I/O 多路复用

虽然还有很多其他的 I/O 模型,但是在这里都不会具体介绍。阻塞式的 I/O 模型并不能满足这里的需求,我们需要一种效率更高的 I/O 模型来支撑 Redis 的多个客户(redis-cli)。

这里涉及的就是 I/O 多路复用模型了:

 

为什么单线程的Redis却能支撑高并发?

 

 

在 I/O 多路复用模型中,最重要的函数调用就是 select,该方法的能够同时监控多个文件描述符的可读可写情况,当其中的某些文件描述符可读或者可写时,select 方法就会返回可读以及可写的文件描述符个数。

关于 select 的具体使用方法,在网络上资料很多,这里就不过多展开介绍了;

与此同时也有其它的 I/O 多路复用函数 epoll/kqueue/evport,它们相比 select 性能更优秀,同时也能支撑更多的服务。

Reactor 设计模式

Redis 服务采用 Reactor 的方式来实现文件事件处理器(每一个网络连接其实都对应一个文件描述符)

 

为什么单线程的Redis却能支撑高并发?

 

 

文件事件处理器使用 I/O 多路复用模块同时监听多个 FD,当 accept、read、write 和 close 文件事件产生时,文件事件处理器就会回调 FD 绑定的事件处理器。

虽然整个文件事件处理器是在单线程上运行的,但是通过 I/O 多路复用模块的引入,实现了同时对多个 FD 读写的监控,提高了网络通信模型的性能,同时也可以保证整个 Redis 服务实现的简单。

I/O 多路复用模块

I/O 多路复用模块封装了底层的 select、epoll、avport 以及 kqueue 这些 I/O 多路复用函数,为上层提供了相同的接口。

 

为什么单线程的Redis却能支撑高并发?

 

 

在这里我们简单介绍 Redis 是如何包装 select 和 epoll 的,简要了解该模块的功能,整个 I/O 多路复用模块抹平了不同平台上 I/O 多路复用函数的差异性,提供了相同的接口:

static int aeApiCreate(aeEventLoop *eventLoop) 
static int aeApiResize(aeEventLoop *eventLoop, int setsize) 
static void aeApiFree(aeEventLoop *eventLoop) 
static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) 
static void aeApiDelEvent(aeEventLoop *eventLoop, int fd, int mask) 
static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) 

同时,因为各个函数所需要的参数不同,我们在每一个子模块内部通过一个 aeApiState 来存储需要的上下文信息:

// select 
typedef struct aeApiState { 
 fd_set rfds, wfds; 
 fd_set _rfds, _wfds; 
} aeApiState; 
 
// epoll 
typedef struct aeApiState { 
 int epfd; 
 struct epoll_event *events; 
} aeApiState; 

这些上下文信息会存储在 eventLoop 的 void *state 中,不会暴露到上层,只在当前子模块中使用。

封装 Select 函数

Select 可以监控 FD 的可读、可写以及出现错误的情况。在介绍 I/O 多路复用模块如何对 Select 函数封装之前,先来看一下 Select 函数使用的大致流程:

  • 初始化一个可读的 fd_set 集合,保存需要监控可读性的 FD。
  • 使用 FD_SET 将 fd 加入 RFDS。
  • 调用 Select 方法监控 RFDS 中的 FD 是否可读。
  • 当 Select 返回时,检查 FD 的状态并完成对应的操作。
int fd = /* file descriptor */ 
 
fd_set rfds; 
FD_ZERO(&rfds); 
FD_SET(fd, &rfds) 
 
for ( ; ; ) { 
 select(fd+1, &rfds, NULL, NULL, NULL); 
 if (FD_ISSET(fd, &rfds)) { 
 /* file descriptor `fd` becomes readable */ 
 } 
} 

而在 Redis 的 ae_select 文件中代码的组织顺序也是差不多的,首先在 aeApiCreate 函数中初始化 rfds 和 wfds:

static int aeApiCreate(aeEventLoop *eventLoop) { 
 aeApiState *state = zmalloc(sizeof(aeApiState)); 
 if (!state) return -1; 
 FD_ZERO(&state->rfds); 
 FD_ZERO(&state->wfds); 
 eventLoop->apidata = state; 
 return 0; 
} 

而 aeApiAddEvent 和 aeApiDelEvent 会通过 FD_SET 和 FD_CLR 修改 fd_set 中对应 FD 的标志位:

static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) { 
 aeApiState *state = eventLoop->apidata; 
 if (mask & AE_READABLE) FD_SET(fd,&state->rfds); 
 if (mask & AE_WRITABLE) FD_SET(fd,&state->wfds); 
 return 0; 
} 

整个 ae_select 子模块中最重要的函数就是 aeApiPoll,它是实际调用 select 函数的部分,其作用就是在 I/O 多路复用函数返回时,将对应的 FD 加入 aeEventLoop 的 fired 数组中,并返回事件的个数:

static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) { 
 aeApiState *state = eventLoop->apidata; 
 int retval, j, numevents = 0; 
 
 memcpy(&state->_rfds,&state->rfds,sizeof(fd_set)); 
 memcpy(&state->_wfds,&state->wfds,sizeof(fd_set)); 
 
 retval = select(eventLoop->maxfd+1, 
 &state->_rfds,&state->_wfds,NULL,tvp); 
 if (retval > 0) { 
 for (j = 0; j <= eventLoop->maxfd; j++) { 
 int mask = 0; 
 aeFileEvent *fe = &eventLoop->events[j]; 
 
 if (fe->mask == AE_NONE) continue; 
 if (fe->mask & AE_READABLE && FD_ISSET(j,&state->_rfds)) 
 mask |= AE_READABLE; 
 if (fe->mask & AE_WRITABLE && FD_ISSET(j,&state->_wfds)) 
 mask |= AE_WRITABLE; 
 eventLoop->fired[numevents].fd = j; 
 eventLoop->fired[numevents].mask = mask; 
 numevents++; 
 } 
 } 
 return numevents; 
} 

封装 Epoll 函数

Redis 对 epoll 的封装其实也是类似的,使用 epoll_create 创建 epoll 中使用的 epfd:

static int aeApiCreate(aeEventLoop *eventLoop) { 
 aeApiState *state = zmalloc(sizeof(aeApiState)); 
 
 if (!state) return -1; 
 state->events = zmalloc(sizeof(struct epoll_event)*eventLoop->setsize); 
 if (!state->events) { 
 zfree(state); 
 return -1; 
 } 
 state->epfd = epoll_create(1024); /* 1024 is just a hint for the kernel */ 
 if (state->epfd == -1) { 
 zfree(state->events); 
 zfree(state); 
 return -1; 
 } 
 eventLoop->apidata = state; 
 return 0; 
} 

在 aeApiAddEvent 中使用 epoll_ctl 向 epfd 中添加需要监控的 FD 以及监听的事件:

static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask) { 
 aeApiState *state = eventLoop->apidata; 
 struct epoll_event ee = {0}; /* avoid valgrind warning */ 
 /* If the fd was already monitored for some event, we need a MOD 
 * operation. Otherwise we need an ADD operation. */ 
 int op = eventLoop->events[fd].mask == AE_NONE ? 
 EPOLL_CTL_ADD : EPOLL_CTL_MOD; 
 
 ee.events = 0; 
 mask |= eventLoop->events[fd].mask; /* Merge old events */ 
 if (mask & AE_READABLE) ee.events |= EPOLLIN; 
 if (mask & AE_WRITABLE) ee.events |= EPOLLOUT; 
 ee.data.fd = fd; 
 if (epoll_ctl(state->epfd,op,fd,&ee) == -1) return -1; 
 return 0; 
} 

由于 epoll 相比 select 机制略有不同,在 epoll_wait 函数返回时并不需要遍历所有的 FD 查看读写情况。

在 epoll_wait 函数返回时会提供一个 epoll_event 数组:

typedef union epoll_data { 
 void *ptr; 
 int fd; /* 文件描述符 */ 
 uint32_t u32; 
 uint64_t u64; 
} epoll_data_t; 
 
struct epoll_event { 
 uint32_t events; /* Epoll 事件 */ 
 epoll_data_t data; 
}; 

其中保存了发生的 epoll 事件(EPOLLIN、EPOLLOUT、EPOLLERR 和 EPOLLHUP)以及发生该事件的 FD。

aeApiPoll 函数只需要将 epoll_event 数组中存储的信息加入 eventLoop 的 fired 数组中,将信息传递给上层模块:

static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp) { 
 aeApiState *state = eventLoop->apidata; 
 int retval, numevents = 0; 
 
 retval = epoll_wait(state->epfd,state->events,eventLoop->setsize, 
 tvp ? (tvp->tv_sec*1000 + tvp->tv_usec/1000) : -1); 
 if (retval > 0) { 
 int j; 
 
 numevents = retval; 
 for (j = 0; j < numevents; j++) { 
 int mask = 0; 
 struct epoll_event *e = state->events+j; 
 
 if (e->events & EPOLLIN) mask |= AE_READABLE; 
 if (e->events & EPOLLOUT) mask |= AE_WRITABLE; 
 if (e->events & EPOLLERR) mask |= AE_WRITABLE; 
 if (e->events & EPOLLHUP) mask |= AE_WRITABLE; 
 eventLoop->fired[j].fd = e->data.fd; 
 eventLoop->fired[j].mask = mask; 
 } 
 } 
 return numevents; 
} 

子模块的选择

因为 Redis 需要在多个平台上运行,同时为了最大化执行的效率与性能,所以会根据编译平台的不同选择不同的 I/O 多路复用函数作为子模块,提供给上层统一的接口。

在 Redis 中,我们通过宏定义的使用,合理的选择不同的子模块:

#ifdef HAVE_EVPORT 
#include "ae_evport.c" 
#else 
 #ifdef HAVE_EPOLL 
 #include "ae_epoll.c" 
 #else 
 #ifdef HAVE_KQUEUE 
 #include "ae_kqueue.c" 
 #else 
 #include "ae_select.c" 
 #endif 
 #endif 
#endif 

因为 select 函数是作为 POSIX 标准中的系统调用,在不同版本的操作系统上都会实现,所以将其作为保底方案:

 

为什么单线程的Redis却能支撑高并发?

 

 

Redis 会优先选择时间复杂度为 $O(1)$ 的 I/O 多路复用函数作为底层实现,包括 Solaries 10 中的 evport、linux 中的 epoll 和 macOS/FreeBSD 中的 kqueue。

上述的这些函数都使用了内核内部的结构,并且能够服务几十万的文件描述符。

但是如果当前编译环境没有上述函数,就会选择 select 作为备选方案,由于其在使用时会扫描全部监听的描述符,所以其时间复杂度较差 O(n)。

并且只能同时服务 1024 个文件描述符,所以一般并不会以 select 作为第一方案使用。

总结

Redis 对于 I/O 多路复用模块的设计非常简洁,通过宏保证了 I/O 多路复用模块在不同平台上都有着优异的性能,将不同的 I/O 多路复用函数封装成相同的 API 提供给上层使用。

整个模块使 Redis 能以单进程运行的同时服务成千上万个文件描述符,避免了由于多进程应用的引入导致代码实现复杂度的提升,减少了出错的可能性。

作者:Draveness来源:Draveness|
 



Tags:Redis   点击:()  评论:()
声明:本站部分内容来自互联网,内容观点仅代表作者本人,如有任何版权侵犯请与我们联系,我们将立即删除。
▌相关评论
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
▌相关推荐
redis集群简述哨兵模式中如果主从中 master宕机了,是通过哨兵来选举出新的master,在这个选举切换主从的过程,整个redis服务是不可用的。而且哨兵模式中只有一个主节点对外提供...【详细内容】
2020-03-18   Redis  点击:(1)  评论:(0)  加入收藏
《深入理解Java虚拟机》但要想真的深入理解虚拟机一问肯定远远不够的,但是本文中分三部分对JVM有深入的解析。第1章 走近Java第2章 Java内存区域与内存溢出异常第3章 垃圾收...【详细内容】
2020-03-16   Redis  点击:(6)  评论:(0)  加入收藏
大家都知道程序员涨薪主要还是要靠跳槽来完成!但是我们都知道,无论是考试,还是求职,这个难度,参加人数是影响难度的一个很大因数(当然特别牛逼的大佬可以忽略这句话)。每年高考、考...【详细内容】
2020-03-16   Redis  点击:(3)  评论:(0)  加入收藏
前言随着系统的运行,数据量变得越来越大,单纯的将数据存储在mysql中,已然不能满足查询要求了,此时我们引入Redis作为查询的缓存层,将业务中的热数据保存到Redis,扩展传统关系型数...【详细内容】
2020-03-16   Redis  点击:(8)  评论:(0)  加入收藏
作为一个内存数据库,redis也总是免不了有各种各样的问题,这篇文章主要是针对其中两个问题进行讲解:缓存穿透和缓存雪崩。并给出一些解决方案。这两个问题是基本问题也是面试常...【详细内容】
2020-03-14   Redis  点击:(3)  评论:(0)  加入收藏
Redis占用内存大小我们知道Redis是基于内存的key-value数据库,因为系统的内存大小有限,所以我们在使用Redis的时候可以配置Redis能使用的最大的内存大小。1、通过配置文件配置...【详细内容】
2020-03-14   Redis  点击:(4)  评论:(0)  加入收藏
01 大数据时代的新挑战:实时流计算社会需求和科技进步是螺旋式相互促进和提升的。“大数据”一词最早由Roger Mougalas在2005年提出,所以我们姑且认为2005年是大数据时代的元...【详细内容】
2020-03-14   Redis  点击:(6)  评论:(0)  加入收藏
性能测试报告查看了下阿里云 Redis 的性能测试报告如下,能够达到数十万、百万级别的 QPS(暂时忽略阿里对 Redis 所做的优化),我们从 Redis 的设计和实现来分析一下 Redis 是怎么...【详细内容】
2020-03-11   Redis  点击:(2)  评论:(0)  加入收藏
大家有没有想过如何统计活跃用户数量?如果是自己做,那该怎么做?这里思考一分钟,后面我将分享一下如何使用 redis 中的位图来统计活跃用户数。正文什么是位图 ?位图(bitmap)是二进...【详细内容】
2020-03-10   Redis  点击:(5)  评论:(0)  加入收藏
一、redis安装后,在src和/usr/local/bin下有几个以redis开头的可执行文件,称为redis shell,这些可执行文件可做很多事情。1、redis-server 启动redis2、redis-cli redis 命令行...【详细内容】
2020-03-10   Redis  点击:(10)  评论:(0)  加入收藏
Redis是一个开源的使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。 一、redis-dump迁移redis-dump需要r...【详细内容】
2020-03-09   Redis  点击:(4)  评论:(0)  加入收藏
有没有人和我一样, 自打知道了redis, 就一直听说什么redis单线程, 使用了多路复用等等. 天真的我以为多路复用是redis实现的技术. 今天才发现, 我被自己骗了, 多路复用是系...【详细内容】
2020-03-08   Redis  点击:(4)  评论:(0)  加入收藏
最近在精进学习Redis,边学边写一、List类型使用说明 list类型是用来存储多个有序的字符串的,支持存储2^32次方-1个元素。 redis可以从链表的两端进行插入(pubsh)和弹出(pop)元素,...【详细内容】
2020-03-08   Redis  点击:(16)  评论:(0)  加入收藏
Java中的Live对象是什么?Java是一种面向对象的编程语言,这意味着在Java中几乎没有比对象更重要的概念了。Java中的对象的强大功能分布式对象,使您能够跨多个进程或计算机构建分...【详细内容】
2020-03-07   Redis  点击:(10)  评论:(0)  加入收藏
基本数据结构简单动态字符串Redis中的字符串使用“简单动态字符串”(SDS)表示,无论是字符串值还是键底层都采用“简单动态字符串”。 free:未使用空间大小; len:字符串长度; buf...【详细内容】
2020-03-07   Redis  点击:(9)  评论:(0)  加入收藏
什么是RedisRedis 是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API的非关系型数据库。...【详细内容】
2020-03-06   Redis  点击:(5)  评论:(0)  加入收藏
RDB(默认)RDB是通过快照方式完成的,当满足一定条件时,redis会自动将内存中的数据持久化到磁盘。触发快照的时机 符合自定义配置的快照规则。(在redis.conf中配置,下面会详细介...【详细内容】
2020-03-05   Redis  点击:(0)  评论:(0)  加入收藏
RDB(默认)RDB是通过快照方式完成的,当满足一定条件时,redis会自动将内存中的数据持久化到磁盘。触发快照的时机 符合自定义配置的快照规则。(在redis.conf中配置,下面会详细介...【详细内容】
2020-03-05   Redis  点击:(11)  评论:(0)  加入收藏
简单来说 Redis 就是一个数据库,不过与传统数据库不同的是 Redis 的数据是存在内存中的,所以存写速度非常快,因此 Redis 被广泛应用于缓存方向。 另外,Redis 也经常用来做分...【详细内容】
2020-03-03   Redis  点击:(9)  评论:(0)  加入收藏
大家都知道Redis一个内存数据库,它支持2种持久化方式: RDB(Snapshot 内存快照) , AOF(append only file) 。持久化功能将内存中的数据同步到磁盘来避免Redis发生异常导致数据...【详细内容】
2020-03-03   Redis  点击:(9)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条