首发于
Redis 的 (pipelining)是用来打包多条无关命令批量执行,以减少多个命令分别执行带来的网络交互时间。在一些批量操作数据的场景,使用管道可以显著提升 Redis 的读写性能。
原理演示
Redis 的管道实质就是命令打包批量执行,多次网络交互减少到单次。使用管道和不使用管道时的交互过程如下:
我们使用 nc 命令来直观感受下 Redis 管道的使用过程:
# 安装nc命令$ yum install nc# nc打包多个命令$ (printf "PING\r\nPING\r\nPING\r\n") | nc localhost 6379# 响应+PONG+PONG+PONG
因此,只要通过管道进行命令打包后,Redis 就可以批量返回命令的执行结果了。
管道的应用
首先,构造示例需要的 Hash 用户数据:
$keyPrex = 'user:hash:u:';for ($i=1; $i<=10000; $i++) { $redis->hMset($keyPrex.$i, [ 'name' => name(), //name()函数生成随机姓名 'age' => rand(21, 30), 'sex' => rand(0, 1), 'is_new' => rand(0, 1) ]);}
然后,查看导入 Redis 中的数据:
127.0.0.1:6379> keys user:hash:u:* 9997) "user:hash:u:3013" 9998) "user:hash:u:8971" 9999) "user:hash:u:4761"10000) "user:hash:u:1828"127.0.0.1:6379> HGETALL user:hash:u:18281) "name"2) "ggrg"3) "age"4) "23"5) "sex"6) "0"7) "is_new"8) "1"
需求
在某个社交活动中,通过一系列筛选逻辑后取得种子用户 uid,然后用这些 uid 去 Hash 获取用户的信息。这种情况下你会怎么来处理呢?
不使用管道
一般情况下,在数据量较小时,我们会直接使用 HGETALL 命令遍历地获取用户数据。
$start = nowTime();foreach (range(1, 1000) as $id) { $user[] = $redis->hgetAll($keyPrex.$id);}echo '时间:', nowTime() - $start, 'ms', PHP_EOL;时间:39ms
执行所用时间:
使用管道
因为通过 uid 批量获取用户数据,各个命令并没有依赖关系,所以可以使用 Redis 的管道来优化查询。
$start = nowTime();$redis->multi(Redis::PIPELINE);foreach (range(1, 1000) as $id) { //返回资源id相同的socket资源,并未执行命令 $redis->hgetAll($keyPrex.$id); }$user = $redis->exec();echo '时间:', nowTime() - $start, 'ms', PHP_EOL;时间:6ms
使用管道后,执行时间显著地减少为:。使用 tcpdump 抓取打包后的命令如下:
10:45:03.029049 IP localhost.58176 > localhost.6379: Flags [P.], seq 2255478840:2255479211, ack 3144685411, win 342, options [nop,nop,TS val 17640474 ecr 17640474], length 371E..../@.@.o..........@...o.8.p.c...V.......,.*2$7HGETALL$13user:hash:u:1*2$7HGETALL$13user:hash:u:2*2$7... ...
适用场景
在批量操作(查询和写入)数据时,我们应尽量避免多次跟 Redis 的网络交互。这时,可以使用管道实现,也可以 Redis 内嵌 Lua 脚本实现。需要注意的是:
- ,否则就需要借助 Lua 脚本实现批量操作;
- 在实际应用中,Redis 往往不可能是单机部署,如果想要在集群中使用管道,可以部署为一主多从架构,此时所有节点的数据都一致,随机选取节点使用管道即可;
总结
在批量获取数据时,尽管使用 Redis 的管道性能会显著提升,但是使用管道时 Redis 会缓存之前命令的结果,最后一并输出给终端,因此所打包的命令不宜太多,否则内存使用会很严重。