社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  DATABASE

我是Redis,MySQL大哥被我害惨了!

51CTO技术栈 • 3 年前 • 418 次点击  

大家好,我是 Redis,一个叫 Antirez 的男人把我带到了这个世界上......


图片来自 Pexels

我是 Redis,MySQL 大哥被我害惨了


说起我的诞生,跟关系数据库 MySQL 还挺有渊源的。


在我还没来到这个世界上的时候,MySQL 过的很辛苦,互联网发展的越来越快,它容纳的数据也越来越多,用户请求也随之暴涨,而每一个用户请求都变成了对它的一个又一个读写操作,MySQL 是苦不堪言。

尤其是到“双 11”、“618“这种全民购物狂欢的日子,都是 MySQL 受苦受难的日子。


据后来 MySQL 告诉我说,其实有一大半的用户请求都是读操作,而且经常都是重复查询一个东西,浪费它很多时间去进行磁盘 I/O。


后来有人就琢磨,是不是可以学学 CPU,给数据库也加一个缓存呢?于是我就诞生了!


出生不久,我就和 MySQL 成为了好朋友,我们俩常常携手出现在后端服务器中。


应用程序们从 MySQL 查询到的数据,在我这里登记一下,后面再需要用到的时候,就先找我要,我这里没有再找 MySQL 要。

为了方便使用,我支持好几种数据结构的存储:

  • String

  • Hash

  • List

  • Set

  • SortedSet

  • Bitmap

  • ······


因为我把登记的数据都记录在内存中,不用去执行慢如蜗牛的 I/O 操作,所以找我要比找 MySQL 要省去了不少的时间呢。


可别小瞧这简单的一个改变,我可为 MySQL 减轻了不小的负担!随着程序的运行,我缓存的数据越来越多,有相当部分时间我都给它挡住了用户请求,这一下它可乐得清闲自在了!


有了我的加入,网络服务的性能提升了不少,这都归功于我为数据库挨了不少枪子儿。


缓存过期&缓存淘汰


不过很快我发现事情不妙了,我缓存的数据都是在内存中,可是就算是在服务器上,内存的空间资源还是很有限的,不能无节制的这么存下去,我得想个办法,不然吃枣药丸。


不久,我想到了一个办法:给缓存内容设置一个超时时间,具体设置多长交给应用程序们去设置,我要做的就是把过期了的内容从我里面删除掉,及时腾出空间就行了。

超时时间有了,我该在什么时候去干这个清理的活呢?最简单的就是定期删除,我决定 100ms 就做一次,一秒钟就是 10 次!


我清理的时候也不能一口气把所有过期的都给删除掉,我这里面存了大量的数据,要全面扫一遍的话那不知道要花多久时间,会严重影响我接待新的客户请求的!


时间紧任务重,我只好随机选择一部分来清理,能缓解内存压力就行了。

就这样过了一段日子,我发现有些个键值运气比较好,每次都没有被我的随机算法选中,每次都能幸免于难,这可不行,这些长时间过期的数据一直霸占着不少的内存空间!气抖冷!


我眼里可揉不得沙子!于是在原来定期删除的基础上,又加了一招:那些原来逃脱我随机选择算法的键值,一旦遇到查询请求,被我发现已经超期了,那我就绝不客气,立即删除。


这种方式因为是被动式触发的,不查询就不会发生,所以也叫惰性删除


可是,还是有部分键值,既逃脱了我的随机选择算法,又一直没有被查询,导致它们一直逍遥法外!而于此同时,可以使用的内存空间却越来越少。

而且就算退一步讲,我能够把过期的数据都删除掉,那万一过期时间设置的很长,还没等到我去清理,内存就吃满了,一样要吃枣药丸,所以我还得想个办法。


我苦思良久,终于憋出了个大招:内存淘汰策略,这一次我要彻底解决问题!


我提供了 8 种策略供应用程序选择,用于我遇到内存不足时该如何决策:

  • noeviction:返回错误,不会删除任何键值。

  • allkeys-lru:使用 LRU 算法删除最近最少使用的键值。

  • volatile-lru:使用 LRU 算法从设置了过期时间的键集合中删除最近最少使用的键值。

  • allkeys-random:从所有 key 随机删除。

  • volatile-random:从设置了过期时间的键的集合中随机删除。

  • volatile-ttl:从设置了过期时间的键中删除剩余时间最短的键。

  • volatile-lfu:从配置了过期时间的键中删除使用频率最少的键。

  • allkeys-lfu:从所有键中删除使用频率最少的键。


有了上面几套组合拳,我再也不用担心过期数据多了把空间撑满的问题了~


缓存穿透&布隆过滤器


我的日子过的还挺舒坦,不过 MySQL 大哥就没我这么舒坦了,有时候遇到些烦人的请求,查询的数据不存在,MySQL 就要白忙活一场!


不仅如此,因为不存在,我也没法缓存啊,导致同样的请求来了每次都要去让 MySQL 白忙活一场。


我作为缓存的价值就没得到体现啦!这就是人们常说的缓存穿透。

这一来二去,MySQL 大哥忍不住了:“唉,兄弟,能不能帮忙想个办法,把那些明知道不会有结果的查询请求给我挡一下”。


这时我想到了我的另外一个好朋友:布隆过滤器

我这位朋友别的本事没有,就擅长从超大的数据集中快速告诉你查找的数据存不存在(悄悄告诉你,我的这位朋友有一点不靠谱,它告诉你存在的话不能全信,其实有可能是不存在的,不过它他要是告诉你不存在的话,那就一定不存在)。

我把这位朋友介绍给了应用程序,不存在的数据就不必去叨扰 MySQL 了,轻松帮忙解决了缓存穿透的问题。


缓存击穿&缓存雪崩


这之后过了一段时间太平日子,直到那一天···


有一次,MySQL 那家伙正优哉游哉的摸鱼,突然一大堆请求给他怼了过去,给他打了一个措手不及。


一阵忙活之后,MySQL 怒气冲冲的找到了我,“兄弟,咋回事啊,怎么一下子来的这么猛”。

我查看了日志,赶紧解释到:“大哥,实在不好意思,刚刚有一个热点数据到了过期时间,被我删掉了,不巧的是随后就有对这个数据的大量查询请求来了,我这里已经删了,所以请求都发到你那里来了”。


“你这干的叫啥事,下次注意点啊”,MySQL 大哥一脸不高兴的离开了。


这一件小事我也没怎么放在心上,随后就抛之脑后了,却没曾想几天之后竟捅了更大的篓子。


那一天,又出现了大量的网络请求发到了 MySQL 那边,比上一次的规模大得多,MySQL 大哥一会儿功夫就给干趴下了好几次!


等了好半天这一波流量才算过去,MySQL 才缓过神来。


“老弟,这一次又是什么原因?”,MySQL 大哥累的没了力气。


“这一次比上一次更不巧,这一次是一大批数据几乎同时过了有效期,然后又发生了很多对这些数据的请求,所以比起上一次这规模更大了”。

MySQL 大哥听了眉头一皱,“那你倒是想个办法啊,三天两头折磨我,这谁顶得住啊?”


“其实我也很无奈,这个时间也不是我设置的,要不我去找应用程序说说,让他把缓存过期时间设置的均匀一些?至少别让大量数据集体失效”。


“走,咱俩一起去”。


后来,我俩去找应用程序商量了,不仅把键值的过期时间随机了一下,还设置了热点数据永不过期,这个问题缓解了不少。哦对了,我们还把这两次发生的问题分别取了个名字:缓存击穿和缓存雪崩。


我们终于又过上了舒适的日子···


彩蛋:那天,我正在努力工作中,不小心出了错,整个进程都崩溃了。当我再次启动后,之前缓存的数据全都没了,暴风雨似的请求再一次全都怼到了 MySQL 大哥那里。唉,要是我能够记住崩溃前缓存的内容就好了...


突然挂了!Redis 缓存都在内存中,这下完了!


“快醒醒!快醒醒!”,隐隐约约,我听到有人在叫我。


慢慢睁开眼睛,原来旁边是 MySQL 大哥。


“我怎么睡着了?”


“嗨,你刚才是不是出现了错误,整个进程都崩溃了!害得一大堆查询请求都给我怼过来了!”,MySQL 说到。


刚刚醒来,脑子还有点懵,MySQL 大哥扶我起来继续工作。


“糟了!我之前缓存的数据全都不见了!”


“WTF?你没有做持久化吗?”,MySQL 大哥一听脸色都变了。


我尴尬的摇了摇头,“我都是保存在内存中的,所以才那么快啊”。


“那也可以在硬盘上保存一下啊,遇到这种情况全部从头再来建立缓存,这不浪费时间嘛!”

我点了点头,“让我琢磨一下,看看怎么做这个持久化”。


RDB 持久化


没几天,我就拿出了一套方案:RDB。


既然我的数据都在内存中存放着,最简单的就是遍历一遍把它们全都写入文件中。


为了节约空间,我定义了一个二进制的格式,把数据一条一条码在一起,生成了一个 RDB 文件。

不过我的数据量有点大,要是全部备份一次得花不少时间,所以不能太频繁的去做这事,要不然我不用干正事了,光花时间去备份了。


还有啊,要是一直没有写入操作,都是读取操作,那我也不用重复备份,浪费时间。


思来想去,我决定提供一个配置参数,既可以支持周期性备份,也可以避免做无用功。


就像这样:

save 900 1     # 900秒(15分钟)内有1个写入

save 300 10    # 300秒(5分钟)内有10个写入

save 60 10000  # 60秒(1分钟)内有10000个写入

多个条件可以组合使用,只要上面一个条件满足,我就会去进行备份。


后来我又想了一下,这样还是不行,我得 fork 出一个子进程去做这件事,不能浪费我的时间。


有了备份文件,下次我再遇到崩溃退出,甚至服务器断电罢工了,只要我的备份文件还在,我就能在启动的时候读取,快速恢复之前的状态啦!

MySQL:binlog


我带着这套方案,兴冲冲的拿给了 MySQL 大哥看了,期待他给我一些鼓励。


“老弟,你这个方案有点问题啊”,没想到,他竟给我浇了一盆冷水。


“问题?有什么问题?”


“你看啊,你这个周期性去备份,周期还是分钟级别的,你可知道咱们这服务每秒钟都要响应多少请求,像你这样不得丢失多少数据?”,MySQL 语重心长的说到。

我一下有些气短了,“可是,这个备份一次要遍历全部数据,开销还是挺大的,不适合高频执行啊”。


“谁叫你一次遍历全部数据了?来来来,我给你看个东西”,MySQL 大哥把我带到了一个文件目录下:
mysql-bin.000001
mysql-bin.000002
mysql-bin.000003
···

“看,这些是我的二进制日志 binlog,你猜猜看里面都装了些什么?”,MySQL 大哥指着这一堆文件说到。


我看了一眼,全是一堆二进制数据,这哪看得懂,我摇了摇头。


“这里面呀记录了我对数据执行更改的所有操作,像是 INSERT,UPDATE、DELETE 等等动作,等我要进行数据恢复的时候就可以派上大用场了”!


听他这么一说,我一下来了灵感!告别了 MySQL 大哥,回去研究起新的方案来了。


AOF 持久化


你们也知道,我也是基于命令式的,每天的工作就是响应业务程序发来的命令请求。


回来以后,我决定照葫芦画瓢,学着 MySQL 大哥的样子,把我执行的所有写入命令都记录下来,专门写入了一个文件,并给这种持久化方式也取了一个名字:AOF(Append Only File)。

不过我遇到了 RDB 方案同样的问题,我该多久写一次文件呢?


我肯定不能每执行一条写入命令就记录到文件中,那会严重拖垮我的性能!我决定准备一个缓冲区,然后把要记录的命令先临时保存在这里,然后再择机写入文件,我把这个临时缓冲区叫做 aof_buf。

说干就干,我试了一下,竟然发现数据没有写入到文件中去。多方打听才知道,原来操作系统也有个缓存区,我写的数据被他缓存起来了,没有给我写入到文件中去,这不是坑爹呢嘛!


看来,我写完了还得要去刷新一下,把数据真正给写下去,思来想去,我还是提供一个参数,让业务程序去设置什么时候刷新吧。


appendfsync 参数,三个取值:

  • always:每个事件周期都同步刷新一次。

  • everysec:每一秒都同步刷新一次。

  • no:我只管写,让操作系统自己决定什么时候真正写入吧。


AOF 重写


这一次我不像之前那么冲动,我决定先试运行一段时间再去告诉 MySQL 大哥,免得又被他戳到软肋。


试用了一段时间,各方面都运行良好,不过我发现随着时间的推移,我写的这个 AOF 备份文件越来越大,越来越大!不仅非常占硬盘空间,复制移动,加载分析都非常的麻烦耗时。


我得想个办法把文件给压缩一下,我把这个过程叫做 AOF 重写。

一开始,我打算去分析原来的 AOF 文件,然后将其中的冗余指令去掉,来给 AOF 文件瘦瘦身,不过我很快放弃了这个想法,这工作量实在太大了,分析起来也颇为麻烦,浪费很多精力跟时间。


原来的一条条记录这种方式实在是太笨了,数据改来改去,有很多中间状态都没用,我何不就把最终都数据状态记录下来就好了?


比如:

  • RPUSH name_list 'A'

  • RPUSH name_list 'B'

  • RPUSH name_list 'C'


可以合并成一条搞定:RPUSH name_list 'A' 'B' 'C'.


AOF 文件重写的思路我是有了,不过这件事干起来还是很耗时间,我决定和 RDB 方式一样,fork 出一个子进程来做这件事情。


谨慎如我,发现这样做之后,子进程在重写期间,我要是修改了数据,就会出现和重写的内容不一致的情况!MySQL 大哥肯定会挑刺儿,我还得把这个漏洞给补上。

于是,我在之前的 aof_buf 之外,又准备了一个缓冲区:AOF 重写缓冲区。


从创建重写子进程开始的那一刻起,我把后面来的写入命令也 copy 一份写到这个重写缓冲区中,等到子进程重写 AOF 文件结束之后,我再把这个缓冲区中的命令写入到新的 AOF 文件中。


最后再重命名新的 AOF 文件,替换掉原来的那个臃肿不堪的大文件,终于大功告成!

再三确定我的思路没有问题之后,我带着新的方案再次找到了 MySQL 大哥,我都做到这份儿上了,这一次,想必他应该无话可说了吧?


MySQL 大哥看了我的方案露出了满意的笑容,只是问了一个问题:这 AOF 方案这么好了,RDB 方案是不是可以不要了呢?


万万没想到,他居然问我这个问题,我竟陷入了沉思,你觉得我该怎么回答好呢?


彩蛋“你怎么又崩溃了?”,“不好意思,又遇到 Bug 了,不过不用担心,我现在可以快速恢复了!”。“那老崩溃也不是事儿啊,你只有一个实例太不可靠了,去找几个帮手吧!”


那天,我被拉入一个 Redis 群聊...


那天,Redis 基友群里,许久未见的大白发来了一条消息···

于是,大白拉了一个新的群:

以后的日子中,咱们哥仨相互配合,日常工作中最多的就是数据同步了。

如果主节点有数据写入、删除、修改命令,也会把这些命令挨个通知到从节点,我们把这叫做命令传播。

通过这样的方式,我们主节点与从节点之间数据就能保持同步了!有一次,我不小心掉线了~

我们用上了新的数据同步策略,效率高了不少,就算偶尔掉个线,也能很快把缺失的数据给补上。


就这样过了一段时间···

新添了人手,我们准备大干一场!


为了及时获得和更新主从节点的信息,咱们哨兵每隔十秒钟就要用 INFO 命令去问候一下主节点,主节点会告诉我他有哪些从节点!

为了更加及时知道大家是否掉线,咱们哨兵每隔一秒都要用 PING 命令问候一下群里的各个小伙伴:

如果在设置的时间里没有收到回复,我就知道这家伙多半是跪了,就该启动故障转移了。


不过这只是我的主观意见,光我一个人说了不算,为了防止误判,我还得去管理员小群里征求一下大家的意见:

接下来,咱们就开始了第一次选举。

经过一番努力,我终于完成了故障转移,现在 R2 是主节点了。


不过没过多久,R1 又回来了:

以上就是我们的日常工作了,通过咱们几个小伙伴的齐心协力,构成了一个高可用的缓存服务,MySQL 大哥再也不敢小瞧我们了。

作者:轩辕之风

编辑:陶家龙

出处:转载自公众号编程技术宇宙(ID:xuanyuancoding)


精彩文章推荐:

谁再说Redis慢,我跟谁急!
打工人,支撑亿级高并发的系统长啥样?
明明加了索引,为什么查询还是慢?
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/74983
 
418 次点击