百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Linux缓存机制buffers/cached(linux缓存过大会宕机吗)

ahcoder 2025-06-23 14:24 3 浏览


在Linux 操作系统中,当应用程序需要读取文件中的数据时,操作系统会先分配一些内存,将数据从磁盘读入到这些内存中,然后再将数据发给应用程序;当需要往文件中写数据时,操作系统先分配内存接收用户数据,然后再将数据从内存写到磁盘上。然而,如果有大量数据需要从磁盘读取到内存或者由内存写入磁盘时,系统的读写性能就变得低下。因为无论是从磁盘读数据,还是写数据到磁盘,都是一个很消耗时间和系统资源的过程。

  • 缓存原理:为了提高系统读写性能,内核利用一部分物理内存分配出缓冲区,用于缓存系统操作和数据文件,当内核收到读写的请求时,内核先去缓存区找是否有请求的数据,有就直接返回,如果没有则通过驱动程序直接操作磁盘。缓存优点是减少系统调用次数,降低CPU上下文切换和磁盘访问频率。缓存是内存的一部分,它透明地存储数据,以便将来对该数据的请求可以更快地得到服务。内核利用内存来缓存磁盘数据并提高I/O性能。
  • 缓存机制:Linux引入了buffers和 cached机制,buffers与cached都是内存操作,用来保存系统曾经打开过的文件以及文件元数据,这样当操作系统需要读取某些文件时,首先在buffers与cached内存区查找,如果找到,直接读出给应用程序,如果没有找到需要数据,才从磁盘读取,这就是操作系统的缓存机制,通过缓存,大大提高了操作系统的性能。
  • 目录项和元数据:在介绍buffers和cached不同之前,先解释目录项(dentry),元数据(metadata)概念,Linux文件系统是典型的树状关系,可以在根目录下使用tree命令查看。为了方便查找文件,linux引入目录项(dentry)描述目录与文件的关系树,Linux为每一个目录建立一个目录项,也为每个文件建立一个目录项。一个目录项主要包括文件名和索引节点号,索引节点号是指向索引节点表( system inode table )中对应的索引节点,使用ls -i命令就可以看到当前目录中的目录或文件的名字和索引节点号。目录项结构中包含很多信息,可以建立目录、子目录、文件之间的关系,利用目录项关系,加快文件的查找。在Linux系统中数据可分为两大类,数据和元数据,数据泛指普通文件中的实际数据,元数据是用来描述一个文件的特征的系统数据。为了便于更好的理解数据和元数据,请看下面的例子,使用cat命令查看/etc/hostname文件,显示的内容就是实际数据,使用stat命令查看/etc/hostname,显示的内容就是元数据,包括块大小,文件类型,索引节点号码,访问权限,时间戳等。

[root@linuxabc ~]# ls -i

9605314 doc 25167360 jump 26452260 scripts 4429632 soft 228749 test.txt

[root@linuxabc ~]# cat /etc/hostname

linuxabc

[root@linuxabc ~]# stat /etc/hostname

File: /etc/hostname

Size: 9 Blocks: 8 IO Block: 4096 regular file

Device: fd00h/64768d Inode: 8620417 Links: 1

Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)

Context: system_u:object_r:hostname_etc_t:s0

Access: 2020-12-19 13:52:26.158472928 +0800

Modify: 2020-11-06 13:48:38.917519851 +0800

Change: 2020-11-06 13:48:38.917519851 +0800

Birth: -

  • buffers与cached不同:Buffers是存储在页缓存下的数据的磁盘块表示形式,Buffers包含驻留在页缓存(Page Cache)下的文件/数据的元数据(metadata),通常指的是目录项(dentries)和索引节点(inode)。而cached是用来给文件/数据做缓冲。更通俗一点说,cached里面存储的是数据,buffers里面存储的是数据在磁盘块表示形式。

为了便于更好地理解buffers和cached机制,下面做两个测试:

测试一:执行cat命令查看主机名,第一次查看主机名后,Cached值明显增大了,是因为主机名的数据存入了cached;第二次查看主机名后,Cached值只增加了4kB,且消耗的时间比第一次查看主机名消耗的时间要小的多,是因为直接从cached中读取主机名数据,所以消耗时间变短。

[root@linuxabc ~]# echo 3 > /proc/sys/vm/drop_caches;cat /proc/meminfo |egrep -w 'Buffers|Cached'

Buffers: 108 kB

Cached: 115716 kB

[root@linuxabc ~]# time cat /etc/hostname ;cat /proc/meminfo |egrep -w 'Buffers|Cached'

linuxabc

real 0m0.005s

user 0m0.001s

sys 0m0.003s

Buffers: 108 kB

Cached: 121964 kB

[root@linuxabc ~]# time cat /etc/hostname ;cat /proc/meminfo |egrep -w 'Buffers|Cached'

linuxabc

real 0m0.002s

user 0m0.001s

sys 0m0.001s

Buffers: 108 kB

Cached: 121968 kB

测试二:执行find命令在系统中查找文件fstab,第一次找到文件之后,bfffers的值变大了,这是因为文件的目录项存入了buffers;第二次找到文件之后,buffers的值没变,且消耗的时间要比第一次查找消耗的时间小的多,是因为直接从buffers中找到了文件所在的路径,所以消耗的时间变短。

[root@linuxabc ~]# echo 3 > /proc/sys/vm/drop_caches;cat /proc/meminfo |egrep -w 'Buffers|Cached'

Buffers: 108 kB

Cached: 115720 kB

[root@linuxabc ~]# time find / -name fstab;cat /proc/meminfo |egrep -w 'Buffers|Cached'

/etc/fstab

real 0m7.805s

user 0m0.524s

sys 0m5.360s

Buffers: 1388 kB

Cached: 118172 kB

[root@linuxabc ~]# time find / -name fstab;cat /proc/meminfo |egrep -w 'Buffers|Cached'

/etc/fstab

real 0m1.112s

user 0m0.565s

sys 0m0.529s

Buffers: 1388 kB

Cached: 118172 kB

  • 共享内存段:共享内存段也被视为缓存,尽管它们不代表磁盘上的任何数据。可以使用ipcs -m命令并检查bytes列来检查共享内存段的大小。

[root@linuxabc ~]# ipcs -m

------ Shared Memory Segments --------

key shmid owner perms bytes nattch status

0x301375cf 0 root 640 32768 0

  • 查看cached和buffers大小:通过cat /proc/meminfo命令可以查看cached和buffers的大小,如果系统是RHEL6&CentOS6或之前的版本,可以使用free命令查看cached和buffers大小,但自RHEL7&CentOS7开始,free命令只显示cache/buffer的总和,且cache指的是由page cache和slabs使用的内存,和cached是不同的。

[root@linuxabc /]# cat /proc/meminfo |egrep -w "Buffers:|Cached:"

Buffers: 14648 kB

Cached: 12621116 kB


[root@RHEL6 ~]# cat /etc/redhat-release

Red Hat Enterprise Linux Server release 6.4 (Santiago)

[root@RHEL6 ~]# free -m

total used free shared buffers cached

Mem: 7872 4329 3542 0 380 3053

-/+ buffers/cache: 895 6976

Swap: 6143 0 6143


[root@RHEL7 /]# cat /etc/redhat-release

Red Hat Enterprise Linux Server release 7.8 (Maipo)

[root@RHEL7 /]# free -m

total used free shared buff/cache available

Mem: 15883 2230 383 791 13269 12531

Swap: 2047 1 2046

  • 如果没有剩余的空闲内存,而新进程需要空闲内存,会发生什么情况?

当一个新进程需要内存上的空闲页时,内核将检查是否有任何页在缓存中,相应地内核将通过将文件从缓存同步到本地磁盘来回收空闲页,并为新进程释放内存。

  • 为什么缓存会占用这么多内存?

根据Linux虚拟内存管理机制,这种行为是正常的。要理解为什么缓存会变得如此之高,以及为什么这不是一个问题,就必须了解I/O在Linux上是如何工作的。当用户进程读取或写入文件时,它实际上是在修改主内存中该文件的副本。内核从磁盘创建该副本,并在必要时将更改写回磁盘。这些副本占用的内存称为缓存内存。

每当用户进程启动读或写操作时,都会消耗缓存内存。内核将查找用户正在操作的文件部分的副本,如果没有这样的副本,它将分配一个新的缓存页,并用从磁盘读取的适当内容填充它。如果用户只读取文件,则此页将标记为“干净”缓存页。但是,一旦用户写入文件,页面将被标记为“dirty”。ps中出现的名为pdflush的内核线程将定期唤醒并将所有标记为脏的页面复制回磁盘,然后再次将它们标记为干净。请注意,该页只被重新标记为clean,当它被写回时,它不会被释放,而是被保留起来,以防有人想对它缓存的文件部分执行进一步的IO操作。

缓存页只有在内核需要内存用于其他操作时才会再次释放。因为已经从磁盘读取缓存页可以加快I/O,而且由于清除干净的缓存页与分配空闲页一样容易,而且由于空闲页对系统的性能和功能没有任何帮助,因此没有理由将缓存页转换为空闲页。如果内存充满了缓存页,下一次内核需要内存时,它将简单地逐出最近最少使用的干净缓存页并重新使用它们。

  • 如何进行手动 buffer/cached回收?

系统在内存使用达到一定阀值的情况下会自动启动回收机制回收buffer/cached,也可以进行手动的buffer/cached回收,由于buffer/cache主要是用于文件的读写使用,所以进行文件回收时,一般常伴随系统的I/O繁忙,因为系统会将缓存数据写回磁盘。

警告:红帽不建议在产品环境手动释放缓存,因为在实践中发现可能会出现系统挂起现象,手动释放缓存只能临时的屏蔽系统中出现的缓存占用内存过大现象,没有去查找根本原因,并解决问题。

将内存中数据强制先刷新到磁盘中:

sync; sleep 3; sync

清理缓存:

echo 3 > /proc/sys/vm/drop_caches 表示清除pagecache和slab分配器中的缓存对象

echo 1 > /proc/sys/vm/drop_caches:表示清除pagecache。

echo 2 > /proc/sys/vm/drop_caches:表示清除回收slab分配器中的对象(包括目录项缓存和inode缓存)。slab分配器是内核中管理内存的一种机制,其中很多缓存数据实现都是用的pagecache。

  • 如果buffers/cached过高,如何排查哪些进程引起的?

通过hcache和lsof命令我们可以找到引起缓存过高的进程,但是hcache命令不是系统预安装命令,可以从网上直接下载hcache或下载hcache的源码包编译安装后使用,对于产品环境,从安全的角度考虑,建议先在测试环境从github下载hcache的源码包编译生成hcache命令,然后再拷贝 hcache命令到产品环境使用。

hcache编译安装方法如下:

git clone https://github.com/silenceshell/hcache.git

cd hcache

make build

sudo cp hcache /usr/local/bin/

使用hcache和lsof命令查找引起缓存过高的进程示例如下:

[root@linuxabc ~]# hcache -top 3

+---------------------------------+----------------+------------+-----------+---------+

| Name | Size (bytes) | Pages | Cached | Percent |

|---------------------------------+----------------+------------+-----------+---------|

| /var/lib/sss/mc/initgroups | 11567160 | 2825 | 2825 | 100.000 |

| /var/lib/sss/mc/passwd | 9253600 | 2260 | 2260 | 100.000 |

| /usr/lib64/libmozjs-60.so.0.0.0 | 23727992 | 5793 | 1776 | 030.658 |

+---------------------------------+----------------+------------+-----------+---------+

[root@linuxabc ~]# hcache -top 3 --bname

+----------------------+----------------+------------+-----------+---------+

| Name | Size (bytes) | Pages | Cached | Percent |

|----------------------+----------------+------------+-----------+---------|

| initgroups | 11567160 | 2825 | 2825 | 100.000 |

| passwd | 9253600 | 2260 | 2260 | 100.000 |

| libmozjs-60.so.0.0.0 | 23727992 | 5793 | 1776 | 030.658 |

+----------------------+----------------+------------+-----------+---------+

[root@linuxabc ~]# lsof /var/lib/sss/mc/initgroups

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME

sssd_nss 1337 root mem-w REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

sssd_nss 1337 root 20uw REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

sshd 57738 root mem REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

sshd 57738 root 3r REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

sshd 57756 root mem REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

sshd 57756 root 3r REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

dbus-daem 57780 root mem REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

dbus-daem 57780 root 7r REG 253,0 11567160 17353855 /var/lib/sss/mc/initgroups

  • 使用free命令查看内存使用情况时需要注意的问题:应该更关注的是可用内存的大小,而不是实际物理内存剩余多少。从Linux缓存机制来说,buffers和cached都是系统可用内存,通常情况下看到bufferes和cached占用内存多,这是一个正常现象,它不是一个问题,所以在看到物理内存快要耗尽时,不要惊慌,因为系统在需要时会自动回收buffers和cached占用的内存。

#LinuxABC#

相关推荐

卡巴斯基实验室成功将Linux系统的驱动程序移植到“KasperskyOS”

据os.kaspersky.com网站8月8日报道,俄罗斯卡巴斯基实验室启动了一个研究项目,将Linux驱动程序移植到卡巴斯基公司自主研发的操作系统KasperskyOS——这是该实验室创建的“安全...

服务器程序从 Windows 系统移植到 Linux/x86_64 平台时总是崩溃?

清华大学出版社的《高效C/C++调试》一书给出了回答:我们的服务器程序最初是为Windows系统开发的,第一次将它移植到Linux/x86_64平台时,它在回归测试中十次会崩溃八次,且仅在...

Linux系统的移植和裁剪(linux移植lvgl)

本节将嵌入式Linux系统按需求裁剪后移植到ARM处理器中。通过对Linux系统的了解和认识,我们在这里选择Linux4.1.15版本,该版本支持64位处理器,相对于前面几代Linux版本有了更大的提...

搭建RISC-V模拟环境(搭建虚拟环境)

现在RISC-V在主流操作系统上基本都能模拟了,不过我还是觉得Linux下好用。之前在Mac上想用Linux,基本就是在VirtualBox上创建一个虚拟机,从网上下一个Ubuntu的安装iso,安...

CPU虚拟化:陷入和模拟(cpu虚拟模式是什么)

导读:本文摘自于王柏生、谢广军撰写的《深度探索Linux系统虚拟化:原理与实现》一书,重点讨论了虚拟CPU在Guest模式下运行时,由于运行敏感指令而触发虚拟机退出的典型情况。作者:王柏生、谢广军来源...

《模拟山羊》恶搞僵尸主题DLC公布 《DayZ》躺枪!

近日,开发商CoffeeStain为我们带来了一个好消息,那就是奇葩游戏《模拟山羊(GoatSIMulator)》僵尸主题DLC“GoatZ”将于5月7日登陆PC,Mac,Linux,iOS和安卓...

「精品课程」模拟IC设计进阶(模拟ic设计师怎么样)

课程导语模拟集成电路设计最重要的是基础理论知识,基础理论的重要性很多人一开始并没有意识到,工作一段时间,做过几个项目以后就会深有感触。除此之外就是个人的学习能力和分析问题、解决问题的能力,其实这些能力...

跨平台神器:在Linux上轻松运行Windows软件的方法大揭秘!

Wine始于30年前的一个业余爱好项目,当时Windows3.1及其16位API出现了。在一个简单的“HelloWorld”程序之后,它很快就成功地让Solitaire运行起来。...

LAMMPS 模拟教程全新发布,助力科研入门分子模拟世界

https://arxiv.org/html/2503.14020v1本研究发布了8个层层递进的LAMMPS模拟教学教程,并配套开发了专属图形界面LAMMPS–GUI,显著降低了分子模拟的入门门槛。...

Linux趣味命令,每一个都能产生炫酷效果(示例)

Linux趣味命令,每一个都能产生炫酷的效果:cmatrix:模拟《黑客帝国》中的字符矩阵效果。bashCopycodecmatrixfortune:随机显示一句有趣的引语或笑话。bashCopy...

「免费!免费!Chris老师经典模拟课程」CMOS模拟电路设计流程

创芯大讲堂为广大学员发福利各位创芯大讲堂的同学们,即日起,凡当月购买大讲堂课程达到300元的同学可以享受创芯大讲堂全场课程8折优惠,凡当月购买创芯大讲堂课程达到500元的同学可以享受创芯大讲堂全场课程...

Gromacs基本模拟流程(gromacs运行命令)

GROMACS是一个使用经典分子动力学理论研究蛋白质动力学的高端的高效的工具。GROMACS是遵守GNU许可的免费软件,可以从以下站点下载:http://www.gromacs.org,并且可以在l...

国外友人开创Python模拟登陆神库,完美修改它为咱们所用

Awesome-python-login-model是一个国人开发的模拟登陆仓库,在这个仓库上有20几个网站的模拟登陆脚本,你可以基于这个仓库实现的代码做简易的修改,以实现自己的自动化功能。仓库地址...

并发模拟的四种方式+工具,超级实用

原文链接:https://mp.weixin.qq.com/s/jJDJ8YwmzkKS9KvfMamLWA一、PostmanPostman是一个款http请求模拟工具首先演示一下postman最基本...

精选模拟IC设计仿真课程(精选模拟ic设计仿真课程怎么样)

课程介绍本系列课程采用屏幕录制视频及操作解说的形式,注重于模拟芯片设计流程中的电路原理图设计、仿真及优化方法、版图设计、寄生参数提取及后仿真优化等的实际操作,在电路设计过程中学习模拟IC设计和验证方法...