[原]模拟说明du与df 结果不一致的问题

常用Linux 等类Unix 平台的用户都可能会发现，du与df 的经过经常会不一致。其中，最常见的情况是，df 显示的已使用磁盘占用率比du 统计出来的结果要大很多。原因，主要是由于两者计算结果的方式不同。为了更清楚的说明问题，我下面做了一个简单的模拟实验。

一、实验情况
1、创建并删除文件
创建文件前的磁盘容量情况：

引用

# df -h
文件系统              容量  已用可用已用% 挂载点
/dev/sda1              12G  5.7G  5.5G  51% /
tmpfs                 506M     0  506M   0% /dev/shm

创建文件：

引用

# dd if=/dev/zero of=test.iso bs=1024k count=1000
1000+0 records in
1000+0 records out
1048576000 bytes (1.0 GB) copied, 14.3055 seconds, 73.3 MB/s

现在的磁盘情况：

引用

# df -h
文件系统              容量  已用可用已用% 挂载点
/dev/sda1              12G  6.7G  4.6G  60% /
tmpfs                 506M     0  506M   0% /dev/shm

模拟某个进程正在使用该文件：

# tail -f /tmp/test.iso

2、删除该文件
打开另一个终端，登陆到系统中。
查看是否有进程正在使用上面创建的文件：

引用

# lsof |grep test.iso
tail 2175 root 3r REG 8,1 1048576000 752972 /tmp/test.iso

把该文件删掉，并确认：

引用

# rm /tmp/test.iso
rm：是否删除一般文件 “/tmp/test.iso”? y
# ls /tmp/test.iso
ls: /tmp/test.iso: 没有那个文件或目录

查看是否还有进程在使用（注意结尾的标记）：

引用

# lsof |grep test.iso
tail 2175 root 3r REG 8,1 1048576000 752972 /tmp/test.iso (deleted)

查看磁盘使用情况：

引用

# df -h
文件系统              容量  已用可用已用% 挂载点
/dev/sda1              12G  6.7G  4.6G  60% /
tmpfs                 506M     0  506M   0% /dev/shm
# cat /proc/diskstats |grep sda1
   8    1 sda1 54385 5184 1626626 130090 20434 635997 5251448 5345733 0 111685 5475829

可见，虽然从ls 已经无法找到该文件，但因为tail 进程仍在使用该文件，故实际上内核并没有把这文件所占用的空间释放出来（df 的结果）。

3、停止相关进程
回到第一终端，用Ctrl+C 终止tail 进程，查看结果：

引用

# df -h
文件系统              容量  已用可用已用% 挂载点
/dev/sda1              12G  5.7G  5.5G  51% /
tmpfs                 506M     0  506M   0% /dev/shm
# cat /proc/diskstats |grep sda1
   8    1 sda1 54473 5184 1627402 130617 20453 636042 5251960 5345756 0 112226 5476379

至此，文件所占用的空间已完全释放。

二、说明
从上面的实验，可得出一些情况：

引用

1、若有进程在占用某个文件，而其他进程把这文件删掉，只会删除其在磁盘中的标记，而不会释放其占用的磁盘空间；直到所有访问该文件的进程退出为止；
2、df 是从内核中获取磁盘占用情况数据的，而du是统计当前磁盘文件大小的结果，由于磁盘标记已被删掉，因此du 不会计算上述被删除文件的空间，导致df 与 du的结果不一致。

三、解决问题
通常的解决方法有两个：
1、把占用文件的相关进程关闭
这可通过下面的命令得到这些已被删除，但未释放空间的文件和进程信息：

# lsof |grep deleted

找到这些进程后，在安全的情况下把其关闭，空间自会马上释放。

2、以清空的方式替代删除
归根到底，产生问题的原因是，访问该文件的文件指针（句柄），在rm 动作后，因为进程仍在访问，因此，仍处在文件里面（中间或结尾处）。所以，如果用清空的方式，把文件指针重置，该文件所占用的空间也会马上释放出来。

引用

# echo > /tmp/test.iso
# df -h
文件系统              容量  已用可用已用% 挂载点
/dev/sda1              12G  5.7G  5.5G  51% /
tmpfs                 506M     0  506M   0% /dev/shm
# tail -f /tmp/test.iso
tail: /tmp/test.iso: file truncated

所以，对于常发生类似问题的文件，如：日志记录文件等。以改名、清空、删除的顺序操作可避免问题。

四、补充
除rm外，有些不明显的操作，也会产生类似的问题。
例如 gzip 命令，其对某个文件xxx.log进行压缩时，会产生一个新的xxx.log.gz文件，完成后，会把原来的xxx.log删除。
这时，若仍有进程在使用xxx.log文件，那么，实际上，该文件还是只会标记为deleted，其空间也不会释放，问题与上面提到的情况是相同的。所以，在编写脚本时，可先判断是否仍有进程正在使用该文件，然后再进行gzip 操作。

[转]使用ext3grep恢复ext3上删除的文件

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/103960.html

[原]模拟说明du与df 结果不一致的问题

相关推荐

发表回复