为什么固态硬盘需要TRIM?

硬盘是电脑上不可或缺的存储设备,我们知道传统的机械硬盘里面有一组高速旋转的盘片,由于盘片的转速存在物理瓶颈,因此要进一步提升速度已经非常困难,而固态硬盘(Solid-State Drive; SSD)的出现则突破了传统硬盘的瓶颈,它依靠闪存芯片来存储数据,工作稳定、无噪音、耗电少,随着成本的下降,大有取代传统硬盘的势头,比如现在苹果的Macbook笔记本已经全面标配SSD,微软的Surface系列电脑也同样标配SSD。网上有很多文章说,SSD和传统硬盘不同,它不需要碎片整理,但是需要操作系统支持TRIM,否则用一段时间之后SSD的性能就会下降,而且还会影响寿命。那么TRIM到底是什么东西,为什么SSD需要TRIM而传统硬盘却不需要呢?

磁盘、数据和文件系统

要回答这个问题,我们得先了解一下我们的数据是如何存储的。我们知道,存储设备(无论是SSD还是传统硬盘)只负责最底层的物理存储,并不知道所存储的数据到底有什么意义,反正操作系统让我读或写什么数据我照办就可以了,就好像一个仓库里面有好多库位,存储设备只负责把东西放到指定的库位,或者把东西从指定的库位拿出来,至于这个东西是属于哪张订单的,是要发给谁的,存储设备并不关心。但是我们在电脑上看到的可不是毫无组织的数据,而是一些有组织的结构,例如分区、目录和文件,把数据组织起来并进行管理的工作是由操作系统负责的,而操作系统组织和管理这些数据的规范,叫做“文件系统”。文件系统就像一张仓库的收发货管理表,它负责管理这些库位的逻辑意义,比如说15、28、55这三个库位的东西是属于同一张订单的,订货人是张三,这三个库位在物理上并不连续,但通过管理表我们就能够把它们关联起来。不同的操作系统所采用的文件系统有所差异,例如较古老的FAT16/32、Windows的NTFS、OS X的HFS+、Linux的ext(ext2/3/4)等等。总结一下,我们需要保存的文件首先会交给操作系统,操作系统根据文件系统所规定的格式将这些数据组织起来,然后交给存储设备进行保存。

闪存的困扰:写入放大

现在我们所使用的大部分文件系统,都是从磁盘存储(软盘、硬盘)时代就开始存在的,因此它们的设计也是以磁盘存储的原理为基础的,但SSD采用的是闪存,由于物理原理存在差异,因此传统的磁盘文件系统用在闪存上,就可能会产生一些问题,其中最大的一个问题就是“写入放大”(write amplification)。举个例子,在大部分磁盘文件系统中,当我们需要删除一个文件时,操作系统只要将该文件所对应的所有数据块在文件系统中标记为“空闲”就可以了,根本不需要实际去清除数据块中存放的数据,因为这样做没有意义,这也就是为什么我们一眨眼的时间就可以删除一个很大的文件。也就是说,尽管用户看起来文件被删除了,但实际上它的数据还留在存储设备中,只不过操作系统认为这些数据已经作废了,下次有新数据的时候直接覆盖掉它们就好了。

现在问题来了,这样的设计必须建立在一个前提下,即对于物理存储设备来说,“写入空白数据块”和“覆盖已有内容的数据块”所需要的操作是完全相同的。上述前提对于磁盘来说是完全成立的,因为磁盘的工作方式跟磁带差不多,数据的记录是根据介质上某个记录单元的磁化方向来完成的。也就是说,在写入数据时,磁头只要将指定的记录单元(扇区)磁化为所需的状态即可,完全不必关心这个单元原本是怎样的状态。然而,上述前提在SSD上却是不能成立的。因为在SSD中,只有空数据块才能直接执行写入操作;而对于非空数据块,需要先执行擦除操作之后才能进行写入。

乍看之下,SSD和传统硬盘的区别仅仅是多了一步擦除操作而已,但实际上并非如此,更要命的还在后头。在SSD中,数据存储的最小单位是页面(page),一个页面的大小一般是4KB,若干个页面又被组合成块(block),一个块的大小一般是256KB。由于硬件方面的限制,SSD可以单独对某个页面进行读/写的操作,但擦除操作却只能对整个块进行,也就是说,一旦擦除就必须一次性擦除整个块。现在问题来了,如果一个页面里面已经有数据了,就无法直接写入新数据,但如果要擦除这个页面,就得把整个块全都擦除,那么这个块里面其他页面中的数据也跟着一起擦掉了,这可怎么办?


现实中,如果操作系统要让SSD改写某个页面的数据,SSD需要执行这样的操作:

  1. 1. 将要改写的目标页面所在的整个块的数据读取到缓存

  2. 2. 在缓存中修改目标页面的数据

  3. 3. 对整个块执行擦除操作

  4. 4. 将缓存中的数据重新写入整个块中

这就意味着,如果我要修改1个页面,就必须把整个块都折腾一遍,实际上相当于写入了64个页面的数据——实际搬运和写入的数据量远远超过了需要写入的数据量,这就是“写入放大”。我们可以看出,写入放大不仅影响了SSD的写入性能,而且还增加了SSD中闪存芯片的“磨损”,缩短整个SSD的使用寿命。

TRIM是为了让操作系统和SSD更好地沟通

对于写入放大,SSD表示一个巴掌拍不响,这不都是我的问题,因为一块数据在逻辑上有没有被删除只有操作系统才知道,SSD本身是不知道的——你看,很多问题其实都是因为沟通不畅而产生的。于是,一些SSD在控制芯片中提供了一个TRIM命令,操作系统在删除文件时,顺便向SSD发送TRIM命令告诉它哪些数据块中的数据已经不再使用了,SSD在收到TRIM命令后,通常会在定期的垃圾收集操作中重新组织这些区块,为将来写入数据做好准备——有了TRIM,SSD就能够更好地与操作系统相互配合了。尽管每一款SSD在硬件层面对TRIM命令的执行机制都不尽相同,但无论如何,通过TRIM能够显著改善SSD的性能和寿命。当然,大家可能也已经发现了,有了TRIM之后,删除的文件数据会被SSD自动回收,这意味着以往在传统硬盘上能够使用的一些数据恢复(反删除)软件,在SSD上可能就不再管用了。

既然TRIM如此重要,那么应该如何启用呢?一般来说,只要你所使用的操作系统支持TRIM,就无需任何额外的操作。支持TRIM的操作系统:Windows 7及后续版本、OS X 10.6.8及后续版本、Linux内核版本2.6.33及后续版本。对于Windows XP用户,系统不支持TRIM,可以选择SSD厂商(如Intel)提供的软件来实现定期的垃圾回收,模拟TRIM的效果。

治标还要治本:闪存文件系统

大家可能已经发现了,TRIM实际上只是一个“治标”的办法,其实产生写入放大等问题的根本原因在于现有的文件系统是磁盘存储时代的产物,并不完全适用于闪存,因此如果要“治本”,就必须开发出适合闪存的文件系统,也就是“闪存文件系统”。闪存文件系统能够让操作系统更好地控制和管理SSD等闪存存储设备,除了能够有效避免写入放大之外,闪存文件系统还有一些其他的设计,例如磨损均衡和随机优先等,这些设计都是基于闪存所独有的物理特性而来的,因此可谓是“量体裁衣”。尽管从目前来看,由于兼容性等一些原因,闪存文件系统还没有得到普及,但随着今后闪存存储设备越来越多,用闪存文件系统来代替传统的磁盘文件系统应该说是一个必然的趋势。