突破即将来临,固态硬盘将不再与“短命”画上等号,一种新型技术将令闪存的P/E寿命突破1亿次;突破即将来临,当前1Tbit/in2的存储密度在它面前将显得不值一提,5.5PB/mm3的存储密度将把存储容量推上一个新的高度。接下来,就请抛开你的传统思维,和我们一起来认识这两种刚刚面世的新型存储技术。
你心目中的完美电脑是怎样的?强大的处理器运算能力,可以在高画质、视网膜分辨率下流畅运行《孤岛危机3》的3D性能,这些都没错,但高效的存储能力也是必不可少的,毕竟越快的文件传输速度,越短的软件启动时间可以有效地提高人们的工作效率。而高效的存储能力就等价于要求存储器能够同时提供超低的响应延迟,超快的传输速度,超大的存储容量,并具备经久耐用的特性。很不幸,这种理想中的存储器目前在个人电脑上却很难看到。在很长时间内,人们使用的都是基于温彻斯特结构设计的机械硬盘,其200MB/s以内的连续读写速度,不到2MB/s的随机4KB小文件读写速度,超高的访问延迟令外部存储器成为制约计算机性能提升的主要瓶颈。近年来,随着固态硬盘的登场,存储器的传输速度、访问延迟均得到大幅改善,但由于闪存颗粒的先天技术特性所致,其主流产品的P/E(编程/擦除)寿命仅有数千次左右。对于比较在意可靠性、使用寿命的用户来说,固态硬盘也难挑大梁。因此就如开头所说,现在我们很难找到一种在各方面都有完美表现的存储器。不过随着以下两种技术的问世,以及后续实用化、商业化工作的开展,存储产品将很可能迎来一次革命,一次质的提升。
如果只从性能上来看,毫无疑问,固态硬盘是传统机械硬盘好的继任者。但在早期,由于固态硬盘往往使用成本高昂的SLC闪存,因此其售价高高在上,导致它只能成为少数人的专享。现在为了帮助固态硬盘进入主流市场,半导体厂商开始采用不同于传统SLC结构的MLC乃至TLC结构的闪存。这三种结构的差异在于,SLC在一个存储单元里面只保存1位数据,而MLC保存两位,TLC保存三位。这也就是说,搭建同样容量的存储器,MLC结构只需要SLC结构二分之一的晶体管数量,成本降低到原来的三分之一,而TLC结构只需要三分之一的晶体管数量,成本更减少到原来的五分之一。尽管成本下降使得产品更加亲民,但是闪存的P/E(编程/擦写)寿命一直是徘徊在用户心头的隐忧。SLC结构的闪存可以达到10万次P/E寿命,而常见于主流商业产品中的MCL颗粒仅有3000~5000次P/E寿命,TLC更是只有500~1000次。P/E(编程/擦写)寿命的存在使得固态硬盘的接受度受到直接打压,厂商不得不持续改进闪存颗粒使用调度算法,在各个寿命有限的存储单元之间分摊负载。为了更好地解决擦写寿命的问题,来自台湾旺宏电子公司的工程师们研发出了一种能够让闪存存储单元自我修复,从而延长闪存使用寿命的技术。
为了明白这个自我修复技术的工作原理,让我们先来看看闪存如何保存数据。闪存由双层浮空栅MOS管组成,每个MOS管上方都有一个栅极,栅极下方有一个不导电的氧化层。如果在栅极上外加一个足够高的电压,就可以建立一个强大的电场,帮助电子击穿栅极下方的氧化层,进入氧化层下方的浮栅之中,这个步骤称之为“隧穿”。在浮栅下方还有一个氧化层,如果移除栅极上外加的电压,电子就可以保留在浮栅当中,这也就是数据能在失去电力的情况下被保存下来的原因。由于整个过程中没有机械动作,只有电子的高速运动,闪存与SSD获得了宝贵的低延迟优势,但是这也带来了擦写寿命的问题。氧化层由基本的原子组成,每一次的隧穿过程都会对氧化层带来损伤,直到氧化层的原子键被彻底破坏,本来应该穿越进入浮栅的电子可能会被氧化层捕获。对于SLC结构来说,由于每个存储单元只保留一位信息,所以只需要维持“高”与“低”两种电压状态,高低电压之间留下的冗余空间较大,氧化层耐受能力强。而MLC的每个存储单元保存两位信息,需要四种电压状态,冗余空间减少,耐受能力下降,TLC在MLC的基础上进一步增加了电压状态,耐受能力差,非常容易导致氧化层被损坏。
不过人们发现,这种氧化层损伤是可以修复的,但不幸的是修复需要“上火”,即把整个芯片放在250℃高温环境下加热几个小时。显然这种高温环境在我们目前的PC或者手持计算设备上无法实现,而旺宏电子的工程师们从相变RAM存储器中获得了灵感。在相变RAM中,数据被存储在一种叫做硫化玻璃的材料里,硫化玻璃薄膜在通电时会发热,材料的内部结构可以在晶体与非晶体之间转化,电阻值因此发生改变,实现导电与绝缘的两种状态。工程师们将这种材料作为加热器引入了NAND闪存存储单元,设计了一种新型元件,使得电流通过栅极时能够产生800℃左右、可维持几毫秒的热脉冲。这个热脉冲的导入引发了神奇的效果,闪存存储单元在工作的同时能够修复自己的氧化层损伤,在P/E次数超过1亿次之后仍然能够保存数据。同时,工程师还发现,加热后还可带来更快的数据擦除速度,从而提升闪存的传输速度。
存储密度对比,蓝色标识的是目前的主流技术,紫色与红色是目前仍处在研究阶段的技术,“Thiswork”代表DNA存储技术。
不利的一面是该技术会带来功耗与发热量的提高,使用这种闪存可能导致手机电池消耗更快。为了降低功耗和发热,存储单元的控制器需要节制加热的次数和范围,做到“既让马儿跑,又让马儿少吃草”的效果。从目前公开渠道能够获取的信息来看,这是一个能够在较短时间内投入运作的技术突破。旺宏电子目前已经打算开始利用这一新型技术,但是还不清楚具体如何利用,也并不清楚何时能够量产。如果这项技术能够从企业实验室走进工厂,并且设计的量产版本能够成功兑现学术会议中提及的数据,就能为闪存市场、固态硬盘带来相当有意义的重大突破。
当然,作为元器件级别的改良,闪存自修复技术并没有彻底解决固态硬盘容量不足以与传统机械硬盘抗衡的问题,使得用户在未来很长的时间内,仍然不得不在容量与速度之间做出痛苦的权衡。那么有没有这样一种存储器,能够实现远远超过传统机械硬盘的存储容量,具备超高的存储密度呢?答案是有的,但这项技术正“躺”在看似与计算机并不相关的生化实验室里。
在提高存储密度和存储容量方面,哈佛大学医学院的乔治·丘奇教授及其同事所做的研究工作可以作为代表。近期,他们以《DNA中的下一代数据化存储》为标题,在殿堂级学术杂志《自然》上发表了两页简讯,虽然其正文长度尚不到一页,但仍旧引发了广泛关注。这种DNA存储技术一口气将数据存储的理论极限密度推高了几个数量级,据计算1克重量的单链D N A能够存储455E B的数据(注:1PB=1024TB,1EB=1024PB),这意味着当下全球互联网的通信线路中流动的数据可以全部存储在1克DNA里面。
事实上对DNA分子用于计算领域的研究至少在20年前就已展开,科学家们很早就意识到DNA与现在广泛应用的磁介质、半导体存储器具备相似特点。DNA有G(鸟嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四种碱基,共同构成了相互缠绕的双链阶梯状的螺旋结构。通过这四种碱基不同顺序的编码,存储了生物所有的遗传信息。而这四种碱基在存储二进制信息时,也可以得到类似的利用。例如A-T,C-G两种碱基对可以分别用来表示0与1,同时,碱基序列也是顺序编码,也有特定的标志来标识有效信息的开头和结尾。如果能够利用生化领域成熟的技术,让各种生化酶与DNA进行反应,就可以进行DNA的复制、修剪,进而实现数据的读写和修改。
那么DNA存储是怎样实现数据读写的呢?我们需要一点儿高中生物知识。一段DN A序列和硬盘上存储一连串0和1的磁性介质在基本组织形式上有类似的地方,DNA开头一小段碱基序列可以充当索引地址。这一段作为地址的DNA序列之后跟着一个特殊的标识,表示地址字段此结束,紧接着是数据字段。在读取的时候,我们需要使用一段单链引物,这一段单链引物碱基序列能够和需要读取的那一段DNA上存储的碱基地址形成互补。因此这段引物若是和某段DNA的地址成功互补,也就代表了数据检索的命中,接着DNA聚合酶根据事先定好的位点开始延伸这段单链引物,对于被读取DNA上数据字段的每一个碱基,DNA聚合酶都会在这段引物上连接一个配对的碱基,这个过程实质上就是对数据的读取,将这段聚合完成的新碱基序列与被读取DNA分离开后,读取操作就完成了。写入操作与此类似,首先进行一个DNA地址的匹配,然后找到事先设定好的位点,用核酸内切酶从这个位点开始将旧的碱基序列切开,再用核酸外切酶进行降解,然后从引物序列开始按照引物上搭载的新数据重新聚合一段新的碱基序列,就完成了写入操作。
“今后,拇指大小的生化芯片就能存下整个互联网的信息。” 乔治·丘奇教授向记者如此说道。
由于无损读写较长的DNA序列特别困难,在1988年时进行的大DNA存储项目也只不过成功储存了7920bit的信息,而丘奇教授团队的工作为萌芽阶段的DNA存储技术注入了一针强心剂。他们使用了新的编码,合成、检测技术,将一本教科书的电子版内容转换成53426个单词,11幅JPG图片,1段Java Script程序,随后编码为5.27Mb的数据。这些数据被切分为54898个159nt寡核苷酸进行存储,其中96nt保存数据,19nt保存地址以便索引。整个保存过程中只有10bit信息出现错误,取得了长足进步。
不过DNA存储技术距离商业化仍有相当遥远的距离。首先操控整套DNA生化反应的设备成本就高得惊人,据估计这类设备成本会以每年5倍~12倍的速度下降。此外DNA存储操作的高延迟、缺乏通用的可编程支持等缺陷决定了它在可以预见的一段时间里无法装进普通PC或者手持移动计算设备,而只能进行一些特殊场合下的数据存储,例如配合进行中的人类基因组计划,进行基因信息的保存等等。总体来看,DNA存储的蓝图能否变成大规模应用的现实还需要时间检验。
虽然从原理上来看,这两种技术可以说毫不相干,大相径庭,但它们却很可能为整个存储产业,以及人类的科技发展带来很大的改变。毫无疑问,当自我修复式闪存问世后,固态硬盘将一改以往的缺点,在使用寿命上获得极大提升。而且更为重要的是,这是一种相当接近实用化的技术。根据本刊从上游厂商获得的信息来看,相变技术将在1~2年内走向完全成熟、稳定。这也就意味着,在并不长的时间内,该技术就能投入使用,固态硬盘就将迎来质的飞跃。同时,对于存储产业来说,固态硬盘也将不再只是新技术来临前的一个“短命”过渡品,包括传统一线机械硬盘厂商在内的更多厂商可能会更加重视、研发固态硬盘,令它的性能更上一层楼。稳定、可靠的高速存储时代即将来临。
而对于DNA存储技术来说,虽然它离普通消费者距离很远,但对于人类科技发展来说却有非常重要的正面意义。首先这并不是一个海市蜃楼般的技术,根据本刊了解的新信息,随着DNA编码、测序技术的成熟,该技术的使用成本已开始逐步下降,离商业化应用越来越近。其次惊人的保存密度、保存时间(在适当的条件下,可保存时间长达数十万年)也将为人类进行更多的科技应用创造了条件。DNA存储技术、DNA计算机等生化技术或将成为人类提升超级运算性能的一个新的突破点。