蓝光存储基本结构_蓝光存储优缺点及应用
随着科技进步和信息化的普及,越来越多的人选择了电子办公,这意味着传统的纸质资料大都被电子文档取代。相比于传统纸质资料只能个人保存的特点,有关电子文档的存储则显得多元化,在很早之前就出现了一种“新”形式——云服务。云服务自出现之初,便吸引了很多的使用者,免费赠送的超几十GB甚至上TB的容量着实比个人花很多钱购买U盘或移动硬盘实在。然而也有很多人心里产生了疑问:为什么网络云盘的价格那么便宜,个人存储和云服务哪一个更靠谱呢?
首先我们要清楚云服务归根结底依旧是实物存储,只不过是存储器不在我们个人手中。用户通过互联网向云端发送所要存储的数据,云端服务器通过整合存储到提供商的实物存储器中。然而,不同于个人存储器的是,云服务存储是需要整合的,也就是说,对于一些公共资料如论文等内容,就大多存储在公共云内。而有关财务报表和方案计划等,用户可以选择私有云。其次,云服务作为互联网时代的产物,面临互联网病毒的威胁是无法改变的事实。因此,一旦大面积爆发某类计算机病毒或某些黑客耗尽心力攻入云服务提供商的网络以谋取私利,那么后果将不堪设想。
然而云服务并非一无是处,或者说云服务也是相对安全的。因为现在各大云存储器提供商都有完善的防火墙以防止网络入侵事故的发生。就目前来看,云服务事故大多是由于云服务系统升级导致的数据丢失,而少有发生数据泄露的情况。
综上,在便捷方便的强大优势面前,我们不妨选择将一些非私密的文件存储在云服务器上,而有关私密的或过于重要的文件存储在个人存储器。-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------我们一般接触到的存储是机械硬盘HDD或固态硬盘SSD,其实还有磁带库、蓝光等海量存储介质,比如Facebook--脸书数据中心就采用了蓝光存储。
阿呆最近在脸书微信群看到一个华录蓝光存储的PPT,摘录出来分享给读者。
一个DA-BH7010蓝光存储机柜最大容量为1.64PB,机柜的基本结构如下图,上面是6个6U的光盘单元,最底下是电源和控制服务器。
蓝光存储基本结构
看看蓝光存储的基本结构,如下图,左边是光盘匣,右边是光驱阵列,下面是机械手,最后以SAS接口连到服务器,包含了RAID和机械手控制器以及驱动。
上层系统
以各光盘匣为单位进行管理→容量为3.6TB
将光盘匣分为2组(6张碟片为一个单位),送入光驱
光驱系统,6台光驱为一组,使用RAID0/5/6,刻录读取数据
【特点】
以光盘匣为单位进行数据的刻录、读取。
可以保证高传输速度、RAID冗余、离线管理等。
刻录数据较大时,可以使用Reed-Solomon。数据小时,因为在传输速度上没有优势,所以采用方案1的方式,光驱的效率更高。
【优势/不足】
以光盘匣为单位管理数据。使用RAID保护数据。可以进行离线管理。
若要实现设备间的冗余,需要镜像处理,所以系统成本提高。
另一种模式就没有RAID了,光驱分别控制。
上层系统
以各碟片为单位进行管理→容量为300GB
根据需要,将碟片送入光驱
以光驱为单位进行控制、数据的刻录与读取
【特点】
以碟片为单位进行数据的刻录、读取。虽然能够有效的使用光驱,但是传输速度下降。
Reed-Solomon分割的数据,刻录在不同的碟片中。
各碟片放置在不同的机柜中,即使设备本身出现问题,也能正常读取数据。
如果各碟片放置在不同的数据中心,即使一个数据中心出现问题,也不影响数据的正常读取。
【优势/不足】
可以实现设备间冗余,数据中心间冗余。
因为搭载多个光驱,文件大小可以满足多个用户同时访问的要求。
离线管理困难。
最后一种模式是最上层做成NAS、对象存储。
上层系统
以卷为单位进行管理→容量可调
将光盘匣分为2组(6张为一个单位),分割至每个卷使用
采用NAS、ObjectStorage的刻录读取方式,可以进行文件的访问
【特征】
有NAS、对象存储等接口,与现存系统的连接性高。可以与普通的ISV相连接。
因为以光盘匣为单位进行数据的刻录、读取,可以保证高传输速度、RAID冗余、离线管理等
【优势/不足】
以光盘匣为单位管理数据、使用RAID保护数据、可以进行离线管理。
若要实现设备间的冗余,需要镜像处理,所以将提高系统成本。
Facebook蓝光存储
facebook是世界上最大的图片分享网站
2013年活跃用户的数量达到11.5亿人,每天上传照片数量超过3.5亿张
2015年活跃用户的数量超过15亿人,单日使用量突破10亿人次
facebook保存了数目庞大的照片数据
目前累计上传照片数量超过6000亿张
对于每张照片,facebook存储大小不同的四个版本(在某些场景下只需展示缩略图)
意味着:facebook服务器上存储着2.4万亿张照片
下图是社交网站图片的访问频率随时间的变化趋势,刚上传后访问频率最高,后面逐渐降低,一年后就成了偶尔访问。存储介质也是分级存储,从全闪存、SSD到HDD、光盘。
facebook保存大量图像数据。为了满足实时性要求,在Hadoop系统上保存图像数据。
作为Hadoop发生故障时的候补,在光存储系统上存储Hadoop的备份。
为了提升备份效率,使用ReedSolomon符号在光盘上分散记录。
Facebook最终采用了蓝光光盘作为冷存储介质:
用户照片等数据需要长期保存,现有介质成本高、可靠性低
与硬盘相比整体成本削减50%以上[成本包括:设备成本、能耗成本、网络成本、机房成本、人员成本、运营成本]
耗电量降低80%以上[光盘库工作功耗远低于硬盘,且不需要空调冷却系统——光盘库工作能耗为88W,采用外部空气过滤系统替代空调冷却系统]
异地备份方案
在冷存储更新频度低的前提下,地理上分离的多个场所间作数据冗余
以冷数据为对象搭载异地备份(GeoReplication)功能
由于有数据中心间的冗余功能,数据中心内的冗余设备废止(2系统供电、UPS、自备电源、回路2重化、防震构造等),数据中心大幅降低成本,在这个基础上云服务成本大幅降低
facebook已在Prineville的ForestCity进行商用,Google已在Spanner上实现
异地备份使可用性和吞吐量性能同时实现
蓝光存储的未来
先看看蓝光存储技术路线图,2023年单盘可以到几TB容量。
未来的光存储技术还有:
全息光存储技术(美国InPhase,日本日立、NHK);InPhace1.6TB/盘;日立2TB-8TB/盘
双光束超分辨技术(澳大利亚顾敏院士,武汉光电国家实验室)
实验装置水平:可实现单盘15TB容量
最新实验结果:9nm特征尺寸理论上可达单盘1PB