一只小白鼠脑试验引发的存储“新浪潮“
数据可能不在资产负债表上,但是数据却是一个公司最有价值的无形资产。
文 | 懂懂 编辑 | 秦言
来源:懂懂笔记
物理世界与虚拟世界正在融合,当物理世界以数据的形式映射到虚拟世界的时候,数据将从量变到质变。而新数据时代,正在带来更多新机会和新挑战。
小白鼠实验带来的挑战与思考
人类脑科学的进步,大都是通过对小白鼠的研究来实现的。大家常常听说研究机构用小白鼠做实验,但往往想不到实验的复杂性。
在小白鼠的大脑中,一个神经元的包体大约只有10微米,神经元之间连接的突触大约是2~4微米。一只小白鼠有1亿个左右的神经元,神经元之间有着千余个数据连接:一个神经网络的复杂程度确实远远超过了今天的互联网。
研究这样一个复杂的脑神经网格,对显微镜的要求是既要有宽阔的视野、极高的分辩率,还要有极高的速度来观测动态信号传递过程。这是清华大学范静涛博士在进行脑科学研究时,遇到的主要难题。
那么,一次实验下来会产生多少数据?1张照片24M,1个摄像头1分钟拍摄30张,35个高速摄像机同时拍,平均1秒钟采集数据21.6G,仪器要持续采集、存储72小时。这不仅是对存储量提出巨大的需求,还要每一帧都不能掉。因此,系统必须存储量大,速度快,还要安全、稳定。“我们敏锐地发现,20.16G字节每秒的指标,并不是任何一个市场上随随便便买到的所谓的商用存储系统就能解决的问题。”反复对比,范静涛博士最后选择了浪潮提供的基于13000系列的存储解决方案。
小白鼠实验是未来数字时代的一个典型应用。“第一是精细化,每一张照片颗粒度的要求都非常高;第二是数据实时性,连续72个小时不停地拍,每秒钟拍摄的频率是30次,一级相机是30次×24M。所以即时性要求是非常高的;第三,数据绝不能丢,丢一帧实验就要重头再做。” 浪潮信息存储产品线总经理李辉总结出这个应用的三大特点,“这是要求更高的新数据,也对存储挑出了新挑战。”
在李辉与客户的接触中,各行各业都存在着像小白鼠实验一样对数据存储、管理提出的挑战。
比如今年面临5G商用落地前夕,由于5G理论带宽比4G提高1000倍,这就会出现更强的并发性大规模数据访问。同时,5G也将直接触发IoT的爆发,由IoT技术产生出来的数据将呈现出数量级的增长。
再比如,广电行业4K/8K的高清让媒体娱乐成为数据增长的重要推动因素。但需求不仅仅停留在存储者的增加,更是对数据的使用方式也在变化。短视频、直播平台等视频产业成为用户最主流的应用。那么短视频APP、直播平台还需要挖掘数据价值,通过从用户的个性化需求、渠道需求等角度出发制作符合互联网传播规律的内容,帮助进一步提高用户粘性。
“传统行业转型过程中,我们愈发地发现多样性地需求,不断升级的应用,要求我们对数据的访问提供更多更复杂的场景。”浪潮信息存储产品线总经理李辉说道。
如何管理环绕地球 222 圈的DVD
今天,人类正在完成整个世界数字化进程的使命,物理世界的一切正在被映射到数字世界里。数据是数字世界的核心,社会的信息化经济构建日益加强。5G、AI、IoT,都是当前技术发展的必然趋势,这些技术的背后也必将引起数据量的汹涌爆发。
IDC 预测,全球数据圈将从 2018 年的 33ZB(泽字节)增至 2025 年的 175ZB(泽字节)。其中来自中国的数据量将增至48.6ZB,全球占比高达27.8%,中国也将成为全球数据量最大的区域。
175ZB是个什么概念?
1泽字节相当于1万亿GB。如果我们把全球数据圈全部存在DVD中,那么DVD的高度会是地球至月球距离的23倍,或者环绕地球222圈。如果以平均 25Mb/秒(目前全美平均网络连接速度)的速度下载,一个人完成175ZB的下载任务需要18亿年。
数据量的变化,自然也会带来管理方式的彻底改变,这就是数据从量变到质变的过程。IDC中国企业级研究部助理副总裁周震刚认为,“数据量和数据管理难度都发生了爆炸性的增长,这就是我们现在所看到的数字化转型时代,数据爆发的情况是一个非常明显的特点。”
周震刚指出,数据爆炸给IT基础架构提出了更加深刻的话题,“我们怎么来管理这些爆炸的数据?”他给出三个方向:第一是软件定义存储,让整个存储系统有更好地扩展性和灵活性、敏捷性来支撑数据爆炸;第二是以存储智能化来应对数据量的增长;第三是多云环境间流动,数据将在核心数据中心、边缘数据中心以及使用的多个外部公共云之间自由地流动,多云的数据流转将成为常态,在多云环境里的可靠性、安全性,将会变得越来越重要。
同样,针对金融、通信、医疗、制造等各个行业数据爆发的观察,浪潮总结出了新数据时代下商业需求的四个特征:
精细化:在科研、航空卫星、医疗等行业涉及连续观察、精准课题等研究,带来了精细化的应用需求,对数据的持续性、精确度提出了更高的要求。
即时性:由交通行业、科研行业、航空卫星行业、广电媒资行业的发展创新带来的实时分析、快速应用带来的即时性要求,以实现更有效、更高效的实时资源调度和业务效率提升。
整合化:在交通行业、医疗行业、金融行业、广电媒资行业等均在积极打通不同场景的行为数据,实现“以用户为中心”,为创新提供依据。以此,产生对离散场景的数据整合及业务场景打通的整合化需求。
不确定性:许多行业如通信行业及金融行业,应智能化的要求虽业务在持续不断演进,但出于对安全、各区域协同等多方面考虑,可能带来颠覆的新技术应用前景仍充满不确定性。这种不确定性,可以根据行业的属性和短期商业目标进行定义。
“我们现在处于一个不确定性显著的时代,我们唯一的确定性就是不确定性,唯一不变的就是不停地变化。” 浪潮集团副总裁胡雷钧强调数据的使用都将落在智能化上,“在未来,依托数据AI的不断变化,使得数据不仅仅是物理世界的记录者,数据也会成为新的生产资料,谁掌握数据谁就掌握了未来。”
数据管理的变化趋势就是智能化。现在数字化转型的核心就是智能化。
在今年两会期间,总理提出了“智能+”的概念,就是把基于数据技术的成果与生活的各个领域结合,推动商业模式的变革,提升实体经济的创新力和生产力。“智能+无疑将会成为中国经济领域各个行业、各个产业智能化升级的强力的助推器。它将是一次产业革命,成为中国数字经济发展的新动能。基于IT技术设施的变革,数字技术与传统产业的深度融合规模化落地的时机,对于我们来讲已经出现了。” 胡雷钧总结道 。
新数据时代,浪潮存储的自我升级
新数据时代给厂商带来的是挑战,也是新的开始,新的机遇。机会就来自于谁能用创新的思维、创新的产品去满足客户不断升级的需求。
浪潮存储产品线总经理李辉认为,新数据时代对存储提出了两方面的重要要求:第一是在存储方面,要快速适应云场景,支持各种架构,实现云化存储系统交付能力。第二是对数据的智能化应用,满足大数据、AI应用的运行需求,满足不同行业客户面向智能未来的行业转型实践。
在过去很长一段时间,浪潮存储的理念是活性存储,强调存储设备的灵活性和适用性。而新数据时代,随着数据量和数据管理难度同时爆发性增长,浪潮也必须要尽早面向未来转型,“浪潮现在的思路不仅是把海量数据存好,还要把数据的价值更大化地发挥出来。”
“云存智用”,这个词代表了浪潮此次自我升级的思路。李辉这样解释:“云存”是指数据存储需要云存,快速适配云场景,支持各类架构、云计算及开源技术,将以技术创新实现“云化功能与特性”的存储系统交付客户;“智用”是指数据存储满足大数据、AI应用的运行需求,满足不同行业客户面向智能未来的行业转型实践;而对于企业用户来说,浪潮存储不仅要帮助他们实现存储基础设施的价值最大化,更需要最大程度的挖掘并共享数据资源价值,让他们能够“运筹新数据”。
G5是浪潮为新数据时代准备的全新存储平台,此次浪潮数据中心级分布式存储平台AS13000G5,以及浪潮数据中心级高端存储平台AS18000G5两款重磅产品的正式推出,也预示浪潮对新数据时代开启的全新思考。
浪潮数据中心级分布式存储平台AS13000G5面向弹性融合云,具备更强大的平台能力,实现了从“一套架构,四种服务”到“一套架构,5+X双平台”的升级。软件层上,AS13000G5融合文件、对象、块、HDFS、数据库协议5种服务协议及X种融合平台。硬件层融合机架式、高密式、机柜式、多节点式、边缘式5种硬件形态及X种硬件配置,可充分释放软件定义存储的潜能,实现容量按需扩展、性能按需供给、服务按需定义。此外,AS13000G5拥有低中高端多种机型,所有机型均适配Intel最新的Purley平台,兼容Cascade lake新一代CPU,可满足广电媒资、视频安防等行业不同应用场景的需求。
浪潮数据中心级高端存储平台AS18000G5是面向关键业务的海量存储系统,能满足金融、电信、政府、能源、制造、交通、教育等各行业对核心业务的需求。AS18000G5具备高达1500万IOPS的极致性能,超高速PCIE 3.0互联架构,最大可扩展48个控制器。拥有650TB异构缓存空间及282PB海量全闪存容量。一套存储可提供文件、块、对象三种存储协议,以业界唯一的NVMe异构缓存写加速及小数据硬件加速,做到真正的数据无损压缩。
从这些产品特性来看,新一代G5存储平台为客户提供EB级极致容量、亿级IOPS、微秒级延迟,以弹性部署、灵活连接、一致高效、自动运维的多维能力解锁存储新挑战,以支持电信、金融、能源、航空卫星、交通、政府等各个行业数据化转型的进一步深入。显然,对于“新数据”时代的变化,浪潮有备而来。
【结束语】
数字化正在日益深刻地改变着当今的商业形态,切实地将智能数据集成在我们所涉及到的一切事务中。IDC指出,到2021年,全球至少50%的GDP将以数字化的方式实现,数字经济时代已全面来临。马云曾经指出,数据是未来的新能源,这一点已经得到广泛认可。数据是数字化转型的核心,是数字化进程的命脉,也是未来各行业发展的新动能。
如何将数据这一新能源转化为新动力?存储是数据生态产业链中至关重要的一环,这有些像炼油厂和加油站,不仅要存储,还要对开发出来的原油进行提炼,提供给所有需要动源的机车,进而产生更大的社会价值。浪潮存储作为行业的引跑者,过去3年在技术上累计投入超过10亿,在研发能力、人才培养、生态共建等方面均有了极大提升。IDC数据显示,2018年浪潮存储居于中国存储市场出货量增速第一。
奔跑中的浪潮存储再次“自我升级”,新一代G5存储平台不仅是最大的数据能源库,还将根据不同行业的需求对数据能源进行加工,驱动行业转型升级。在新数据时代,浪潮正在抢先一步,准备打造数据时代最大的“能源库”。