当你的数据存储在远程数据中心的远程服务器上时,究竟会发生什么?
我们生活在一个信息泛滥的世界里。2011年,IBM进行的一项研究估计,每天世界上会产生接近300亿亿字节的数据。2011年之后,互联网用户数量翻了1番,社交媒体和机器学习的强劲崛起,以及移动计算、流媒体和物联网设备的爆炸式增长,都使得数据量远远超过了这一水平。实际上,根据最新发布的思科全球云指数报告,2016年,“所有的人、机器和事物”共产生了约2200万亿亿字节,也就是220泽字节的数据,按照这样的速度,到2021年,所产生的数据将达到850泽字节。
人们认为其中大部分是瞬时数据,因此没有进行存储。但如果总量非常庞大,那么哪怕只占总量的一小部分,也会大到令人咋舌。就数据而言,思科估计,2016年存储的数据达1.8泽字节,到2021年将翻两番,达到7.2泽字节。
我们的大脑无法真正理解1泽字节是多大,但这样在心里想象或许会有所帮助:如果1兆字节的大小相当于英文句子末尾的句号“.”,那么1.8泽字节将占据大约460平方公里,即大约 8个曼哈顿区的面积。
当然,真正的泽字节数据根本不会占据任何空间——数据是抽象的概念。但另一方面,存储数据确实会占用空间,就像材料、能源和复杂的硬件和软件一样。我们需要一种可靠的办法来存储数据中的很多个0和1,这样我们就可以在以后检索它们,无论是从现在开始的1小时后还是5年之后。并且,如果信息在某种意义上是有价值的——不管是一小群人感兴趣的数字化家族史,还是具有重大文化意义的电影库——数据可能都或多或少需要被无限期归档。
考虑到数据存储的速度要低得多,且几乎所有的数据都存储在我们自己的设备上,数据存储所带来的巨大挑战相当难以应对。然而如今,我们正将更多的数据发送到“云”——这个云山雾罩(请原谅使用了双关语)的术语,指的是由亚马逊网络服务系统、谷歌云、IBM云和微软Azure等运行的远程数据中心。企业和政府机构正日益将他们越来越多的工作量(不只是外围职能,也有关键任务工作)转移到云端。消费者正在转向云,构成了不断增长的云用户的组成部分,因为云允许他们随时随地在任何设备上访问内容与服务。
然而,尽管我们对云越来越依赖,我们中又有多少人清楚了解云的运行方式,或者更重要的是,清楚了解我们的数据是如何存储的?即使理解相关原理并非你的工作,你也不得不面对无法改变的事实:你的生活方式对0和1这种基本存储过程的依赖,恐怕要比你所知的更强。
文章图片来源于网络