语义网

Deep-Sci:"-sci-"源自拉丁语的"scientia"(知识)

小科

物语

+

如今的时代,万事万物,凡存在,皆联网,凡联网,皆计算。

【每日一篇】

希言自然。故飘风不终朝,骤雨不终日。孰为此者?天地,天地尚不能久,而况于人乎?故从事于道者,同于道;德者,同于德;失者,同于失。同于道者,道亦乐得之;同于德者,德亦乐得之;同于失者,失亦乐失之。信不足焉,有不信焉。

——《道德经·希言自然》

如今的时代,万事万物,凡存在,皆联网,凡联网,皆计算。

首先是数据的入口,入口已无处不在。

通过在日常环境中广泛部署微小的计算设备,人们能够在任何时间和任何地点获取并处理信息。

计算将最终和环境融为一体。

这就是普适计算,是人类的第三波计算浪潮。

而要获取数据,除了计算能力,还需要真实世界的硬件设备。

一种新的无线传感器:射频识别标签(Radio Frequency Identification, RFID),正异军突起。

RFID精巧轻便,既可以薄如纸张,也可以小如豆粒。

但却能无线存储、发送、读写数据。

由于无线传感器的快速普及,环境数据增长得最快,成为政府数据量最大的来源。

这种数据量的增长,已经大大超出了人类的预期和想象。

时至今日,数据已经像“洪流”一样,在全球的政治、经济生活当中奔腾。

这些数据以不同的格式存储在不同的环境中,有的在计算机的硬盘里,有的在数据仓库内。

其次是迈入云端的计算能力。

“计算”,指的是计算机的计算能力。

其大小快慢,取决于计算机内硬件的配置。

人类发明计算机不久,计算机科学家就开始憧憬把计算能力集中起来共享。

美国计算机科学家,图灵奖获得者约翰·麦卡锡早在1963年就说过,“就像公用电话网一样,计算的能力,有一天会被组织起来,成为一种公共资源和公共事业,这种公共资源和事业,会成为一个新的、重要的产业。”

为了形容这种可以为个人提供专用资源,并可以招之即来、挥之即去的网络服务,“云”的概念产生了。

这种通过网络将计算能力组织起来的做法,可以实现经济学意义上的“规模化”和“专业化”,意味着巨大的利润空间。

1997年,南加州大学的一位印度裔教授切诺柏正式提出了“云计算”的概念。

他认为,“从此以后,计算的边界将由经济的规模效应决定,而不仅仅取决于技术层面的限制。”

云计算逐渐形成了一个从应用软件、操作系统到硬件的完整产业链。

2010年前后,云计算开始得到大规模的商业应用。

计算能力成了一种可以传送的服务,这是继互联网的出现之后,信息技术领域最重要的一个创新和变革。

就像自来水管道供水、电力网输电一样,云计算把“计算”从有形的产品变成了无形的服务。

云计算的出现,把数据存储和数据分析变成了一个可以更加方便获得的网络服务。

毫无疑问,这是一个重大的变革。

随着它的普及,全世界政府、企业和个人使用、消费信息技术的模式,正在改写。

信息,已经充分流通。

计算,已经充分共享。

但在大数据时代,信息共享、交流互动已经不再是最迫切的需求。

数据的分析和整合,才是最大的挑战。

而这,恰恰是万维网的短板。

可以说,万维网是一个网页的集合体。

这些网页,即使内容相似、主题相同,但由于分属不同的网站、存储在不同的服务器上,他们之间就没有链接和联系。

这意味着如果用户想找到它们、分析它们,就必须借助搜索引擎等工具。

这也是谷歌之类的搜索公司为什么能成为商业巨头的根本原因。

在互联网上,各种信息之间是孤立的,我们要对它们进行整合、分析,就必须依靠人工的外力,目前最好的工具就是搜索引擎。

但搜索引擎并不完美。

它给用户返回的信息良莠不齐,还需要进一步的人工分辨。

在这个基础上,蒂姆·伯纳斯-李在1998提出了语义网的概念。

语义网是对未来网络的一个设想。

它是Web 3.0网络时代的特征之一。

简单地说,语义网是一种智能网络。

这种智能网络不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系。

从而可以使交流变得更有效率和价值。

语义网就是数据网,从某种程度上来说,就像一个全球性的数据库。

语义网不仅仅是把数据放上网,它还要在数据之间创建连接。

数据一旦联接,计算机和人都可以对数据进行探索。

通过一个数据,就可以发现另外一些相关的数据。

而连接数据的,就是遵循统一的标准,给每一片信息赋予一个计算机都能理解的“意义”的“元数据”。

也可以形象地理解为给信息贴上各种标准化的“标签”。

因此,元数据,是大数据时代的一个重要概念。

以此,未来的语义网将不只是一个众多网页的链接体,而是一个全球性数据库。

在这个数据库中,各种相关数据通过“元数据”互相连接。

计算机将根据元数据,自动为我们搜寻、检索和集成网上的信息。

你可以跨网站整合数据,也不再需要搜索引擎。

语义网的智能平台将触发、呼唤一些崭新的服务。

但语义网的建设却非一日之功、一人之力。

首要原因是有大量关于元数据的标准需要制定和统一。

为了保持“标记语言”的一致性,计算机科学家正在对全世界万事万物的基本特点及其关系进行规范和定义,这个过程,叫做创建本体。

所谓本体,就是世界上所有的常见事物。

创建本体,就是对人类社会每一个实体进行概念化、标准化的定义过程。

可以想象,这是一个如何浩大的工程。

在TED演讲《下一代网络》中,在向观众描述了未来语义网的强大之后,蒂姆·伯纳斯-李向听众呼吁:

“现在,我们正处在这样一个阶段:如果你认为这是一个伟大的想法,那你就要去做。这件事,每个人的回报将取决于其他人是否行动。我想,今天我们在座的很多人,他们做事,并不是因为这件事很快就有投资回报,他们去做,是因为他们明白:每个人都去做了,就能成就一件好事。”

语义网的建设,也存在着“集体行动的困境”。

但终有一天,全球将数数相联。

那将是一个更加辉煌的大数据时代。

大数据之“大”,将不仅仅意味着数据之多。

大数据之“大”更意味着,每一个数据都能在互联网上获得生命、产生智能、散发活力和光彩。

▼ 每个人的回报将取决于其他人是否行动

✨星星发亮是为了让每一个人有一天都能找到属于自己的星星

(0)

相关推荐