我们必须保持数据库站立吗?

Zonafide的创始人兼首席开发人员Paul Worrall

(首次发布在Linkedin上:2015年8月17日)

我曾经负责一个大型数据仓库,该仓库在一段时间内有机地增长了。 它的用户界面很难添加其他功能,并且关系数据模型不适合在其业务领域中表示概念。

开发了许多下游系统,这些系统大多从标准化视图中从数据仓库中获取数据,并将其放入其他系统中。 这导致整个组织中大量重复,并创建了一条脆弱的数据供应链,该供应链经常失败,并且使变更非常困难。

当然,数据仓库的业务案例是集中管理数据,以提高其质量,完整性和安全性。 但是,一旦数据分离,就无法提供保证。

那么有可能在不尝试将其组装到集中式数据存储中的情况下确保质量,完整性和安全性吗? RDF数据格式具有一些独特的特性,因此值得考虑。

RDF和语义网都是关于授权数据授权机构共享有关其数据的知识并以可用格式发布的。 因此,您有合适的人员对其数据质量负责。

使用RDF,数据和模型以相同的方式表示,这意味着数据使用者将继承相同的模型。 然后,数据使用者可以添加新的概念和数据,但是将保持原始数据及其模型的完整性。

数据存储隐式支持数据模型。 它们可能具有不同的处理功能,但没有自己的模型解释。 您可以将数据从一个存储移动到另一个存储而无需转换。 这意味着数据的质量和完整性不会随着使用而改变。

然后我们面临棘手的安全问题。 本文中讨论的话题太广泛,但是语义Web建立在Web基础结构之上,因此我们从那里继承了一套全面的工具和实践。

一旦数据分离并成为另一个系统的一部分,就更需要控制对数据的访问。 同样,比起我一直在规定RDF的访问控制方法的人要聪明得多:下面的参考。 对我来说,足以理解的是,访问控制信息也使用相同的建模技术进行描述,并且可以随数据一起被使用。

以我的经验,每个业务周期在投资周期开始时都会分散,而在寻求节省成本时会在集中时结束。 将数据集中在一个地方对于前者总是过于严格,而对于后者则过于昂贵。 RDF和语义Web方法可能是可行的选择。

背景资料:

将DAC原理应用于RDF图

创建一个策略感知网站

确保对敏感RDF数据的访问