您的位置首页  都市生活  法制

DIKW模型在档案信息资源开发中的应用

  • 来源:互联网
  • |
  • 2022-08-12
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

  所谓DIKW体系就是关于数据(Data)、信息(Information)、知识(Knowledge)及智慧(Wisdom)的体系,呈现一个金字塔分层模型,如下图所示:

  自底向上每一层都比下一层增加某些特质。数据层是最基本的原始素材;信息层加入了有逻辑的数据内容;知识层提炼信息之间的联系,加入“如何去使用”;智慧层加入预测能力,能回答“为什么用”。每一层的简要介绍如下:

  或称资料,是关于事件的一组离散的、客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类,可作为计算机加工的“原料”,如图形、声音、视频、文字、字符和符号等。

  又称讯息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。作为一个概念,信息有着多种多样的含义。一般来说,与信息这一概念密切相关的概念包括沟通、控制、约束、指令、含义、精神刺激、模式、感知以及表达等。

  是对某个主题确信的认识,并且这些认识拥有潜在的能力为特定目的而使用。认知事物的能力是哲学中充满争议的中心议题之一,并且拥有它自己的分支——知识论。从更加实用的层次来看,知识通常被某些人的群体所共享,在这种情况下,知识可以通过不同的方式来操作和管理,即知识管理。

  可以指思考分析、通情达理或寻求真理的能力,它和智力、聪明不同,智慧更重视人生哲学上的能力。有智慧的人通常被称为智者,具有预测未来的能力,也即站在金字塔顶端的人。

  数据是原始素材,本身不包含任何潜在的意义;通过某种方式组织和处理数据,分析数据间的关系,数据就有了意义,这就是信息,它解决了诸如谁(Who)、什么(What)、什么时间(When)、哪里(Where)的问题;结合经验、上下文、诠释和反省对信息进行判断和确认的过程就是知识,知识是信息的集合,但不仅仅是集合,还需要理解,是认知和分析的过程,使信息变得有用,可以回答“如何(How)”的问题;智慧是做正确判断和决定的能力,包括对知识的最佳使用,它关注的是未来,试图理解过去未曾理解的东西,因此智慧可以回答“为什么(Why)”的问题。

  从上图可以看出,随着数据向信息、知识和智慧的发展,理解(Understanding)的深度在不断增加,需要考虑的上下文(Context)范围也在扩大。假设整个过程用人工智能(Artificial Intelligence,AI)来实现,就是一个知识驱动的过程,是一个从初级AI向高级AI、通用AI发展的过程,也是一个攀爬DIKW金字塔的过程。

  由于档案数据采集入库是一个非常规范、要求严格的过程,只有符合《电子档案移交与接收办法》规定要求的数据才能进入档案信息资源库,因此入库数据实际上已经完成了DIKW模型第一个台阶“数据→信息”的转变。

  档案编研工作是将馆内静态的档案信息资源转化为动态的、可供利用的信息资源的加工制作过程。从定义中就可以看出,档案编研实际上就是DIKW模型第二个台阶“信息→知识”的转变。

  档案编研的选题只有贴近党委政府的工作中心,贴近人民群众,才能有效地为经济建设、社会发展服务,让档案编研成果满足社会各界及人民群众的需要,是档案编研工作的出发点和归缩地。有了编研工作,才能通过主动提供档案的编研成果,直接服务于社会各项事业,有助于推动和促进地方人文历史、社会科学的研究,具体的形式包括编写参考资料、汇编档案文件、组织特色专题、参与编史修志、撰写论文专著等,是档案信息资源开发工作的重要组成部分。

  随着AI技术的发展,复杂繁琐的素材收集和整理工作可以结合AI辅助编研技术来实现。编研人员只需要简单地输入想要编研的主题,AI引擎就会根据自己对语义的理解从档案信息资源库中抽取和主题相关的素材汇集到素材库中,大大方便了编研人员的操作,提高了编研工作的效率。

  由前面的描述我们知道,智慧是做正确判断和决定的能力,关注的是对未来的预测,需要实现对知识的最佳使用,这就是DIKW模型的第三个台阶“知识→智慧”的攀爬。目前AI技术的发展尚未真正实现“知识智慧”(也就是所谓的强人工智能阶段)的跃升,但是在部分应用场景上已经体现出一定的“智慧”特性,比如在互联网上已经应用非常成熟的“用户行为分析”:即通过对用户基本属性以及过往操作行为的分析预测用户的喜好并推荐其可能感兴趣的信息或商品。

  将这一技术应用于档案信息资源开发领域,同样可以取得“智慧”的应用效果。首先需要对档案信息资源库中面向用户提供利用的档案数据进行自然语言处理(Natural Language Processing,NLP),包括分词、打标签、聚类,甚至生成知识脉络和知识图谱等。

  然后根据利用者的基本信息和行为信息,借助AI决策模型智能抽取用户可能感兴趣的档案信息推送给他,包括个性化推荐、相关推荐、热门推荐等。同时,AI引擎还可以在用户的后续操作中进一步学习用户的行为习惯,不断优化和改进决策模型,提升自身的“智慧”程度。

  在DIKW模型中,数据和信息描述世界,知识和智慧理解世界。从这个角度说,AI在DIKW金字塔上的层次越高,能力就越强,距离强人工智能也就越近,当然这条攀爬之路并不好走,至少目前来看这段距离还比较遥远。也许当AI登上DIKW金字塔尖的那一刻,获得了真正的智慧,届时我们已经不能确定,AI会不会是地球上最聪明的物种了。或者说,我们人类还处于地球智慧的最高层吗?

  数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。真理越辩越明,我们也衷心欢迎越来越多的人投身到档案数字资源管理和保存这一领域的研究中来并发表真知灼见,共同为人类文明的传承而努力奋斗!

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186