|
在对数字图书馆发展的研究和探讨过程中,人们不断提出新的方向,发现已有的不足。图书馆管理信息系统(MIS)作为图书馆信息化建设的阶段性产物,只关注信息资源本身的处理与管理,忽略了与信息资源收藏有关的空间地理信息、信息资源间的相互关系以及其他地理要素间的联系。信息资源数字化的同时,其空间布局的数字化也应当作为一个重要的组成部分。另一方面,现实中图书馆的发展与日常活动也迫切的需要一种新的空间管理方式。上世纪60年代起,地理信息系统(Geographic Information Systems,GIS)得以迅速发展,并逐步应用于数字图书馆的发展之中。 字串9
1 GIS及其在图书馆界的应用 字串9
1.1 GIS的概念 字串8
GIS自诞生以来就存在很多的定义。一般认为,GIS应用软件是允许用户创建人机会话,分析空间信息,编辑数据、地图并展示所有这些操作结果的工具。著名的GIS应用软件开发公司ESRI在其主页上这样描述GIS的功能:地理信息系统将硬件、软件及数据整合起来以获取、管理、分析及显示各种形式的地理相关信息。它可以让我们以地图、报告、图表等各种形式观察、理解、解释、形象化数据从而揭示其关系、模式和趋势。 字串8
1.2 GIS的功能 字串6
可以理解为,GIS是以地理空间数据为基础,整合空间相关信息,在计算机软件和硬件的支持下,运用系统工程和信息科学的理论,采用模型分析方法,重组为特定的知识信息,为研究和决策服务的计算机系统。它的功能主要有以下几点: 字串6
·数据的存储和管理,涉及到空间数据和属性数据的组织。将地物的点线面位置、空间关系组织到数据库中,既便于计算机处理又方便用户查询。数据管理实际上是采用如关系模型、层次模型或网状模型等,建立数据库管理系统(DBMS)。 字串3
·空间的查询与分析。空间查询包括位置、属性、拓扑等查询。空间分析包括地形,网络,叠加,缓冲区、决策数据等。 字串7
·图形的显示与交互。一方面将已获得的地理空间数据经过空间可视化模型的分析,转换成直观的二维或三维图形图像;另一方面也可以将用户所需的相关属性数据借由空间数据的内部关系加以显示。 字串4
1.3 GIS在国内外图书馆的应用概况 字串1
GIS在图书馆的应用已有近20年的历史。得益于数字地球概念的优先提出和战略性重视以及GIS研发的领先性,西方国家对于数字化地理信息的收集和整理较为全面。因而,国外图书馆界应用GIS一直以来多着眼于图书馆建筑之外的一定范围,如街区、城市乃至国家。主要方式是图书馆向公众提供地理信息相关服务,或分析图=B馆及其用户在一定社会范围内的关系等。如用以评估和剖析图书馆辐射范围内社会经济特性,描绘公共图书馆用户空间分布,通过人口数据分析图书馆潜在用户以改进服务等,高飞等人在其文中介绍了美国部分图书馆在CIS资源建设及信息服务上的应用。近年来研究人员开始将注意力转移到图书馆内,Xia在其文中提出了以GIS作为图书馆空间管理的解决方案,并尝试通过分析GIS馆藏空间数据与读者借阅记录,针对读者的借阅行为改善书架排布。 字串6
我国对GIS在图书馆领域的应用关注较晚,目前主要关注点在图书馆空间管理与馆藏资源管理方面。如沈健针对GIS在图书馆空间管理及馆内阅览的应用进行了探讨,高飞亦描述了GIS馆藏空间地理信息系统的设计与实现等。 字串4
1.4 当前应用的不足 字串9
地理信息系统也许仅被当作地理信息储存、获取及显示的工具,高飞等人在总结检验图书馆GIS服务的效果时提到,对于很多图书馆来说“GIS服务”就是收集、维护、保存和构建空间信息。然而G]S真正的价值在于依据现有数据间关联完成一定模型分析,生成新信息并加以展示,这种功能往往能解答一些原本并未存在于数据中的问题,这就是GIS的分析与决策辅助功能。 字串1
2 利用GIS进行知识管理 字串8
GIS相对传统MIS具有显著优势已不容置疑,深入发掘GIS的功能潜力应当成为下一步发展所需要考虑的问题。如果说传统信息管理系统对应的是信息管理,那么GIS将扮演知识管理承载者的角色。知识管理是近年来管理领域出现的一种的新理念。野中郁次郎提出了知识创新的SECI(Socialization,Extemaliza-tion,Combination,Internalization)模型,即显性与隐性知识的产生、转换、表达及组合的过程。在可视化研究领域,Eppler和Burkard认为除了传播信息之外,知识可视化的更高目标在于传输见解、经验、态度、价值观、期望、观点、意见和预测等,并以这种方式帮助他人正确地重构、记忆和应用这些知识。 字串3
2.1 实现GIS的知识管理功能 字串8
知识管理的主要意图在于对既有主客观信息进行抽象、归纳与重组,将新的认知在个人或组织间进行传播与反馈,此过程不断重复产生了一种认知的繁衍与进化。将GIS作为知识管理的承载平台,需使其具有一定的抽象、归纳与重组能力,再通过可视化表达,完成读者与读者、读者与馆藏信息以及馆藏信息之间的交互。此处引入几个概念作为构建分析模型的重要依据: 字串4
2.1.1 单元网络和二元网络此两者的概念来自于复杂网络,是一种对包含大量属性个体及个体间相互关系的复杂系统的抽象。近年来涉及到了科研合作网络、信息检索、竞争情报、人际网络等情报学领域。二元网络一般被认为包含有两类节点,并通过一定的关系相连接。图书借阅过程中,每本书和每个读者都被认为是网络中的一个节点,如果某位读者借阅了某一本书,即在网络中相应节点间建立联系而形成一个二元网络。同时,不同读者间借阅同本书,不同书籍被同一读者借阅,均可形成关于读者或书籍的单元网。傅林华及洪少春对上述的图书借阅网络模型进行了研究。洪少春对单元读者网络的聚集系数进行了计算,认为大部分读者的借阅兴趣一般限于某一两类的书,读者可按照读书兴趣划分。这一研究的意义在于,我们可以通过分析读者的借阅行为发现读者的群体性阅读趋向,通过推荐热门书籍达到分享阅读经验、促进关联性知识传播的目的。同时,读者借阅行为中还有更多的潜在关系值得探讨和研究。傅林华、洪少春均发现了图书借阅网络的单标度性质,其具体成因二位研究人员也并未得出结论。另外,复杂网络的小世界效应在借阅关系网络中的表现值得研究。所谓小世界性是指网络同时具有较高的聚簇系数和较短的平均路径长度,较高的聚簇程度促成了节点间相互的信任和 字串5
更紧密的合作,从而提高信息交流的效率和准确度。最短路径的存在使节点可以从较远的节点处获取与既有信息不同但具有一定相关度的信息。那么,借阅关系网络中最短路径是否可以帮助揭示和促进拓展性阅读,是一耐人寻味的话题。 字串6
2.1.2 本体间映射及领域本体 上文我们认为,知识管理的主要意图在于对既有主观或客观信息进行抽象、归纳与重组,本体研究在一定程度上满足了这种要求。赵英、雷强在其文中研究了数字资源整合的贝叶斯本体映射方法,在不同的本体中计算其概念节点之间的相似度,使得同类本体可以互相对应及转化以完成知识共享的任务。同时,抽象与归纳的过程,实际上是对于既有信息的一种过滤。易明、王学东提出了基于领域本体的数字图书馆信息过滤模型。模型依据不同用户对资源库中相关资源的评价,分别将资源和用户进行转化、聚类形成用户组及概念集,同时考虑使用户兴趣的相似性在同用户组间最大化,在不同用户组间最小化,并利用聚类的质心点矢量来表征评价值。该模型通过转化、聚类形成不同的过滤函数,或直接利用针对某一读者形成的过滤函数来剔除没有价值的资源。 字串9
2.1.3 情景用户模型 知识管理的主要目的是将新的认知在个人或组织间进行传播与反馈,这个过程也可以理解为个性化服务。袁静描述了基于本体的个性化检索及推荐服务,在构建个性化用户模型时考虑显示构建和隐式构建。前者是本体库根据用户提供的信息进行语义分析,返回并让用户自行选择符合需求的实体概念,从而构建用户模型。隐式构建则是通过挖掘用户浏览行为和所访问页面,进行需求分析并借助本体库中规范化的概念自动构建用户模型库。当用户发出检索请求时,其最近活动创建的用户情景模型与查询请求同时提交到服务器,检索结果依据与用户情景模型的相似度进行重排序后返回给用户。上述基于本体的情景用户检索及个性化推荐服务,既包含了资源的匹配,又使得相近兴趣的用户群体之间可进行相互推荐。 字串5
由上述几种模型概念可看出,当前对于读者借阅行为及信息检索的研究中,群体读者特性、信息资源的聚类及两者之间的关系是一个关注的重点。利用复杂网络研究借阅关系更为基本和直接,读者与书本间的联系可能直接依附于某一本书的图书分类法,而基于本体的研究方法则建立在将不同的信息资源抽象聚类的前提下。无论以哪种研究作为切入点,其根本目的都在于揭示人与人、资源与资源、人与资源间的潜在联系,进而为将信息管理转变为知识管理,提高信息共享程度和传播速度创造条件。研究中所采用的理念、算法等,可以作为利用GIs进行可视化知识管理的一个先决条件。 字串4
3 馆藏GIs流程及知识管理功能实现 字串9
3.1 馆藏相关信息数据库的形成 字串3
从数据的获取、数据的编辑、数据的存储和管理、空间的查询与分析到图形的显示与交互,GIS系统的各个部分是统一且相互关联的。首先,需要对大量文字、数据属性及各种图件进行处理,形成的属性数据编入属性数据库,而各种矢量化后的图件资料,进行点线编辑、建立拓扑关系并编人矢量数据库。可以数字化的图件资料,在扫描及栅格化后编入栅格化数据库。栅格数据库、矢量数据库以及属性数据库三者经过统一的数据转换处理及属性挂接后再经由格式转换,最后形成一个馆藏相关信息数据库,如图1所示: 字串6
字串2
该数据库中,空间数据在逻辑上采用分层管理的方式构建。建筑区域、功能区域、楼层、基础设施、书架、借阅室等依照空间坐标的相关性分别存储于不同的图层之上。各图层又根据不同内容或以楼层为基础划分成不同的图层集,从而明确各要素问的空间关系。属性数据根据是否与空间信息相关分为两种,其中空间相关属性信息一般是对空间实体描述,如名称、类型、位置、编号等;空间信息无关的属性数据则诸如读者信息、借阅记录、著录信息、本体信息、固定资产信息等。 字串8
3.2 馆藏信息的关联性 字串9
值得注意的是,不同的关联将不同馆藏信息联系在一起并使其具有逻辑性,使得不同性质的数据库可以相互链接。将矢量、栅格、属性数据整合在不同的层面上,更是以后进行模型建立与计算、辅助决策的关键所在。下图总结了一些常见信息及部分信息间的关联(见图2)。 字串1
字串2
图2中,除各个数据库所包含的信息间存在联系外,读者与馆藏可以通过借阅记录关联;馆藏的领域本体可以和读者信息关联;文献资源通过分类号与书架关联;设施、楼层、区域、书架等可通过指定的标识号关联等,在此不再赘述。在GIS系统中,关系型数据库的作用就是使得空间信息和网性信息可以互相成为检索依据。 字串4
3.3 以知识管理为目的信息查询方式 字串5
在明确馆藏相关因子及其关联性后,依据前文所述的几种模型所采用的算法与函数构造约束条件,同时利用GIS组件开发相应的应用程序,以实现知识管理为目的信息查询方式。基本框架示意如图3所示: 字串5
用户提出查询要求时,一方面可以直接对相关属性数据进行检索,如具体某一本书以及任意的空间设施,或同时采集用户的情景记录对比相关情景模型形成情景用户分析;另一方面,通过用户检索词的语义分析或者直接对应本体查询,在由属性数据中归纳的诸多本体及用户模型映射集合、聚类产生的领域本体中进行匹配。亦可以通过事先由借阅关系生成的单元及二元网络模型进行节点匹配以寻求其他相关节点信息。在此基础上,检索反馈给读者的将不仅仅局限于传统图书馆GIS所检索出的文献信息和空间位置,更为重要的是将知识间的关联性展示在读者面前。其他相近专业、学科的读者都在关注什么问题,哪些的文献可以对当前的学习提供额外帮助,哪些知识需要被进一步认识,研究可以向什么方向拓展,可能从何处发现研究交叉的灵感,这些都是读者更加渴望了解的内容和期望的知识获取渠道,也是符合野中郁次郎SECI知识创新模型的知识管理方式。从文献角度看,原本侧重点不同或专业性较强的文献资源,被相关专业或其他专业领域的读者关注和借阅几率也将大大提高,从而了加速知识传播的速度。无论采取何种查询方式,单一或综合,相关空间属性信息都将与所检索的结果一一对应,在不同的图层上叠加后高亮显示,从而实现反馈给用户文字信息的同时完成空间图形的展示与交互并初步实现知识可视化的目标。当然,也可以加入最佳路径的算法模块和对RFID的支持,直观的向用户提供精确导航,进一步提高读者利用馆藏文献的效率。 字串9
4 结 语 字串2
本文从GIS在图书馆界的应用现状着眼,通过引入知识管理的理念,介绍复杂网络、本体、情景用户模型在个性化信息检索方面的作用等,试图寻找一种将GIS馆藏空间管理强化为GIS馆藏知识管理、扩展知识传播范围、加速知识传播速度、提高图书馆使用效率的途径,并对可能采取的应用方式进行了初步探讨。 字串8
信息技术和数据关系的研究和进展带来的多样化应用技术融合在数字图书馆的转变过程中,最终展现在受众面前的将不仅是信息获取的渠道,而是一个整合信息资源并提供多种分析处理方法以满足不同人群需要的工具。随着更多的研究方法和理念整合进地理信息系统,其必将在数字图书馆的发展中展现出更大的活力。 字串9
[作者简介]朱伟伟,男,1981年生,助理馆员,发表论文2篇。 字串8
字串1
|