设为首页 | 加入收藏
文献检索:

基于主题图与MARC的书目可视化检索系统设计与实现


□ 桂思思 石义金

华中师范大学信息管理系,湖北武汉430079

摘 要:

融合MARC、主题图与可视化技术,从设计步骤、实现方法两方面阐述基于主题图与MARC的书目可视化检索系统构建原理,并实现系统原型。系统以可视化的方式展示书籍间联系,有利于用户通过联系查找更多书籍。

桂思思 石义金

(华中师范大学信息管理系 湖北 武汉 430079)

摘 要:融合MARC、主题图与可视化技术,从设计步骤、实现方法两方面阐述基于主题图与MARC的书目可视化检索系统构建原理,并实现系统原型。系统以可视化的方式展示书籍间联系,有利于用户通过联系查找更多书籍。

关键词:MARC;主题图;可视化检索;书目检索;系统设计

中图分类号:G254.36      文献标识码:A

图书馆资源组织对象已由文献单元、元数据转向知识,其组织方式决定图书馆功能,影响服务的深度与广度。主题图在知识组织方面有突出优点,它可通过定义主题类型与相互联系形成某一领域的结构化的具有导航能力的知识网络。各方学者在主题图用于知识组织方面取得了很多积极成果。MARC(Machine-Readable Catalog,机读编目格式标准)是图书馆结合计算机的基础,它虽问世40余年,但其语义丰富,作为一种基本无损的书目信息格式的交换中介,仍受推崇。可视化能解释对象间联系,广泛用于数据分析、信息检索等领域。可视化在图书馆的应用研究较多,但涉及可视化检索较少。

若将三者结合,定能发挥MARC数据内涵丰富、主题图知识导航及可视化清楚明了的优势,有效帮助用户检索所需书籍。因此,本文在前人研究基础上,分析了MARC与主题图相结合的可行性,构建了基于主题图与MARC的书目可视化检索系统。

1 系统设计原理

MARC是专业图书馆员结合专业知识与相关操作规范,如《中国图书馆分类法》、《中西文电子资源CNMARC格式著录细则》等,经过智力劳动后得出的可信数据,可看作知识。同时,MARC数据按特定格式存储,结构化程度高,计算机处理方便。主题图作为一种描述信息资源的知识结构的元数据,可表示知识概念间的相互联系。主题图有三个要素:主题类型、联系、资源出处。

MARC记录可为主题图所用。例如,将MARC一个字段看作一个主题类型,当建立了主题类型(即MARC字段)间联系后,就完成了主题图概念模型的构建。再将每一条MARC记录看成一个主题,将主题图中的主题类型实例化,添入适当资源指引,可构建基于MARC的主题图实例。另外,MARC与主题图结合能避免重复信息标引的工作,优化信息组织的过程。

2 系统理论模型

本系统用主题图对MARC再组织,建立以书籍为对象的知识网络,并将检索结果以可视化方式反馈给用户。该模型包括资源层、主题图层、检索层以及用户层四个模块。理论模型如图1所示。

(1)资源层。包括图书馆实际馆藏书籍信息及相应MARC记录。馆藏书籍是检索的最终目的,MARC记录是馆藏书籍用于计算机分析处理的替身,是最直接操作的基本对象。

(2)主题图层。该层是系统的核心,本文第3节将作详细阐述。

(3)检索层。操作对象是主题图文档。主要是主题图文档的检索及检索结果的可视化反馈。

(4)用户层。提供人机交互界面,方便用户使用系统,帮助系统理解用户操作。

3 主题图层构建步骤

主题图层构建步骤如图2所示。

3.1 构建主题图概念模型

主题图概念模型是后续步骤的基础,直接影响本系统检索结果的精确性。若“主题类型”过少,则检索入口变少;若“联系”过少,则检索结果显示的关联性较弱,无法达到展现书目之间隐性联系的目的。

3.1.1 MARC字段确定

MARC字段多达几百条,因此必须思考哪些字段对用户具有更大的检索意义。如何选择MARC字段作为主题图要素是构建主题图概念模型的首要问题。通读《CALIS联合目录CNMARC字段一览表》、理解字段含义后,笔者结合温州大学图书馆以“OPAC书目检索字段选择情况”为题的问卷调查、《NBI net合作编目书目资料处理原理》及相关研究成果,结果见表1。

3.1.2 主题类型分析

“主题类型”要有代表性。本主题图概念模型有11个主题类型,具体如下:

(1)“正题名”、“并列正题名”。正题名是读者检索使用最多的检索入口,同时也是区分书籍的最佳方式。“并列正题名”是“正题名”的另一种表达形式,有利于检索翻译版书籍。

(2)“分类号”、“论题主题”。分类号、论题主题分别从中图法、主题法角度揭示书籍的内容,有效反应书籍的内容特征。

(3)“作者”。从侧面反应书籍间联系。跟踪某作者编著的书籍以及其合作者编著的书籍能发现内容相近书籍。

(4)“ISBN”、“出版社”。ISBN唯一标识书籍,查找结果唯一。不同出版社出版的书籍具有不同的内容偏向性,利用出版社可发现内容相似书籍。

(5)“主丛书名”、“附属丛书名”、“分辑名”、“分辑号”。“丛书名”相同的书籍在某一专业领域的内容相关度高。“分辑名”“分辑号”能反映书籍内容上的连续性。

3.1.3 联系分析

上述主题类型在主题图概念模型中只是分散的点,因此需建立主题类型间联系,形成图。具体而言,有3类联系:

(1)主题名与作者。第一作者编写关系、其他作者编写关系。通过上述关系,可推出作者间的合作关系。

(2)主题名、分辑名、分辑号间与主题名、主丛书名、附属丛书名间。均为三者关系,分别在书籍顺序及书籍内容方面有联系。

(3)主题名与并列主题名间、主题名与ISBN间、主题名与出版社间、主题名与分类号间、主题名与论题主题间。前三者为一对一关系。后两者是一对一、一对多关系。

3.1.4 主题图概念模型

综上,主题图概念模型如图3所示。

3.2 主题图实例模型构建

主题图概念模型只能方便人理解书目信息中各项目间关系,需要利用XTM(XML Topic Maps)技术将主题图概念模型代码化,方便计算机理解。XTM标准由topicmaps.org制定,通用标准为XTM 1.0。XTM语法严格,但人工编写代码繁琐且易出错,可读性弱。因此编写XTM常采用集成开发工具。因组件齐全且免费使用,本文选择Ontopia为主题图编写工具(http://www.ontopia.net):先利用Ontopia创建主题图原型(Topic Types、Association Types、Occurrence Types)。再将MARC对应字段的数据作为“Instance”加入Ontopia。在此处,笔者暂未开发自动提取MARC数据并加入Ontopia的工具,所以此处人工查找MARC记录,再输入Ontopia。

......(未完,请点击下方“在线阅读”)
特别说明:本文献摘要信息,由维普资讯网提供,本站只提供索引,不对该文献的全文内容负责,不提供免费的全文下载服务。

关于我们 | 网站声明 | 合作伙伴 | 联系方式 | IP查询
金月芽期刊网 2017 触屏版 电脑版 京ICP备13008804号-2