摘要:数字图书馆”概念一经提出,就得到了世界广泛的关注,纷纷组织力量进行探讨、研究和开发,进行各种模型的试验。随着数字地球概念、技术、应用领域的发展,数字图书馆已成为数字地球家庭的成员,为信息高速公路提供必需的信息资源,是知识经济社会中主要的信息资源载体。
数字图书馆的技术架构 数字图书馆的技术架构类别:
1.数字图书馆的构成要素美国数字图书馆工作小组( DLib)曾于1998年在斯坦福大学召开数字会议,会后Virginia技术学院计算机系提出了数字图书馆技术构成要素的“5S理论”①。“SS理论”采用XML语言,按照不同的层面将数字图书馆系统分解为数据流( Streams)、结构(Structures)、空间(Spaces)、脚本(Scenarios)和社会(Socie-ties)等五项要素。
下面分别介绍这五项要素。数据流是指信息传输所涉及的内容、协议、路径、流动信息和固定信息。结构是指网络结构、语法结构、数字对象关联结构等,要求对系统、主题、术语和语法有明确规定。空间是由对象及运行规则组成,包括数字馆藏的主题范围、信息显示方式和框架。空间共同构成数字图书馆的“信息空间”,其中文献空间是数字图书馆空间的关键,它就是馆藏。脚本是指对数字图书馆服务、功能、特征和方法的描述。社会是指实体、行为和关系的集合体。“实体”由硬件、软件和网件(包括人)构成,“行为”指实体所做的工作,“关系”指社会实体和活动之间的相互关联。社会是数字图书馆生存的基础。
“SS理论”从各个屡面解析了数字图书馆的构成要素,虽然每个要素单独看来都有些抽象,但只要将这些要素组合起来,数字图书馆的结构和功能就呈现出来。比如:
社会+空间=用户界面社会+脚本=评价计划脚本+结构=对象剖析和功能模块空间+结构=信息分类结构+数据流=文献、超文本空间+结构+数据流=多媒体支持在数字图书馆系统开发中,系统将要存储的信息内容、结构、组织和描述方式、存取方式、用户服务、人机交互等基本问题,都可以应用“5S理论”来构成它①参见乔欢:《数字图书馆通用定义研究》,载《国家图书馆学刊》2005年第1期。
们之间的相互关系。IBM公司在“5S理论”的基础上提出了一套针对数字图书馆的解决方案,包括了五个项目:(1)资料的加工生产与获取;(2)储存与管理;(3)搜索与取用;(4)信息传递;(5)知识产权管理。这些解决方案基本上涵盖了数字图书馆的基本架构和功能。
2.数字图书馆的技术体系数字图书馆运行于计算机软硬件和网络基础设施之上,参照国内外研究成果,笔者认为数字图书馆建设应由资源建设系统、资源管理系统、信息服务系统和用户信息系统四个部分组成。
资源建设系统:包括资源加工系统、数据集成系统、异构资源整合系统。资源加工系统主要用于实现对文本、图像、视频、音频等信息的数字化采集、加工、处理。数据集成系统是对分布式资源库的集成。异构资源整合系统就是对各种结构和系统的资源库进行连接,实现跨库联合检索和统一管理。
数字资源管理系统:包括资源分布、存储、管理系统、统计分析系统、元数据系统、对象数据系统、图书馆网络自动化管理系统、联机编目和馆际互借系统等。
信息服务系统:包括信息导航、用户查询、检索系统、个性化信息服务系统、资源调度系统。其关键技术包括信息推送技术、数据挖掘技术、智能检索技术和人工智能技术。
用户倍息系统:包括交互式用户界面、用户权限及安全论证管理、用户电子邮件信箱、个人网页、课题网站、机构信息系统、业务信息管理系统等。
3.数字图书馆的层次结构数字图书馆基本模式结构可分为五层:第一层是应用界面层,包括用户查询、检索服务、信息搜索、资源调度、存储中心网站及各子系统的网页信息和相关的管理信息,可动态更新和建立跨服务器的对象链接。第二层是信息服务层,主要包括信息导航服务和个性化信息服务两个方面。第三层是元数据存储层,能存储书名、著者、主题词、分类号、文摘、提要以及其他索引信息。第四层是异构资源集成整合层,自动接入分布式资源库,实时进行信息采集,建立虚拟资源体系。第五层是分布式资源存储层,主要包括分布式的文本、图像、音频、视频及虚拟现实等多样化的数字化资源库。
以上结构的设计,应实现以下五项功能:一是要按照有关标准和规范对各种载体的信息资源进行数字化组织与加工,使信息规范有序;二是要具备设置存储和管理信息资源的能力;三是要实现高效跨平台、跨数据库检索和查询;四是要采用人工智能技术,在海量信息中挖掘、组织并传送用户所需要的信息;五是要有有效的权限管理和版权保护措施。
4.数字图书馆的结构与组成传统的图书馆是一个实体,它有固定的馆舍和一定数量的藏书,并通过图书馆员的工作来为读者提供各种方式的服务。其本质是收集、整理各种文献资料,保存文化遗产并为广大用户提供必要的服务。传统图书馆的组成无外乎馆舍、馆藏、馆员及其提供的服务这几部分。而数字图书馆则突破了馆舍的限制,是一个“无墙图书馆”;也突破了馆藏的限制,数字图书馆提供的信息并不一定存在于本馆内。
目前的数字图书馆大多采用C/S(客户机/服务器)形式,如图10.1所示。
(1)图书馆客户(Library Client)指的是信息用户(读者或图书馆员)。一般读者和图书馆员所拥有的权限是不一样的。读者只能对数字图书馆中的信息进行查询或浏览(阅读);而图书馆员除了查询、浏览的权限之外,还能对数字图书馆中的信息内容进行增加、删除和修改。
(2)图书馆服务器(Library Server)是数字图书馆中的管理核心。它包括用户信息的管理、信息对象的索引、访问权限的控制和用户查询请求的执行。它将从信息对象服务器( Object Server)那里取得符合要求的信息对象,并把它们传送给图书馆客户(读者或图书馆员)。
(3)信息对象服务嚣(Object Server)是数字图书馆的基础。它存储数字图书馆的“馆藏”。它的功能包括信息对象的物理存储管理、信息对象位置数据库管理及回答图书馆服务器( Library Server)的数据请求。一个数字图书馆只能有一个图书馆服务器,但可以有多个信息对象服务器。信息对象服务器可以分布在全球各地,它们之间由通讯网络连接。
与任何系统一样,数字图书馆作为一个系统,也包含一些必不可少的要素,离开了这些因素,数字图书馆就无从谈起。它们是数字化的信息资源、计算机管理系统及网络通信设施、图书馆员及用户。如图10.2所示。
数字化的信息资源是数字图书馆的核心,是数字图书馆提供各种信息检索服务、信息咨询服务和信息传递服务的前提和基础,没有信息化的信息资源,数字图书馆就无从说起。数字化信息不局限于本馆收藏的资源,还包括本馆可以提供的信息资源。信息资源主要分为四个部分:
(1)图书馆原有馆藏数字化后的信息。包括各种古籍、珍本、善本等,这部分信息是该图书馆特有的,是一个图书馆区别于其他图书馆的重要部分。
(2)图书馆收藏的电子出版物。包括软盘型电子出版物、光盘型电子出版物以及网络型电子出版物,如各种光盘类百科全书、软件、网络型电子期刊、电子报纸等。
(3)其他信息机构可提供的信息资源。这部分资源不是本馆实际收藏的,但是本馆可能是该信息机构的镜像站点,或者买断了提供信息复制的权利,因此有权限在一定范围内为用户提供各种服务。
(4) Int。,n。t上的信息资源。这部分资源不属于任何一个信息机构,任何数字图书馆都可以根据自己的需要,从Internet上收集所需信息,并对这些信息进行加工、整理,提供给用户使用。
计算机系统、网络系统是数字图书馆为用户提供服务得以实现的必备设施,数字化信息的存储、管理、检索、传输都必须借助于计算机系统、网络系统。因此计算机软件、硬件以及网络设备可以看作是数字图书馆的“硬件基础”,是数字图书馆榀供各种“软件服务”所不可缺少的。
人始终是任何一个系统的灵魂。数字图书馆中的人包括图书馆员和用户。
图书馆员收集、整理、管理各种数字化信息,将其以有序的形式存储于光盘、磁盘等各种数字化存储设备上,以保证数字图书馆信息的质量。维护各种计算机系统、网络设备,以保证信息服务的有效提供。此外,图书馆员接受用户的各种服务请求,根据特定用户的特定需要,提供个性化的信息服务。
用户则是数字图书馆的“上帝”,任何一个数字图书馆的所有活动、所有软硬件设施都是为了给用户提供有效的、准确的信息服务。通过数字图书馆,用户可以自由地获取想要的信息,也可以提出自己的特定需求,请求数字图书馆给予帮助。此外,用户也可以参与数字图书馆的建设,提出自己的意见和建议等。
\2008-1/38