摘 要:对数字图书馆的体系结构和数字图书馆信息组织的主要模式的探讨及特点的分析。
1 数字图书馆的基本概念
关于数字图书馆的定义, 目前而言,还是仁者见仁,知者见者,说法不一。但大多数研究者以为, 数字图书馆并不是空间意义上的“馆”, 而是一种拥有多媒体内容的信息资源, 它的存在方式是将文字、图像、声音等信息数字化, 并通过互联网向用户方便快捷地提供信息知识的服务技术。数字图书馆与传统图书馆的最大不同就在于: 它变用户的集中为信息服务的集成。对于不同的使用对象来说, 数字图书馆表现出不同的特征和功能, 因而对数字图书馆的理解自然就各不相同。所以, 数字图书馆的共有特征可以概括为:收躲数字化;操纵计算机化;传递网络化;信息资源存取自由化;信息资源共享化; 结构连结化。基于此, 我们可以把数字图书馆简述为: 对有高度价值的文本、图像、语音、音响、影像、影视、软件和科学数据等多媒体信息进行收集, 进行规范性的整理加工, 进行高质量的保存和治理,实现知识增值, 并提供在广域网上高速横向跨库连接的电子存取服务系统。
2 数字图书馆的体系结构
体系结构是数字图书馆建设的关键, 它关系到系统的信息组织(即数字对象的存储) 和检索方式。影响数字图书馆体系结构的因素有很多, 包括社会与法律环境、通讯基础设施和网络技术、软件工程、硬软件环境、系统安全、访问权限、数字对象类型和数目等方面。美国数字图书馆研究的重要成果之一是提出了建设数字图书馆的八项原则, 并得到了学术界的普遍认同。这八项原则是:
(1)数字图书馆的技术框架存在于法律和社会的框架之内。
由于社会网络进程的不断加快, 数字图书馆将存在于一个广泛的经济、社会和法律框架内。这就意味着:法律体系必须根据迅速变化的经济和社会框架制定新的法律,包括知识产权、通讯法、国际法等; 数字图书馆的体系结构必须能够保护著者和所有者的权利, 考虑所涉及的经济、社会和法律题目。
(2)数字图书馆概念的同一理解。
数字图书馆中的对象称为数字对象(Digital Object),它们存储在仓储(Repository), 用句柄(Handle) 来标识。存储在数字对象中的信息称为内容(Content), 内容被分为数据(Data), 关于数据的信息称为属性( Property) 或元数据(Metadata)。作为基础的体系结构应和保存在数字图书馆中的信息相分离数字图书馆中的内容是多种多样的, 可以是文本、图片、动画、音频资料、计算机程序、模型设计或多种类型构成的复合资料。存储在数字图书馆中的这些信息内容往往和数字图书馆的体系结构相分离。适合于各种资料类型的特征是由体系结构规定的。这种特征通常包括适用于某类资料的特定的格式、协议和权限治理等。
(3)名字和标识符是数字图书馆的基本建构块。
名字用于标识数字对象, 登记数字对象中的知识产权, 记录所有权的变化, 在引用、检索和对象链接中不可缺少。名字是唯一的, 长期保持。句柄系统用于标识数字对象。用于标识用的字符串称为标识符。
(4)数字图书馆不仅仅是二进制数位的集合在数字图书馆中信息存储为数字对象, 不能简单地把数字对象看成是二进制数位的集合。数字对象可由两部分构成: 内容和元数据。一个数字对象可含有多种类型的内容如文字、图像、声频等。复杂的数据类型可由简单类型构成。元数据包括句柄、权限、访问方式、数字签名、交易日志等。
(5)数字图书馆对象使用时和存储时的形态可能完全不一样。
数字对象在使用时的形态和存储形态可能完全不同。例如, 图像可以小波形态存储, 使用时利用小波天生图像。音乐作品可以曲谱的形式直接传送给用户, 也可在仓储中用合成器演奏后将声频信号传给用户。数字图书馆的体系结构必须仔细区分天生的原始数字对象、存储在仓储中的数字对象和提交用户的数字图像。