摘要:公共图书馆包括省、市、地级图书馆及区县级图书馆。公共图书馆是群众文化生活的重要场所,起着传播文化、全民继续教育、与休闲娱乐的作用,同时也在传承中国文化中发挥着重要作用,特别是一些具有地方特色的馆藏,其保存、传播与服务、利用更具积极意义。
在信息飞速发展、各种信息泛滥之时,公共图书馆应如何面对?应如何对充斥于各种媒体信息择优汰劣?如何利用先进的信息技术,提供更优质、全面、便捷、准确的信息服务,做到图书馆功能与服务的与时俱进?数字图书馆的提出与兴起正是信息时代应运而生的产物。但是,如何进行数字图书馆建设?面对各种解决方案,各馆条件不同,如何才能选择满意的方案?在数字图书馆建设中,如何清晰思路、明确内容、合理预算、理顺流程是各图书馆普遍面临的问题。
我公司积数年数字图书馆建设的经验,依托国家图书馆得天独厚的环境及在数字图书馆建设方面的领悟与实践。紧跟国际数字图书馆建设的主流技术,在承担了多项国家级与部级数字图书馆科研项目,参与制订国家多项数字图书馆标准,以提高自身修为的前提下,专注于数字图书馆的应用规划和运行平台开发,旨在帮助客户了解在信息网络化环境下,图书馆如何更好的为读者、为社会提供服务,这些服务功能如何通过应用软件系统实现,实现这些需要如何匹配软硬件环境,进而协助客户制定出切合实际的数字图书馆建设目标。这一建设思路可使数字图书馆建设项目的预算更趋合理,帮助建设者思路清晰地把握项目的整体大局,进而最大限度地降低项目的投资风险。实践证明,很多图书馆遵循这样的思路所进行的项目建设是成功的。
一、 建设原则
1.1 开放性
图书馆会面对国内外各类资源数据库。系统平台技术的开放性至关重要,关系到内容的交换,系统的平滑升级,更好利用最先进的技术,走在数字媒体发展的最前沿。为此在操作系统平台、存储架构、软件平台、网络架构等都应建立于与主流相关厂商现有开放策略和标准的基础之上。
1.2 先进性
立足于国内最先进的系统设计思想,在投资一定的前提下,采用可能的最先进的软件技术和开发工具,以达到使我们的系统具备在国内处于领先地位的终极目标。
1.3 技术的标准性和规范性
要保证先进性的同时,要严格遵循有关的国际标准规范。在技术上采用国际标准或工业标准,在系统设计中采用发展前景优良的新技术,同时也有利于技术的升级和设备维护。在管理上严格执行规范,保证各系统之间的信息共享、互通互连。各种数据规范、代码体系也必须遵循国家和行业的相关技术标准。要兼顾到未来的技术发展和产品的长期稳定性,充分采用现有成熟而先进的技术,保证系统满足实际应用需求,吸取目前国际国内同行业在图书文献保障系统方面已经拥有了的成功有经验,扬长避短,并着眼未来有关技术的发展前景,保证全系统有较长的生命周期和较高的性能价格比。
1.4 安全可靠的质量保证
可靠性表现在合理分析构造整个系统的结构体系,完美地设计每一个构成的软件系统,细致严谨地设计建设所有的网络系统等各个方面,提高整个系统和网络的性能的前提是要保障数据的可靠的安全的生成、存储、处理和传输。系统体系要求能够支持一个数量持续增长、复杂的业务应用,并具有较高网络效率和可靠性,为系统提供可靠的数据处理支持环境。
系统必须具有一定的诊断、测试手段和监测能力。提供多种后备措施,应用软件有多种办法保障用户的数据完整性,对数据采取有效的数据备份和恢复手段,使系统具有较强的容错能力,并在系统失效重起后能尽快恢复。对网络用户实施统一的管理,实现用户信息存取的身份识别和权限控制。
1.5 实用性
构造方案基本框架时应考虑到目标系统对应用系统最终操作者培训的要求,这在系统运行期间产生的运行成本中也将是一个很重要的因素,从系统设计和系统实现两个方面都应考虑到必须尽量降低对操作者在计算机操作,对系统本身熟悉程度,甚至对行业本身的业务能力等各方面要求,否则不仅意味着对其进行基本培训费用的增加,也意味着为此而必须储备的熟练操作人员人数的增加。
不仅要做到技术先进、成熟,还需技术支持广泛,开发工具通用,价格合理。方案能够实现资源高度共享,用户界面做到直观、丰富、友好性强,把目标系统建成一个结构合理、功能齐全、界面友好、实用好用的系统。
1.6 强伸缩性的系统体系结构
一个适应性强的应用系统应该有较远的前瞻能力和预见能力,市场和读者提出的需求也不是一成不变的,同时,更先进的管理思想与保障技术也将会走入我们的视线,所以,在系统体系结构允许和时间、成本的增长在可以接受的前提下,应该给系统的伸缩性给予最大程度的考虑。系统的可伸缩性是软件质量体系中重要的指标之一,系统的设计从最开始就应该考虑尽可能多的任务的需要,以在未来变化的环境和需求下减少尽可能多的工作量。
1.7 高度的可维护性
由于应用软件需求界定的困难且需求变化的在所难免,为方便今后调整、修改和增加功能,应用软件的设计和编码要充分考虑软件结构的简洁清晰,通用功能的模板化和编码的可读性,从而保证未来的各种软硬件投入具有良好的可维护性?可继承性和可复用性。
1.8 高性能价格比
在能够满足系统基本要求的前提下尽可能地降低系统成本,根据应用系统对计算机的各种性能如速度、内存及其它需要,在同样能够满足应用系统的以上各要求的前提下,尽可能采用低成本的方案,最大可能地提高系统的性能价格比。
1.9 保护用户已有投资
保护用户已有的投资,包括软件系统,硬件资源,人力投资等,是系统设计必须考虑的因素。
二、 需求分析与系统构成
2.1 需求分析与定位
各馆应根据自身的地位、经济状况、馆藏及人员情况及区域经济及人文环境,来考虑数字图书馆建设的定位。因公共图书馆承担着为党政机关、科研、教育、文化和企事业单位以及社会公众服务的职能,所以在定位时应充分考虑社区、政府、科研、教育、企业的对自己的需求,并对数字图书馆建设后可扩展的功能予以足够重视,这样,才能较好地把握自身数字图书馆建设的定位。
2.2 系统构成
确定图书馆自身在图书馆界、地域信息网络建设中及数字图书馆建设中的地位后,就要全面考虑数字图书馆建设的系统构成了。
按照当今数字图书馆先进技术体系主要内涵的内容,数字图书馆信息系统由基础设施层、系统支撑层、应用服务层三个层次组成,其结构图示如下: 应用服务层
系统支撑层
基础设施层
基础设施层包括综合布线系统、机房系统,为信息系统提供必要的信息传输条件和系统工作环境。
系统支撑层包含网络系统、服务器系统、存储系统和安全系统,系统支撑层为应用服务系统提供了运行环境。
应用服务层包含了数字图书馆的各个应用软件系统,如业务管理系统、数字图书馆的资源建设系统、管理系统和服务系统等。应用服务层是数字图书馆信息系统发挥功能的关键。
三、 应用系统的构成
TD
数字图书馆是基于网络环境的可扩展的知识网络系统。它以数字化信息资源的挖掘、加工、整序、存储、传输与管理为主要内容,涵盖多个分布式、超大规模、可互操作的异构多媒体资源库群。可通过互联网络,得到高效跨库、无缝链接的信息内容服务。它既是知识网络,又是知识中心,同时也是一套完整的知识定位系统。其中应用系统是实现数字图书馆的设计功能,体现数字图书馆有区于传统图书馆性能的关键所在。
3.1 应用系统的主要构成
3.1.1 业务管理系统平台主要是构筑图书馆业务自动化、办公自动化;资源共享调度系统以及读者服务管理系统实现对图书、馆际资源、馆员、读者的有效管理是数字图书馆建设基础平台。
3.1.2 数字资源建设平台一方面是将图书馆的纸质文献转化为数字化资源提供服务,另一方面通过网络资源建设系统对网络上资源进行采集以及某些专家、读者的自建资源,进行搜集并实现自动标引自动生成文摘,形成专题数据资源,是数字图书馆建设的重要平台。
3.1.3 数字资源管理平台对图书馆所拥有的各种数字资源进行管理,提供检索和发布功能。其中的音视频资源管理系统可实现音视频资源的在线点播直播服务。
3.1.4 数字资源服务平台是为读者提供建立在数字化资源基础上的如my library、虚拟专家咨询、光盘映像数据管理、读者资源选购等服务平台,是数字图书馆建设中实现个性化服务的重要组成部分。
3.1.5 图书馆服务系统平台通过多媒体导航系统为到馆读者提供各种服务导航;网络应用检测系统为图书馆系统管理员提供对种类业务应用的监测、提醒服务;而多媒体电子教学系统则采用多媒体手段提升图书馆的教育职能。
3.1.6 门户系统平台通过为图书馆建立门户网站,提供向读者进行各类服务及信息交流,是图书馆的服务窗口,读者将通过这里综合了解信息、享受各种服务。针对图书馆技术特点门户系统力求动态维护更新以减轻图书馆日常网站维护压力。
3.2 图书馆应用软件集成
图书馆建设是一个复杂的系统工程,图书馆各种网络系统、应用软件、业务管理系统的使用,都是建立在一定硬件基础和资源基础之上。各个系统之间相互联系,有机整合才能发挥最大的效力。
四、 硬件系统方案
数字图书馆是一个硬件和软件组成的多层次的复杂的系统,其中硬件系统支撑平台的系统有四大块:
网络系统 信息安全系统 主机(服务器)系统 存储和备份系统网络系统
4.1 系统设计所遵循的原则:
4.1.1 实用性和先进性:采用先进成熟的技术,兼顾其他相关的业务要求。尽可能采用先进的网络技术适应更高的数据、多媒体信息的传输要求,使整个系统在一段时间内保持技术的先进,并具有良好的发展潜力,以适应未来信息化的发展和技术升级的需要。在功能实现上要兼顾现实和未来。
4.1.2 安全可靠性:包括设备安全和信息安全。动态路由协议、虚拟路由协议、Tree技术等保证网络在出现故障时迅速挽救和恢复。为保证图书馆业务工作,网络必须具有高可靠性。要对网络结构、网络设备、服务器设备等各个方面进行高可靠性的设计和建设。在采用硬件备份、冗余等可靠性技术的基础上,采用相关的软件技术提供较强的管理机制、控制手段和事故监控、网络安全保密等技术措施提高网络系统的安全可靠性。防火墙应用、VPN技术、加密技术和安全认证实 现信息安全的需求。双机热备份、集群技术、磁盘阵列、存储网络实现信息的安全存储和数据恢复丢失。
4.1.3 灵活性与可扩展性:网络系统是一个不断发展的系统,所以它必须具有 好的扩展性。能够根据信息化技术的不断深入发展的需要,方便的扩展网络覆盖范围、扩大网络容量和提高网络各层次节点的功能。具备支持多种通信媒体、多种物理接口的能力,提供技术升级、设备更新的灵活性。
4.1.4 开放性和互连性:具备与多种协议计算机通信网络互连互通的特性,确保网络系统基础设施功能的充分发挥。在结构上真正实现开放,基于国际开放式标准,包括各种广域网、局域网、计算机及数据库协议,坚持全国统一规范的原则,从而为未来的业务发展奠定基础。
4.1.5 经济性和投资保护:应以较高的性能价格比构建计算机网络系统,使资金的投入产出比达到最大值。方案中采用的设备和技术应具有前瞻性,在可预见的未来的设备改造中,要保证现有设备能最大程度的被继续使用,使目前的设备投资未来也能发挥较大的作用。能以较低的成本、较少的人员投入来维持系统运行,提供高效能和高效益。尽可能保留并延长已有系统的投资,减少以往在资本与技术投入方面的浪费。
4.1.6 可管理性:馆域网网络系统是一个遍布全馆各个职能单位,多层次的网络系统,由于系统本身具有一定的复杂性,随着业务的不断发展,网络管理的任务必定会日益繁重。因此在网络设计中,必须建立一个全面的网络管理解决方案。网络设备必须采用智能化、可管理的设备,同时采用先进的网络管理软件,实现先进的分布式管理,最终能够实现监控、监测整个网络的运行状况,合理分配网络资源、动态配置网络负载,可以迅速确定网络故障等功能。通过先进的管理策略、管理工具提高网络的运行性能、可靠性,从而简化网络的维护工作。网络必须实现网络故障的自动发现、实时监控、主动报警和故障定位。
4.2.网络系统建设:
4.2.1 图书馆网络系统所采用的技术
局域网(LAN):
千兆以太网(IEEE802.3/100Base-T/1000Base-T/1000Base-SX)
广域网(WAN):
DDN(数字数据网Digital Data Network):速度64Kbps-2.048Mbps(E1标准),利用光纤(数字微波和卫星)传输数据信号。
虚拟局域网技术(VLAN):
虚拟局域网VLAN(Virtual LAN)是指在交换局域网的基础上,采用网络管理软件构建的可跨越不同网段、不同网络的端到端的逻辑网络。
第三层交换技术:
将路由技术与交换技术合二为一的技术,在交换机内部实现了路由,提高了网络的整体性能。
虚拟专用网技术(VPN):
利用Internet来传输私有信息而形成逻辑网络
无线网络技术(WLAN):
利用无线电波作为数字信息传输信道的无线局域网( IEEE 802.11g )
4.2.2 图书馆网络系统需求分析图书馆不断发展的需求
近十年来,图书馆计算机网络系统随着科学技术的进步和图书馆需求的提高而不断地发展扩大。
90年代初期图书馆主要的计算机应用是业务自动化系统,采用一台服务器和若干终端组成,10M网络已能满足需要。
90年代中期图书馆增加了电子阅览服务,通常有十几到几十台终端,访问的数据资源以文本方式为主或包括少量图形方式,网络也升级到100M。
今日的图书馆进入了数字化的时代,除了图书馆业务系统不断升级采用大型数据库外,电子阅览和网络服务的终端也增加到几百台,更重要的是数字资源除了文字的以外,还有大量的视频、音频、图片和动画等多媒体信息,百兆网络已不能适应,纷纷采用千兆甚至万兆网络。
4.2.3 图书馆网络系统设计要点
·局域网采用多层星型以太网结构,主干为千兆、终端为10/100M自适应到桌面。
·核心交换机当交换端口在1000个以上时考虑采用可扩展、中端以上型号的交换机,根据经费情况选择单机或双机冗余方式,根据需要设计交换机光口和电口模块。
·分支交换机按分机房布置,当支持的端口较多时,采用堆叠方式。
·核心交换机与分支交换机之间采用光纤连接,根据端口密度设置光纤通道聚合链路。
·广域网接入采用DDN(数字数据网)方式,局域网连接广域网通过路由器。
·网络管理通常采用核心交换机厂家的产品。
·网络安全在接入广域网时安装百兆防火墙,安装网络防病毒系统。
·以有线为主、无线为附,在阅览室、会议室或其他不宜进行布线的场所采用无线网络或作为有线网络的扩展手段。
4.3 服务器系统建设:
4.3.1 图书馆服务器设计要求服务器(Server):
4.3.1.1 服务器(Server):
图书馆服务器指在网络环境中为客户机(Client)提供服务的、高性能的专用计算机。服务器承担着图书馆管理和数据的存储、检索、发布等关键任务,是数字图书馆的数据中心、管理中心和应用中心。要求:技术先进 、安全可靠 、兼容性好、高速的处理能力、网络通信能力强、性价比高等。
4.3.1.2 设计要求
近年来,随着数字图书馆概念的提出,数字资源的丰富,在图书馆信息化建设中,作为计算机核心的服务器系统面临巨大的压力,因为在目前的数字资源中,大部分为音频视频及图像数据,在数字图书馆应用中,这些数据能大并发的浏览及使用,因此,要结合数字资源的现状及图书馆业务的特色来配置服务器系统。
图书馆应用系统的种类、数量,访问并发数和对服务器性能、安全方面的要求。
图书馆馆藏数字资源(包括音视频、电子图书、数据库和文字图片等)的使用和容量要求。
图书馆应用系统对系统平台的要求(UNIX/Linux/Windows)。
图书馆建设规模和资金情况统一综合考虑,一步到位或分阶段进行。
保证未来一段时间的发展需要。
服务器厂商的服务、价格等。
4. 存储系统的建设:
4.4.1 需求分析
在现在的网络环境中,随着数据量的不断增加,存储系统的重要性显得越来越突出。根据对数据的分析,各种数据存储时在安全性、大并发、实时性等方面提出了不同的要求,存储器做为资源的存储地,在整个网络系统中占有重要的地位,因为它不仅仅解决了电子资源的存放问题,对这些电子资源的使用(如怎样提供更快速访问等)都具有重要的作用。如何选择存储系统,现已成为每个图书馆网络建设中的一个重要的课题。因为在图书馆的数据存储过程中,我们要根据数据特性的不同。在保证应用的前提下,按最佳的性能价格比来选择存储设备。
4.4.2 三种常见的大容量存储技术在图书馆都有应用
· DAS/SAS 直接附加存储/服务器附加存储:
DAS(Direct-attach storage)以服务器为中心的存储结构。各种存储设备(通常是磁盘阵列)通过IDE、SCSI等I/O总线连接到服务器,客户端通过服务器访问存储设备上的数据,占用主机的CPU和I/O通道。
· NAS 网络附加存储:
NAS(network-attached storage)是一种内嵌系统软件,提供跨平台和文件共享的专用数据服务器。支持各种网络技术 ,自带存储操作系统,直接连到网络上操作简单。
·SAN 存储区域网络:
SAN(storage area network)是一个基于光纤通道技术,面向网络的存储结构,采用可扩展的网络拓扑结构连接服务器和存储高速存储网络。
4.4.3 磁带备份系统
备份就是用离线存储系统拷贝在线数据并能在需要时恢复到在线存储系统中。
三种常用备份方式 :
全备份:对整个服务器系统进行备份,数据全面完整,但数据量大、时间长、内容重复;
增量备份:上一次备份后增加的和修改过的数据 ,没有重复、节省空间,但恢复数据麻烦;
差分备份:上一次全备份之后新增加的和修改过的数据。
常用备份设备:磁带机、磁带库等。
4.5 网络安全系统:
随着信息技术的发展,网络安全已变得越来越重要,在图书馆的信息化建设过程中,对各种数据库的保护已迫在眉睫,如设置不当,会形成网络应用瓶颈,同时,在网络安全系统建设中,决不能指望靠技术手段解决全部问题,要采用多种手段来保证网络的安全,有时这些非技术手段会起到决定性的作用。
图书馆网络系统作为信息集散和发布中心,其安全保障体系是实现信息共享、快速反应和高效运行的重要保证。安全保障体系应该能保障网络安全、可靠的运行;提供对应用系统和业务的保密性、完整性和高度的可用性,同时为将来的应用提供可扩展的空间。因此网络和信息安全保障体系成为图书馆系统中的重要组成部分,贯穿于网络系统设计的全部过程。
4.5.1 设计目标
图书馆网络工程安全保障体系的设计目标体现在两个方面:
能够抵御业务信息化所带来的各种威胁,具备一定的容错、容灾能力,有效地防止内部人员的故意犯罪,抵御来自内部与外部、针对各种对象的各种方式的攻击,防止有害信息的传播。能提供严格的安全扫描与入侵监控,通过各种形式的记录能够实现安全漏洞的迅速发现、和修改;利用相应的网络安全和监视软件,实现网络故障的发现、查找、定位和解决;利用完备的安全日志,提供对网络入侵和破坏动作的记录。
4.5.2 设计原则 安全保障体系涉及到整个工程的各个层次,网络和信息安全方案的设计因该遵循以下原则:
4.5.2.1 整体安全 信息安全是一个复杂的系统工程,不是某一种单元技术可以完全解决的,必须从一个完整的安全体系结构出发,综合考虑信息网络的各种实体和各个环节,综合使用多种安全手段,为信息网络和图书馆业务系统提供全方位安全服务。
4.5.2.2 有效管理 没有有效的安全管理(如防火墙监控、审计日志的分析等等),各种安全机制的有效性很难保证。本网络信息系统所提供的各种安全服务,涉及到各个层次、多个实体和多种安全技术,只有有效的安全管理才能保证这些安全控制机制真正有效地发挥作用;
4.5.2.3 合理折衷 基于经费与图书馆信息安全需求看,单纯考虑安全而不惜一切代价是不合理的。安全与花费、系统性能、易用性、管理的复杂性都是矛盾的,安全保障体系的设计应该在以上四个方面找到一个合理的折衷点,在可接受的风险范围内,以最小的投资换取最大的安全性,同时不因性能开销和使用、管理的复杂而影响整个网络系统的快速反应和高效运行的总体目标。
总体而言,对于图书馆网络防范,应该采用多种技术融合,多个层面结合的方法,通过安全技术、网络技术、操作系统技术、集群技术等多方面技术,实现对于图书馆核心数据的保护。如下图,通过四种不同技术手段,在多个层面上实现信息保护。
从信息防护的技术应用上看,图书馆信息安全保障体系大致可以分为网络安全、系统安全、应用安全三个层面,并由于其实体不同而采用不同的安全策略和安全技术。
安全管理包括安全技术和设备的管理,安全管理制度,部门与人员的组织规则等。管理的制度化程度极大地影响着整个网络的安全,严格的安全管理制度、明确的部门安全职责划分、合理的人员角色定义都可以在很大程度上降低其它层次的安全漏洞。
4.6 综合布线系统 综合布线系统包括语音通信、计算机网络、保安监控、楼宇自控和闭路电视等,在大楼建设时,对各种系统的布线要统一进行设计。但目前由于各种信号传输的特殊性,不可能用一种布线完全代替所有的布线。目前图书馆数字化项目中的布线系统主要指用于计算机网络的结构化布线系统。
4.6.1 布线标准:
综合布线系统是一个用于语音、数据、影像和其他信息技术的标准结构化布线系统。综合布线系统是建筑物或建筑群内的传输网络,它能使语音和数据通信设备、交换设备和其它信息管理系统彼此相连接,包括建筑物到外部网络或电话局线路上的连接点与工作区的语音或数据终端之间的所有电缆及相关联的布线部件。
4.6.2 综合布线子系统划分
工作区子系统:由终端设备连接到信息插座的连线组成,包括连接器和适配器。
水平干线子系统:实现信息插座和管理子系统(跳线架)之间的连接。
管理子系统:由交连互连配线架组成。为连接其他子系统提供了连接手段。
主干线子系统:用于实现对各水平子系统的连接汇集。
设备间子系统:由设备间中的线缆、连接器和相关的支撑硬件组成,用于将公共的各种设备连接起来
建筑群子系统:连接各大楼的布线系统, 图书馆布线除具备一般智能大厦的要求外,对布线的点位与方式还有自身的特点,例如:电子阅览室和电子教室要求有几十到几百信息点的集中布线;办证与查询区的设置;采编和数字化加工等房间计算机比较集中使用;图书阅览室通常为大开间,目前信息点要求较少,如何适应未来的发展等。