摘要: 伴随着美国政府提出兴建国家信息基础设施(NII)和因特网的迅速普及而出现的“数字图书馆”(digital library),其理论和技术是20世纪90年代的一个国际性热点论题,也已成为许多发达国家 图书馆高技术应用的一个新领域。
虽然“数字图书馆”这一概念已远远超出了传统图书馆的涵义,但由于“数字图书馆”所具有的信息资源数字化、信息传递网络化、信息利用共享化、信息提供知识化、信息实体虚拟化等特点1,对传统图书馆在图书馆理念、图书馆建筑、图书馆组织机构、图书馆资源建设、图书馆技术服务、图书馆读者服务、图书馆馆员等诸多方面都会产生深刻而革命性的影响,因此国内外图书馆学、情报学界对数字图书馆的研究都倾注了极大的热情,并从应用上规划、诞生了比较多的在传统图书馆基础上的试验性数字图书馆计划和项目。
我国对“数字图书馆”的探讨初见于1994年,1995年开始规划第一个应用型项目—由清华大学、复旦大学和中国石油天然气总公司与IBM合作,进行三个专题的数字图书馆研究开发工作。但真正大规模进行“数字图书馆”的研究与建设则是1996年8月在北京召开的第62届IFLA大会(会上举行了主题为“数字图书馆:技术与组织影响”的专题讨论会)及1997年“全国信息化工作会议”之后,同年7月“中国试验型数字图书馆项目”得到国家计委的批准立项。因此“九五”期间正是我国“数字图书馆”研究与开发的初始阶段,上海也不例外。
1主要成果与进展
“九五”期间的上海,信息技术、信息产业、信息化等都得到了长足的发展,保持了在全国的领先地位。对于数字图书馆这样一个与信息技术及其应用密切相关的领域,上海地区所进行的研究和应用开发也取得了比较显著的成就:
1.1 数字图书馆基础理念与理论的研究
对数字图书馆这一新生事物,其基本理念及运作模式始终处在不断发展、完善的过程中。上海图书馆根据实际建设过程中的理性思考和概括总结,对数字图书馆带来的机遇与挑战、数字图书馆的出现及其在世界各国的发展、国内数字图书馆研究开发现状、数字化对传统图书馆的变革、数字图书馆实务、数字图书馆建设中的著作权保护问题、数字图书馆人才建设等问题作了比较深入的研究,得出了许多有独到见解的观点与结论,尤其对于数字图书馆定义的新概括、对于数字图书馆实务中的相关问题、对于数字图书馆建设中的著作权保护问题等的研究都是比较新颖而全面的,这些都反映在了《数字图书馆引论》1一书中。复旦大学计算机科学系数字图书馆研究小组的《数字图书馆概论》2翻译自美国学者、《Digital Library Magazine》的创始人--William Y. Arms撰写的《Digital Libraries》,该书从数字图书馆发展的背景、环境,数字图书馆的历史、现状及未来趋势,数字图书馆的社会、经济、机构,数字图书馆的技术及实用组件等各个方面作了详尽、系统的阐述。该书的翻译出版,对国内的数字图书馆基础理论研究具有极大的参考价值。而同样是2000年出版的另一部专著--《数字图书馆:从理念走向现实》3,正如陈誉教授在其前言中所评价的,该书“深入浅出地告诉我们数字图书馆的含义、发展轨迹、现状和前景、它的基础条件、它的组织模式、资源建设、资源整序、资源存取以及它的利用和社会价值”3。另外,上海交通大学的《图书馆自动化新论—信息管理自动化》4一书,也专门辟有一章论述了数字图书馆的由来、国内外数字图书馆研究概况、数字图书馆的体系结构、数字图书馆的功能、数字图书馆的实用范例等数字图书馆的基本问题。这些有关数字图书馆专著的相继出版,表明上海地区九五期间数字图书馆基础理论研究的相对活跃。
1.2 数字资源组织与管理的标准化研究
与数字图书馆相关的标准化问题很多,涉及到系统结构、通讯传输、信息检索、文本编码等等多个方面。而其中,对于数字资源组织与管理的标准化研究是图书馆学情报学界研究的焦点问题之一。
数字图书馆大大扩展了传统图书馆的“馆藏”含义,不同信息格式(如声像资料、磁性介质资料、光介质资料等)、不同信息类型(如书目文档、应用软件、全文信息、多媒体信息等)、规范性结构化文本与非规范性动态信息、数字化的实体馆藏以及网络化的虚拟馆藏等都构成数字图书馆馆藏发展的完整内容。因此,坚持对多元化“馆藏”资源组织与管理的标准化是实现有效利用各种信息资源的根本,也是数字图书馆建设的一个关键。
上海图书馆在上海数字图书馆建设的实践中追踪、研究了国内外数字图书馆资源组织描述的相关标准,最终创造性地选择、应用了以都柏林核心元数据(Dublin Core,DC)作为上海数字图书馆资源描述的核心元数据集,多种对应于不同资源类型的元数据方法并存,并以RDF为基础的资源描述体系将它们封装在一起,构建了上海数字图书馆多种元数据标准并存的体系。上海图书馆在此研究的过程中形成了一部专门性的论著--《DC元数据》,系统论述了DC元数据的发展、DC的应用句法与结构、DC与USMARC的比较、CORE系统介绍、CORE著录操作实践、CORE寻路器的创建与CORE系统的管理等各个方面的相关问题。这也是国内对元数据论述比较系统的一部专著。
1.3 数字图书馆应用技术研究
数字图书馆是一个开放式的硬件和软件的集成平台,通过对技术和产品的集成,将各种载体数字化,进行有效的存取与组织,提供网络化的有效服务。这中间所包含的主要环节,即数字化资源的创建和获取、数据的存取与管理、组织有效的访问和查询、数字化资源的发布与传送、系统管理与版权保护等都涉及到了大量的技术问题。而相关技术问题也始终是国内外对数字图书馆研究最孜孜不倦的一个主要方面。
上海地区“九五”期间对数字图书馆技术方面的研究,有复旦大学的数字图书馆项目,此项目是国家自然科学基金项目--数字图书馆关键技术研究中的一部分,重点研究开发大容量、分布式、多媒体数据库的智能存取技术。有前述上海图书馆基于XML结构的RDF描述体系的多种元数据封装技术。而另一个较为突出的成果是上海交通大学图书馆对于音乐数字化检索和传播技术的研究。上海交通大学图书馆在建设其音乐数字图书馆原形的过程中,对乐曲数字化,尤其是中国民族音乐的简谱如何转化为数字化的五线谱并加以显示,全曲检索以及音乐数据库的网上查询等三项关键技术进行了比较深入的研究,并建成了一个可供在因特网上访问的音乐数据库全文检索的试验系统。
其它方面,诸如数字图书馆的体系结构、整套解决方案、加密技术、全文检索技术、多媒体检索技术等的研究则主要侧重于介绍。
1.4 数字图书馆的版权保护研究
网络环境下知识传播与交流的知识产权保护问题一直是受关注的焦点之一。只是由于数字图书馆的资源组织、管理与服务模式打破了原本在著作权法规范之下著作权人、出版发行机构、图书馆和读者之间利益关系的相对平衡1,使得数字图书馆建设中的知识产权问题显得尤为突出。
上海图书馆的周德明在对“网络版权问题的分析与思考”、“关于数字化环境下图书馆的‘特权’问题”、“网上著作权保护与数字图书馆建设”等一系列研究的基础上,在《数字图书馆引论》一书中又系统地对网上作品的著作权保护、网上作品的确权、著作权集体管理组织、作品的上、下载和复制、数据库的著作权保护、数字化转换的法律性质、图书馆的“特权”等问题等进行了比较深入的阐述。而上海交通大学图书馆在此方面的研究中提出了从立法与技术两个方面着手进行数字化产品版权保护的观点。
1.5 出现了几个数字图书馆雏形
1.5.1 上海数字图书馆
上海图书馆是国内最早进行数字图书馆建设的公共图书馆。1997年7月作为全国六大公共图书馆之一开始参与“中国试验型数字图书馆项目”(由文化部向国家计委申报立项,1997.7 – 1999.12,后延长一年),同年,在上海市政府的支持下,通过每年设立数字图书馆专项开始启动数字化工程,1999年有7个数字化项目同时进行,2000年经过系统集成和应用开发,完成一、二期建设工程,初步建成上海数字图书馆。
上海数字图书馆项目在建设过程中,充分研究、跟踪并采用了国际上数字图书馆的主流技术,采用IBM Digital Library version 2.4作为主要开发工具应用平台,体系结构上支持面向对象的分布式资源组织模式,内容管理采用以Dublin Core为基础的资源描述元数据方案,允许多种元数据方法并存,并以XML/RDF方式进行封装,保证了原始素材内容管理中元数据的完整性与互操作能力,整体上开放式的设计为将来国际国内数字图书馆的互联打下了良好的基础。
作为数字化的第一步,上海数字图书馆在资源建设方面也进行了深入研究和开发,形成了目前非常具有上海与上图特色的数字化资源群。这一资源群由九个资源库组成,从功能上可分为两类,一类是实现宣传教育和文化保存功能,包括上海图典、上海文典、点曲台、古籍善本、民国图书等;另一类为科教兴市服务,包括科技会议录、中国报刊、西文期刊目次、科技百花园等,总容量超过200GB。
1.5.2 上海交通大学数字图书馆雏形
上海交通大学图书馆在实施自身的“数字图书馆建设计划”并参与国家教育部的数字化图书馆公关计划过程中,初步形成了上海交通大学数字图书馆雏形。至2000年,上海交通大学的数字图书馆雏形所建成的数字化资源约占实际使用馆藏文献30%左右,达到300GB,包括联机目录和电子参考资源(索引和摘要、辞典、百科全书、电子全文杂志和会议录、多媒体读物、影视动画资料及计算机软件等)。这其中,除了大量引进数据库和全文电子期刊外,比较有特色的研究与应用成果是数字化音乐图书馆雏形、一个小型的数字化视频数据库示范系统、上海交通大学博士论文全文数据库及机器人文献数据库。
1.5.3 复旦大学数字图书馆
复旦大学的数字图书馆目前已包含有教学参考书刊、抗日战争时期出版物、馆藏古籍书目及书影、中国明清史档案文献、中华民国史档案文献、综合图书以及新青年杂志等多种数字化资源。
1.5.4 上海网络图书馆
1997年12月开始启动、1998年6月完成的上海市高校虚拟图书馆是另一层面上的数字图书馆形式。该系统在上海市教委的领导下,联合上海15家高校图书馆,采集其书目数据、全国原版外文期刊预订目录、上海市高校核心期刊预订目录,进行一系列标准化、规范化的数据处理,并在上海教科网上开通上海市高校虚拟图书馆,提供基于Web的访问和检索。这一系统的开通有力地促进了上海市高校文献资源的共享和利用。
2 重点、难点与存在的问题
综合上述分析表明,与全国一样,“九五”期间上海地区的数字图书馆研究整体仍处于探索阶段。其中的研究重点一是有关数字图书馆基本理论问题的探讨,包括其含义、特征、组织结构、功能模型与框架等等。二是着重于对数字图书馆相关技术的研究。三是对数字图书馆涉及的相关问题,如标准化问题、对传统图书馆的影响,知识产权保护等的论述。
对于数字图书馆这样一个新生事物,国内外的定义有近百种之多,不同行业的研究人员,不同的研究目标都会产生不同的定义。上海地区的研究人员通过对此问题的大量探讨,目前对数字图书馆定义的认识已基本趋于一致,虽然完整的表述并不相同,但从内涵上都认同一个比较宽泛的解释,即数字图书馆代表着一种新的基础设施和知识环境,它通过集成和利用最新计算技术、通信技术及数字内容,建成超大规模、可扩展的、可互操作的知识库群。这种环境,将收藏、服务和人融合起来,以支持数据、信息乃至知识的全部流程,包括从创造、传播、使用到保存的全过程。从这种涵义出发,其特征、要素、组织结构、功能模型与框架等的研究也基本趋于统一和成熟。
对于数字图书馆相关技术的研究,上海地区与全国一样,“九五”期间基本上是跟踪、应用国外的相关技术,包括软、硬件及相应解决方案的选型、吸收和本地化,在应用的过程中,对某些具体的问题进行一些攻关性开发。这其中上海交通大学图书馆的音乐数字图书馆中涉及的乐曲数字化转换、全曲检索及基于Web的音乐数据库查询技术等有了一定的突破。但总体说来,上海地区有关数字图书馆方面的、拥有自主知识产权的相关技术成果还比较薄弱,其中的热点问题,如对能够实现高质量永久性保存的资源数字化转换技术、各种数字资源基于内容的检索、中文搜索、图像搜索以及语音搜索中的智能技术、数字化环境下更为有效、友好并能突出个性化要求的用户界面设计、与多媒体压缩、编码、检索相关的系列标准和技术等虽已得到关注,但还未见更深入、实用的研究成果。
数字图书馆是一个复杂的系统工程,所涉及的社会、经济、管理、知识产权保护等有关问题也一直是讨论的焦点。知识产权方面,上海地区的研究在国内已达到一定深度,如对于作为数字图书馆中一类不可忽视的机构—现实的图书馆,为实现其在数字化环境下保存与服务的行为应享有的“特权”问题的相关论述,具有一定的现实意义。但由于知识产权问题与国际、国内的大环境密切相关,只要国际、国内没有相应成熟的配套法律法规出台,数字图书馆的版权保护问题还将会作为一个热点而继续探讨下去。其它方面,如对数字图书馆科学的项目管理、经济问题、社会协调等的研究还比较欠缺。
另外,无论是国外还是国内,数字图书馆都是以项目建设带动相关的研究,而上海地区实施并参与名义上的各类数字图书馆项目建设的机构并不多,主要集中于上海图书馆、上海交通大学和复旦大学,因此相关的研究论著也主要出自这几个机构,而且研究人员的分布也不广,因此从某种意义上说,上海地区的数字图书馆研究规模与领域还有一定的局限性,从事数字图书馆研究的人员也表现出了一定的不足。
最后,由于对数字图书馆研究的历史还不长,上海地区与全国一样,总的研究成果还比较肤浅,研究主题比较单一,主要集中于一些最基本的概念介绍和前期建设的相关领域,而对数字图书馆真正要实现的各种服务功能,如何从技术上、管理上、经济而合理地实现这些功能,数字图书馆的建设效益以及怎样实施数字图书馆的知识组织系统等等更深一层的研究都未见涉及。
3 研究趋势和重要研究方向
进入新世纪,数字图书馆的研究和建设在国际上仍然是一个热点。作为该领域研究始作俑者并一直保持领先势头的美国,已经走过了数字化资源库和相关技术大规模开发研究阶段(虽然相应的技术仍然还在不断发展),而进入了数字图书馆的综合研究阶段。这个阶段的研究不再局限于技术,而扩展到了更深、更广的领域,如研究数字图书馆的经济、社会、法律、政策框架,制定更有效的信息组织与服务的标准,数字图书馆的安全性与可靠性,能维持数字图书馆良性发展的运营模式,以及更细化的服务功能的实现,建设效益的评价方法等等。
“十五”期间上海地区数字图书馆的研究,应在“九五”研究与应用的基础上,一方面进一步统一对数字图书馆的宽泛理解,只有这样才有可能吸引更多的机构参与数字图书馆的建设,从而带动更多的机构与个人开展对数字图书馆的研究;另一方面,充分认识数字图书馆研究的广泛性与多层次性,摆脱一些无法逾越的客观条件的限制而进一步拓宽研究领域。因此,“十五”期间的数字图书馆研究可主要关注以下几个方面:
3.1 基础理论方面
更多地探讨数字图书馆这样一个综合性系统工程的项目管理,包括:
?项目建设的经济适用性参数研究:数字图书馆项目是一个极度高技术化的产物,需要极大的经费投入。而该项目在试验阶段很少考虑经费问题,因为为取得攻坚性的成果,往往能得到外部的经费资助,但要进一步走向实用、扩大数字化资源的规模并服务更多的受众,其经费便成了很大的制约因素;而对于从一开始就未享受到经费资助的机构,如何在现有经费条件下合理有效地启动自己的数字化计划;这些都需要对经济适用性参数作全面、深入的研究。
?参与建设各方的协调机制研究:任何一个数字图书馆项目都不可能依靠单一的机构来完成,投资方、技术开发方、服务提供方以及管理方之间如何最有效地协调集成,应有一套良好的机制来保证。
?运作模式研究:运作模式的研究主要是探索可持续良性发展的道路,服务是否收费、如何收费、如何保证资金的良性循环,怎样使产品与服务商品化、数字图书馆的营销策略、可供借鉴的电子商务模式等等。
?各种类型数字图书馆的建设效益评价研究:不同的投资目的、不同类型、不同服务对象的数字图书馆,其效益预期也将是不同层面的。如何采用有效、科学的方法对其数字化资源的价值和服务功能进行评价,具有一定的现实意义。
3.2 技术研究方面
“十五”期间对于数字图书馆的技术方面除了密切注视和跟踪国外最新研究的动态和进展,适时地将成熟而且商品化的技术系统加以本地化应用之外,对一些关键性的、具体的、满足中文数字化资源建设和服务的相关技术应组织各方力量进行集中攻关。虽然目前国内外已经出现了一些数字图书馆整套解决方案,如IBM数字图书馆方案、国内的数字方舟数字图书馆系统、超星数字图书馆等,但这些系统在应用的过程中不可能包容所有具体问题,必须对一些具体的、特殊的问题着手进行试验和开发,如国外各种元数据方案的本地化、海量数据管理和以汇聚内容、方法和权限管理的数字对象为基础的体系结构、多媒体数据的存储与压缩、对各种类型数字资源基于内容的检索、智能检索、中文知识库组织系统、多语言浏览器、数字图书馆的安全技术等。在这些方面,已有国家863计划中国数字图书馆发展战略组、中国数字图书馆工程以及教育部数字图书馆关键技术研究等国家级数字图书馆技术研究项目在全国范围内进行,上海的相关机构应在继续积极参与国家组织的数字图书馆项目的基础上,充分利用上海有利的信息基础设施和相对比较雄厚的各方技术人才,加快开发与应用试验的步伐,力争在较短的时间内研制出较多的具有自主知识产权的数字图书馆关键技术。
3.3 数字图书馆的相关标准问题
现阶段,技术标准在一定程度上已成为国家主权的延伸。由于数字图书馆的建设中更要涉及大量的标准问题,而且这些问题中有相当一部分还未定型,如更加实用高效的元数据标准、统一索引、分类标准、中文数字资源描述及组织标准、数据导航标准、各种类型服务标准等等,因此数字图书馆的相关标准问题在“十五”期间仍然是研究的重点之一。而标准的制定与草拟应该由信息产业界、图书情报界以及与标准相关的国内软件开发商共同参与,既要考虑与国际接轨,更要把研究的重点放在适用于中国特色的中文资源的数字化及其服务方面。
3.4 数字化服务的相关问题
在对数字图书馆建设早期的研究已基本成熟的基础上,对于数字图书馆更深层次的服务进行深入的研究是必然的趋势。这其中的一个重要方面是有关数字化参考服务方面的问题,这也是2001年国际上有关数字图书馆研究的热点之一。实际上,更多地关注数字图书馆的服务问题,对我国图书馆界具有更大的现实意义。毕竟国内,包括上海地区有能力进行大规模资源数字化转换的机构并不多,而在上海地区现有信息基础设施的条件下先期大规模开展一些具有数字图书馆部分功能的信息服务则是完全可以实现的,尤其是数字参考服务(Digital Reference Service)。
对于数字化参考服务,主要的研究主题可以包括:
?数字化参考服务的技术: 实时参考服务技术、数字参考服务技术的标准、提问/回答的工作流软件、基于知识的问题/答案查询工具、用户关系管理软件等等;
?数字化参考服务管理: 建立数字化参考服务的基础、问题和答案的存储与追踪、政策与程序、质量评估标准、服务人员所需的技能与知识及相关的培训、费用/价格模型、营销服务、参考服务的外包等等;
?数字化参考服务的一般问题: 合作/协作网、商业化与收费服务问题、法律问题等等。
?数字化参考服务的资源问题: 数字化参考资源的来源及层次、数字化参考资源的评估等。
3.5 用户研究
对于数字图书馆这样一个投资巨大的工程,如何更好地为用户服务是根本的宗旨。“九五”期间的数字图书馆研究重点是建设,“十五”期间应更多地关注服务,而用户研究将直接关系到服务质量的有效提高。
用户研究主要包括数字图书馆的服务对用户的影响、数字化环境下的用户行为模式研究、用户心理与人-机界面设计、数字图书馆对论著者产生的影响等等。
3.6 人才队伍建设研究
数字图书馆是为满足人们更有效地管理、利用信息与知识的要求而应运而生的,在这样一个具有典型信息经济与知识经济时代特征的新兴领域,人才无疑是最重要的建设资源,是整个事业成败的关键。
数字图书馆对人才的要求是全方位、多层次、高标准的,所涉及到的相关管理人才、数字图书馆员、技术人才、营销人才以及法律人才等在我国都非常欠缺,因此进一步研究合理、有效、多途径的、能够符合数字图书馆要求的人才培养机制,显得十分迫切。
经过了“九五”的探索阶段,我国的数字图书馆建设和研究在“十五”期间应该能达到一个新的高潮。在这个方面,上海地区所面临的机遇和挑战是并存的。上海地区的总体信息基础设施在全国处于领先地位,再加上比较雄厚的技术、人才和资金保障,而且“九五”期间对DC元数据的研究和创造性应用在国内也达到了较高的水平,这一切为下一步继续深入开展对数字图书馆的研究奠定了良好的基础。但与北京相比,上海地区参与国家级数字图书馆项目研究与开发的数量、参与数字图书馆研究的机构规模和