數(shù)字圖書館體系結(jié)構(gòu)的發(fā)展的論文
【內(nèi)容提要】首先介紹了目前大多數(shù)數(shù)字圖書館所遵循的基本的數(shù)字圖書館體系結(jié)構(gòu),該結(jié)構(gòu)在功能上可劃分為四個邏輯組件:資源庫、命名系統(tǒng)、索引/搜索系統(tǒng)、用戶界面。然后介紹了NSDL、NCSTRL兩個最大的數(shù)字圖書館項目在體系結(jié)構(gòu)的關(guān)鍵問題方面的實踐,最后,作者提出了數(shù)字圖書館體系結(jié)構(gòu)發(fā)展的看法。
【摘要題】專題探討
【【關(guān)鍵詞】體系結(jié)構(gòu)/互操作
1 介紹
世界上有許多國家進行數(shù)字圖書館的建設(shè),但到目前為止,并不存在一個通用的數(shù)字圖書館體系結(jié)構(gòu),這是由于信息技術(shù)和相關(guān)標(biāo)準(zhǔn)不斷發(fā)展的結(jié)果,怎樣基于現(xiàn)有的技術(shù)并考慮到未來技術(shù)的發(fā)展,構(gòu)筑一個靈活強大的數(shù)字圖書館體系結(jié)構(gòu),對于數(shù)字圖書館的建設(shè)是至關(guān)重要的,這需要我們了解相關(guān)技術(shù)和標(biāo)準(zhǔn)以及數(shù)字圖書館體系結(jié)構(gòu)的發(fā)展變化。
數(shù)字圖書館要為用戶提供各種簡單易用、功能強大的知識服務(wù),通常從功能上可將數(shù)字圖書館劃分為:用戶界面、命名服務(wù)、搜索系統(tǒng)、資源庫等部分。數(shù)字圖書館的建設(shè)涵括各種數(shù)字資源的創(chuàng)建、管理、查詢、利用、存儲的整個過程。自從williamY.Arms等于1997年提出了數(shù)字圖書館的信息體系結(jié)構(gòu)以來,數(shù)字圖書館的體系結(jié)構(gòu)在不斷完善和發(fā)展,通過許多試驗項目仍在不斷改進。圖1代表了數(shù)字圖書館的基本體系結(jié)構(gòu)。
附圖
圖1 數(shù)字圖書館的基本體系結(jié)構(gòu)
資源庫
資源庫的功能包括存儲和管理各種數(shù)字對象,通常是由關(guān)系型數(shù)據(jù)庫來管理。應(yīng)用程序通過資源庫提供的庫訪問協(xié)議(RAP)來訪問資源庫。可實現(xiàn)存儲、訪問、復(fù)制、移動和刪除數(shù)字對象等操作。
與web上的信息所不同,數(shù)字圖書館中數(shù)字資源是以數(shù) 字對象的形式進行封裝的,一個數(shù)字對象包括:
①一個全球唯一的獨立于地址的長期標(biāo)識符;
②數(shù)字資料,存儲數(shù)字圖書館的資料,也就是最終用戶需要獲取的信息內(nèi)容,如經(jīng)XML置標(biāo)后的文本、一本電子圖書等,
③元數(shù)據(jù),關(guān)于數(shù)字資料的數(shù)據(jù)。一般情況下,元數(shù)據(jù)有三種:a.描述性元數(shù)據(jù),用于發(fā)現(xiàn)和標(biāo)識一個對象,如MARC和DublinCore。b.結(jié)構(gòu)性元數(shù)據(jù),為用戶顯示和導(dǎo)航一個對象(包括該對象的內(nèi)部組織信息),如一本書由章節(jié)組成。c.管理性元數(shù)據(jù),描述該對象的管理信息;創(chuàng)建日期、文件的格式、訪問權(quán)限、知識產(chǎn)權(quán)問題等。
命名系統(tǒng)
命名系統(tǒng)是針對長期標(biāo)識符的分配、管理及解析的一個綜合系統(tǒng),CNRI為數(shù)字圖書館提出了完整的命名系統(tǒng)“調(diào)度系統(tǒng)(HandleSystem)”,它是一個獨立的系統(tǒng),其職能是負責(zé)數(shù)字資源的全球唯一的、長期的、獨立于地址的命名的分配、管理和解析。在調(diào)度系統(tǒng)中,本地名稱空間通過獲取一個調(diào)度系統(tǒng)的命名授權(quán),就可以納入到全球調(diào)度名稱空間,這樣所有的本地名稱在全球調(diào)度名稱空間中將是唯一的。
索引與搜索系統(tǒng)
索引的創(chuàng)建可能是由機器的自動掃描、手工錄入和干預(yù),或者是這兩者的結(jié)合。客戶機把查詢式提交給索引服務(wù)器,將返回相匹配的數(shù)字對象的URN(統(tǒng)一資源命名,如調(diào)度碼)。索引服務(wù)還提供被索引信息的元數(shù)據(jù)和查詢機制。
用戶界面
用戶界面是用戶與數(shù)字圖書館的接口,數(shù)字圖書館向用戶提供的最終服務(wù)都是通過用戶界面來實現(xiàn)的。一般情況下,數(shù)字圖書館借助通用的'Web瀏覽器作為其用戶界面工具。此外,用戶界面的內(nèi)容編排和服務(wù)方式問題是很復(fù)雜的,不同的用戶需求是不同的,用戶對數(shù)字圖書館的簡單靈活的需求首先就表現(xiàn)在用戶界面上。
2 NSDL項目的體系結(jié)構(gòu)介紹
NSDL(NationalSTEMDigitalLibrary,STEM—Science,Technology,EngineeringandMathematics)是NSF資助的、由多家單位來實施數(shù)字圖書館項目,它包括64個子項目,其目的是支持科學(xué)、技術(shù)、工程和數(shù)學(xué)教育,提供廣泛接入和方便使用的分布式資源網(wǎng)絡(luò)和學(xué)習(xí)機制,NSDL一期工程已于2002年底為公眾提供服務(wù),它是目前規(guī)模最大的數(shù)字圖書館項目。
由于NSDL的內(nèi)容和用戶的多樣性,為讓各種用戶共享不同的信息,最初的體系結(jié)構(gòu)設(shè)計就是通過共享元數(shù)據(jù),并利用元數(shù)據(jù)開發(fā)核心服務(wù)(如,搜索和發(fā)現(xiàn))。其體系結(jié)構(gòu)(見圖2),包括以下幾個基本概念:
附圖
圖2 NSDL體系結(jié)構(gòu)
·采用公共的核心元數(shù)據(jù)實現(xiàn)異構(gòu)系統(tǒng)間的資源發(fā)現(xiàn)。
·核心元數(shù)據(jù)與具體領(lǐng)域的擴展元數(shù)據(jù)相結(jié)合。
·以元數(shù)據(jù)為基礎(chǔ)實現(xiàn)跨庫搜索并創(chuàng)建更豐富的服務(wù)。
·采用自動索引和檢索系統(tǒng)來減少編目工作。
元數(shù)據(jù)庫—NSDL體系結(jié)構(gòu)的關(guān)鍵部分是元數(shù)據(jù)庫。元數(shù)據(jù)庫存儲所有藏品集的元數(shù)據(jù),并通過OAI協(xié)議把它們提供給服務(wù)商,服務(wù)商通過元數(shù)據(jù)可以開發(fā)出各種服務(wù)。在NDSL中,元數(shù)據(jù)庫可能分布在多個服務(wù)器上,并有多個鏡像。NSDL早期采用分布式元數(shù)據(jù)庫,現(xiàn)在改成集中式。這是因為分布式元數(shù)據(jù)庫在檢索時會因為其中的一個元數(shù)據(jù)庫的查詢失敗或響應(yīng)較慢,而造成整個檢索的失敗或長時間的響應(yīng),而集中式元數(shù)據(jù)庫可以避免這種現(xiàn)象。
NSDL的互操作性問題
NSDL的互操作性采用三種方式來實現(xiàn):
·聯(lián)合:這是一種傳統(tǒng)的方法,其所有的成員組織都遵從某些標(biāo)準(zhǔn)規(guī)范,如通過Z39.50協(xié)議共享在線目錄。
·OAI采集:以O(shè)AI元數(shù)據(jù)采集為基礎(chǔ)。每個數(shù)字圖書館藏品的元數(shù)據(jù)都能提供到DublinCore的映射,并以簡單的交換格式向外提供,這樣,服務(wù)提供商就能采集這些元數(shù)據(jù),把它建入到信息發(fā)現(xiàn)系統(tǒng)中,而且這些藏品能夠?qū)崿F(xiàn)良好的互操作性。
·搜集:即使各種不同的組織之間不存在任何形式的合作,通過網(wǎng)絡(luò)爬蟲收集開放訪問的信息仍然可以實現(xiàn)一定程度上的互操作。各種網(wǎng)絡(luò)搜索引擎就是這樣。
NSDL主要通過OAI元數(shù)據(jù)采集來實現(xiàn)互操作。2001年初,NSDL確定支持8種標(biāo)準(zhǔn)元數(shù)據(jù)格式,這8種元數(shù)據(jù)之間的互換通過DublinCore元數(shù)據(jù)核心集作為過渡。
(1)DublinCore
(2)DublinCorewithDC—EdExtensions
本文來源:http://www.nvnqwx.com/shiyongwen/2803237.htm