[摘要]分析了數(shù)據(jù)生命周期理論與模型,研究了學(xué)術(shù)圖書(shū)館科研數(shù)據(jù)管理的主要內(nèi)容,構(gòu)建了基于數(shù)據(jù)生命周期模型的學(xué)術(shù)圖書(shū)館科研數(shù)據(jù)管理體系,提出了基于數(shù)據(jù)生命周期的學(xué)術(shù)圖書(shū)館科研數(shù)據(jù)服務(wù)保障機(jī)制。
[關(guān)鍵詞]數(shù)據(jù)生命周期模型;學(xué)術(shù)圖書(shū)館;科研數(shù)據(jù);管理體系
隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)字化資源以驚人的速度不斷增長(zhǎng)。根據(jù)IDC發(fā)布的全球數(shù)據(jù)研究報(bào)告,預(yù)計(jì)到2020年全球數(shù)據(jù)總量將超過(guò)40ZB。E-Science時(shí)代海量科研數(shù)據(jù)的產(chǎn)生與應(yīng)用,迫切需要相關(guān)學(xué)術(shù)機(jī)構(gòu)結(jié)合其特點(diǎn),通過(guò)數(shù)據(jù)采集、組織、存檔和研究,建立完善的管理機(jī)制,保障這些科研數(shù)據(jù)的合理利用。學(xué)術(shù)圖書(shū)館作為研究型文獻(xiàn)管理機(jī)構(gòu),長(zhǎng)期以來(lái)一直通過(guò)管理文獻(xiàn)資源的方式輔助科研活動(dòng),在助力科研創(chuàng)新方面也扮演著重要角色。數(shù)據(jù)生命周期是從數(shù)據(jù)生成、加工、發(fā)布到利用的循環(huán)過(guò)程,表現(xiàn)了基于科研全過(guò)程的數(shù)據(jù)管理[1]。面對(duì)E-Science背景下科研范式的發(fā)展,以及用戶對(duì)科研數(shù)據(jù)組織、存儲(chǔ)和利用的新需求,學(xué)術(shù)圖書(shū)館積極探索科研數(shù)據(jù)管理內(nèi)容,建設(shè)基于數(shù)據(jù)生命周期的科研數(shù)據(jù)管理體系,發(fā)揮在數(shù)據(jù)增值服務(wù)方面的作用,有助于提升科研數(shù)據(jù)服務(wù)能力。
1數(shù)據(jù)生命周期理論與模型分析
1.1數(shù)據(jù)生命周期理論概述生命周期的概念最早被應(yīng)用于生物領(lǐng)域,此后經(jīng)過(guò)不斷演化被應(yīng)用于多個(gè)領(lǐng)域。國(guó)外學(xué)者通過(guò)研究數(shù)據(jù)信息的生命周期,探討了數(shù)據(jù)生命周期的內(nèi)涵,指出它代表一種數(shù)據(jù)在特定環(huán)境下,經(jīng)過(guò)加工、存儲(chǔ)和管理,實(shí)現(xiàn)資源發(fā)掘和利用的過(guò)程。具體而言,數(shù)據(jù)生命周期就是對(duì)數(shù)字化資源進(jìn)行加工處理和長(zhǎng)期保存,并在科研項(xiàng)目、決策制定中實(shí)現(xiàn)再利用的活動(dòng)[2]。通過(guò)總結(jié)各流派的相關(guān)理論,可知科研活動(dòng)是數(shù)據(jù)生命周期的來(lái)源,而一個(gè)完整的數(shù)據(jù)生命周期涉及到生成、加工、知識(shí)抽取等多個(gè)層次。從內(nèi)容層面分析,數(shù)據(jù)生命周期包括數(shù)據(jù)初加工、再加工和獲取附加值等環(huán)節(jié),涉及到基于數(shù)據(jù)加工的一系列知識(shí)抽取活動(dòng)。1.2數(shù)據(jù)生命周期的作用由于科研周期與數(shù)據(jù)生命周期存在關(guān)聯(lián),因此通過(guò)宏觀分析數(shù)據(jù)生命周期,就可以大致了解科研過(guò)程中科研人員的數(shù)據(jù)需求。E-Science時(shí)代科學(xué)研究與基礎(chǔ)信息設(shè)施的發(fā)展,逐漸向數(shù)據(jù)密集型方向轉(zhuǎn)變,科研創(chuàng)新更加依賴對(duì)科研數(shù)據(jù)的再利用。如何幫助科研人員提高科研數(shù)據(jù)利用率,促進(jìn)科研數(shù)據(jù)的開(kāi)放共享,是學(xué)術(shù)機(jī)構(gòu)關(guān)注的問(wèn)題[3]。然而對(duì)于科研數(shù)據(jù)的研究與管理,涉及到不同利益主體之間的協(xié)調(diào)作用,是一個(gè)長(zhǎng)期而復(fù)雜的系統(tǒng)。數(shù)據(jù)生命周期為科研數(shù)據(jù)管理提供了基本框架,可以發(fā)現(xiàn)科研數(shù)據(jù)演變階段研究者的需求,描述復(fù)雜的數(shù)據(jù)管理和流通過(guò)程,明確不同利益相關(guān)者的關(guān)系。此外,數(shù)據(jù)生命周期來(lái)源于科研周期,在研究數(shù)據(jù)生命周期的基礎(chǔ)上構(gòu)建模型,也可以準(zhǔn)確映射科研活動(dòng)全過(guò)程。1.3數(shù)據(jù)生命周期模型數(shù)據(jù)生命周期為不同利益相關(guān)者提供了價(jià)值評(píng)估工具,也為科研數(shù)據(jù)服務(wù)實(shí)踐提供了途徑。為方便分析和利用,澳大利亞、英國(guó)等研究機(jī)構(gòu)結(jié)合實(shí)踐經(jīng)驗(yàn),構(gòu)建了多個(gè)數(shù)據(jù)生命周期理論模型,如DDI3.0模型、I2S2模型、DataONE模型等。常用的數(shù)據(jù)生命周期模型大致分為矩陣狀、鏈狀、環(huán)狀3種,在應(yīng)用場(chǎng)景和構(gòu)成要素方面存在差異[4]。其中DDI3.0為鏈狀模型,不同環(huán)節(jié)呈一定的次序排列。I2S2矩陣模型屬于數(shù)據(jù)生命周期模型的子集,也是對(duì)鏈狀模型的深化。美國(guó)國(guó)家科學(xué)基金(NSF)為滿足科研開(kāi)發(fā)需求,闡釋數(shù)據(jù)存儲(chǔ)和管理實(shí)踐中彼此間的關(guān)系,提出了首尾相接的環(huán)狀DataONE模型,體現(xiàn)了數(shù)據(jù)生命周期的循環(huán)過(guò)程(如圖1)。
2學(xué)術(shù)圖書(shū)館科研數(shù)據(jù)管理的主要內(nèi)容
科研數(shù)據(jù)包含了科研活動(dòng)過(guò)程中產(chǎn)生的所有能夠存儲(chǔ)的數(shù)字資源,以及能夠轉(zhuǎn)換為數(shù)字形式的數(shù)據(jù),如遙感勘測(cè)數(shù)據(jù)、仿真數(shù)據(jù)等。學(xué)術(shù)圖書(shū)館開(kāi)展科研數(shù)據(jù)管理,不僅能夠避免科研數(shù)據(jù)丟失,實(shí)現(xiàn)科研數(shù)據(jù)的長(zhǎng)期存儲(chǔ)和共享,也是滿足科研人員動(dòng)態(tài)信息需求和促進(jìn)圖書(shū)館發(fā)展的必要措施。2.1基礎(chǔ)設(shè)施建設(shè)目前學(xué)術(shù)圖書(shū)館獨(dú)立構(gòu)建數(shù)據(jù)倉(cāng)儲(chǔ)進(jìn)行科研數(shù)據(jù)管理的案例并不多見(jiàn),一方面與圖書(shū)館在資金、技術(shù)方面存在不足有關(guān)[5]。另外,面對(duì)E-Science時(shí)代學(xué)術(shù)資源開(kāi)放、共享的趨勢(shì),圖書(shū)館領(lǐng)域更加推崇協(xié)同合作,營(yíng)造科研數(shù)據(jù)管理的硬件環(huán)境,采取資源互補(bǔ)、技術(shù)共享的方式共同建設(shè)機(jī)構(gòu)倉(cāng)儲(chǔ)。學(xué)術(shù)圖書(shū)館也可以與科研項(xiàng)目機(jī)構(gòu)合作,借助外部設(shè)備和項(xiàng)目的支持,構(gòu)建滿足不同學(xué)科需求的數(shù)據(jù)倉(cāng)儲(chǔ),使科研數(shù)據(jù)管理跨越單個(gè)機(jī)構(gòu)的限制,幫助科研人員獲取更多有用資源。例如,澳洲國(guó)立大學(xué)圖書(shū)館與其他院校、機(jī)構(gòu)知識(shí)庫(kù)合作,共同搭建科研數(shù)據(jù)管理的硬件環(huán)境,可以為大量科研項(xiàng)目提供數(shù)據(jù)存儲(chǔ)服務(wù)。2.2科研數(shù)據(jù)集成服務(wù)科研數(shù)據(jù)產(chǎn)生于數(shù)據(jù)生命周期的任意階段,與科研活動(dòng)、科學(xué)文獻(xiàn)等都存在關(guān)聯(lián),只有通過(guò)關(guān)聯(lián)分析發(fā)現(xiàn)內(nèi)在規(guī)律,才能獲取更多有價(jià)值的信息。學(xué)術(shù)圖書(shū)館是科學(xué)文獻(xiàn)存儲(chǔ)中心,在數(shù)據(jù)集成方面具有豐富的.經(jīng)驗(yàn)。隨著數(shù)字化技術(shù)的應(yīng)用,很多學(xué)術(shù)圖書(shū)館已經(jīng)可以利用智能化工具,為科研人員提供數(shù)據(jù)關(guān)聯(lián)組織和個(gè)性化推薦服務(wù)。科研數(shù)據(jù)作為具有極大應(yīng)用價(jià)值的信息,必然要求圖書(shū)館通過(guò)科研數(shù)據(jù)關(guān)聯(lián)集成,將某一類型或某一領(lǐng)域的數(shù)據(jù)集和科學(xué)文獻(xiàn)結(jié)合起來(lái),幫助科研人員發(fā)現(xiàn)不同數(shù)據(jù)的潛在聯(lián)系,進(jìn)一步利用好各類資源。此外,圖書(shū)館利用數(shù)據(jù)挖掘技術(shù)處理科學(xué)文獻(xiàn),如學(xué)術(shù)專著、會(huì)議紀(jì)要、發(fā)明專利等,以數(shù)據(jù)生命周期模型為紐帶,將原始數(shù)據(jù)與再生數(shù)據(jù)關(guān)聯(lián)起來(lái),實(shí)現(xiàn)多學(xué)科資源的匯聚,也方便科研人員迅速獲取有價(jià)值信息。2.3科研數(shù)據(jù)存儲(chǔ)服務(wù)在開(kāi)放獲取運(yùn)動(dòng)的推動(dòng)下,很多國(guó)家對(duì)于信息機(jī)構(gòu)的科研數(shù)據(jù)都要求開(kāi)放共享[6]。在這樣的背景下,學(xué)術(shù)圖書(shū)館作為長(zhǎng)期提供科研數(shù)據(jù)服務(wù)的場(chǎng)所,自然要求順應(yīng)開(kāi)放獲取的發(fā)展趨勢(shì)。在西方一些發(fā)達(dá)國(guó)家,很多學(xué)術(shù)圖書(shū)館正在嘗試開(kāi)展科研數(shù)據(jù)開(kāi)放存儲(chǔ)服務(wù),而科研人員也樂(lè)于借助圖書(shū)館存儲(chǔ)科研信息或成果。在科研數(shù)據(jù)存檔方面,學(xué)術(shù)圖書(shū)館構(gòu)建專門(mén)的機(jī)構(gòu)知識(shí)庫(kù),通過(guò)IR拓展的方式為科研數(shù)據(jù)管理提供支持,也可以建設(shè)科研數(shù)據(jù)檔案庫(kù),引進(jìn)專門(mén)的軟硬件設(shè)施開(kāi)展科研數(shù)據(jù)服務(wù)。由于E-Science背景下科研人員的數(shù)據(jù)管理需求日益增長(zhǎng),學(xué)術(shù)圖書(shū)館必須盡快拓展科研數(shù)據(jù)存儲(chǔ)空間,并且通過(guò)尋求政府部門(mén)、基金會(huì)的支持,以解決新增業(yè)務(wù)帶來(lái)的成本增加等問(wèn)題。
本文來(lái)源:http://www.nvnqwx.com/shiyongwen/2049651.htm