1系統(tǒng)的實(shí)現(xiàn)
訪問量的多少是衡量網(wǎng)站是否成功的重要標(biāo)準(zhǔn),但對于圖書館網(wǎng)站是遠(yuǎn)遠(yuǎn)不夠的,圖書館需要獲取完整的讀者訪問流量統(tǒng)計(jì)數(shù)據(jù),來對圖書館信息資源的使用情況進(jìn)行分析,網(wǎng)絡(luò)信息計(jì)量學(xué)方法是目前網(wǎng)絡(luò)界普遍采用的網(wǎng)站績效評估計(jì)量法,被認(rèn)為是可以用科學(xué)的方法檢驗(yàn)網(wǎng)站訪問數(shù)據(jù)的一種工具。它的目的包括了解網(wǎng)絡(luò)讀者的行為、確定網(wǎng)站是否吸引適當(dāng)?shù)淖x者來訪、評定網(wǎng)站建設(shè)策略是否得當(dāng)。其實(shí)施步驟可分為三個(gè)階段:
(1)記錄網(wǎng)站的訪問數(shù)據(jù);
(2)分析記錄數(shù)據(jù);
(3)為網(wǎng)站建設(shè)策略的改進(jìn)提供依據(jù)。
1.1系統(tǒng)原理
由于網(wǎng)絡(luò)發(fā)布站點(diǎn)和數(shù)據(jù)庫本身具備了訪問計(jì)量功能,各自的信息資源收藏狀況便于人們掌握,并且能自動記錄讀者訪問的登錄情況,如登錄名、登錄時(shí)間、瀏覽文件、讀者的來源地址等,這些數(shù)據(jù)資料能夠準(zhǔn)確反映讀者訪問信息和來源分布等情況,所以依據(jù)圖書館網(wǎng)絡(luò)讀者訪問統(tǒng)計(jì)的工作內(nèi)容,制定相應(yīng)的分析指標(biāo),并收集網(wǎng)絡(luò)讀者訪問圖書館信息資源發(fā)布站點(diǎn)形成的日志文件,然后利用日志統(tǒng)計(jì)工作軟件定時(shí)對日志文件進(jìn)行處理,得到統(tǒng)計(jì)數(shù)據(jù),并動態(tài)生成各種表達(dá)形式的能滿足圖書館各項(xiàng)統(tǒng)計(jì)分析工作的報(bào)表。最后把生成的分析報(bào)表導(dǎo)入到發(fā)布數(shù)據(jù)庫中發(fā)布出去。
圖書館各個(gè)網(wǎng)絡(luò)資源站點(diǎn)建設(shè)人員可通過瀏覽網(wǎng)絡(luò)讀者訪問流量統(tǒng)計(jì)分析報(bào)告,分析和了解讀者的訪問需求,從而做好網(wǎng)絡(luò)信息資源的建設(shè)工作。
讀者行為分析研究則可通過對分析報(bào)告進(jìn)行質(zhì)化研究,并結(jié)合一般調(diào)查法、咨詢研究法對讀者的信息尋求行為進(jìn)行研究。
本系統(tǒng)還可利用統(tǒng)計(jì)分析的結(jié)果來對系統(tǒng)自身工作進(jìn)行評估和調(diào)整。
1.2分析指標(biāo)
傳統(tǒng)圖書館的分析指標(biāo)和計(jì)量方法,雖然和數(shù)字化圖書館有很多不同,但使用的目的及計(jì)量的準(zhǔn)則并沒有太大實(shí)質(zhì)性差異[4]。
參考傳統(tǒng)圖書館的分析指標(biāo)以及國內(nèi)外類似的研究結(jié)果選定了下列10個(gè)分析指標(biāo):
(1)讀者到訪人數(shù)和潛在讀者人數(shù)的百分比;
(2)到訪讀者表現(xiàn)了閱讀的興趣的百分比(采取明顯的閱讀行動);
(3)可能的讀者轉(zhuǎn)為經(jīng)常的讀者的百分比(經(jīng)常閱讀、下載資料);
(4)讀者的持續(xù)度(重復(fù)到訪讀者);
(5)讀者的忠誠度(網(wǎng)頁瀏覽次數(shù)、再度到訪的次數(shù)及時(shí)間長度);
(6)讀者停止閱讀行為的百分比(閱讀行為半途中止);
(7)讀者耗損率(現(xiàn)有讀者中停止閱讀行為者的百分比);
(8)讀者動搖率(耗損的讀者/到訪讀者的總數(shù));
(9)讀者最近到訪時(shí)間(據(jù)上次到訪的間隔時(shí)間);
(10)讀者到訪頻率(多久到訪一次)。
就此參數(shù),我們可以從一個(gè)客觀的角度來觀察和評估圖書館網(wǎng)絡(luò)讀者訪問情況。
1.3系統(tǒng)框圖
網(wǎng)絡(luò)讀者流量統(tǒng)計(jì)分析系統(tǒng)功能框圖
1.4工作方法
本系統(tǒng)工作方法主要是采集網(wǎng)絡(luò)讀者訪問過程日志進(jìn)行量化分析法,它的優(yōu)缺點(diǎn)見表1。
讀者訪問過程日志分析法優(yōu)缺點(diǎn)
量化分析法重視量的分析,本系統(tǒng)通過對訪問過程日志以量的方法加以統(tǒng)計(jì)分析,首先根據(jù)為了研究讀者需求分布和需求增長情況這一目的將研究內(nèi)容歸類成若干分析單元,接著將分析單元以數(shù)量的方式加以表達(dá),進(jìn)而以此為解釋讀者信息尋求行為的依據(jù)。
1.5技術(shù)實(shí)現(xiàn)
(1)系統(tǒng)結(jié)構(gòu)
本系統(tǒng)是以瀏覽器/服務(wù)器/數(shù)據(jù)庫體系結(jié)構(gòu)作為基本架構(gòu),通過ASP方式實(shí)現(xiàn)交互式、動態(tài)的讀者訪問日志統(tǒng)計(jì)分析系統(tǒng)。系統(tǒng)結(jié)構(gòu)框架如圖2所示:
讀者訪問日志統(tǒng)計(jì)分析系統(tǒng)結(jié)構(gòu)框圖
(2)系統(tǒng)組成模塊
本系統(tǒng)有六個(gè)模塊組成:訪問日志入庫、訪問流量分析、被訪頁面分析、來訪讀者分析和統(tǒng)計(jì)分析圖表。
(3)系統(tǒng)運(yùn)行環(huán)境與開發(fā)平臺
本系統(tǒng)運(yùn)行環(huán)境和開發(fā)平臺如表2。
讀者訪問日志統(tǒng)計(jì)分析系統(tǒng)模塊
表2系統(tǒng)運(yùn)行環(huán)境及開發(fā)平臺一覽表
軟件類別軟件名稱
數(shù)據(jù)庫SQLServer2000+FastTrendsDatabase
操作系統(tǒng)Windows2000SP4Server+Aix4.3.3
Web服務(wù)器軟件IIS5.0+Apache3.0
瀏覽器軟件IE5.5
網(wǎng)頁制作Frontpage2000+javascript
ASP工具EditplusTextEditor
編程語言VisualBasic6.0
圖表軟件Excel2000
(4)程序流程與代碼實(shí)現(xiàn)
該系統(tǒng)由main.asp(主界面程序)、flux.asp(小時(shí)、日、星期流量分析)、target.asp(被訪頁面分析)、visitor.asp(來訪讀者分析)、chart.asp(統(tǒng)計(jì)分析圖表)五個(gè)組成。
我們以“被訪頁面分析”模塊的程序流程和代碼說明系統(tǒng)組成模塊的實(shí)現(xiàn)過程,該模塊程序流程圖如圖4。
“被訪頁面分析”程序流程圖
相應(yīng)代碼:
<table
<tdclass=定義的表格形式及表頭>
Setconn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Setre=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——數(shù)據(jù)表名稱
re.open“QL語句”
dowhilenotre.eof
執(zhí)行Recordset操作,服務(wù)器進(jìn)行統(tǒng)計(jì)計(jì)算
response.write——寫入統(tǒng)計(jì)表
re.movenext
loop
re.close
程序中一些代碼說明:
①Recordset的Open方法:允許用戶向數(shù)據(jù)庫發(fā)出請求,通常是運(yùn)行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3
②Recordset的RecordCount屬性:可以取得當(dāng)前在Recordset對象中的記錄條數(shù)。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
③Recordset的MoveNext方法:移動指針到Recordset對象的下一條數(shù)據(jù)。如:Dbrs.movenext
④Response的Write方法:負(fù)責(zé)將字符串信息輸出的用戶端。如:Response.write“頁面總訪問量:“&amount&”<br>
⑤Recordset的Close方法:可以用來關(guān)閉指定的Recordset對象。如:Dbrs.close
1.6系統(tǒng)運(yùn)行過程
下面以西安交通大學(xué)圖書館網(wǎng)站為統(tǒng)計(jì)分析對象說明該系統(tǒng)運(yùn)行過程。
首先我們用FTP工具抓取網(wǎng)址為的服務(wù)器,時(shí)間段為2003/01/01到2003/12/31的訪問日志導(dǎo)入到數(shù)據(jù)庫中,該服務(wù)器完成圖書館網(wǎng)站的部分功能:門戶信息、OPAC、館際互借、電子期刊、網(wǎng)絡(luò)數(shù)據(jù)庫、網(wǎng)絡(luò)資源、參考服務(wù)等。
對日志分析系統(tǒng)進(jìn)行運(yùn)行參數(shù)設(shè)置:讀者訪問時(shí)間間隔設(shè)為20分鐘;從最新QQ顯IP版軟件中導(dǎo)出讀者IP地址分配資料,轉(zhuǎn)換格式后導(dǎo)入到日志分析系統(tǒng)的地址表中,以便對讀者分群;設(shè)置過濾規(guī)格文件濾掉一些無用的訪問信息,如背景圖片、圖書館Logo,頁面美化圖片和服務(wù)器漏洞掃描日志等日志信息,然后對服務(wù)器訪問日志進(jìn)行初步統(tǒng)計(jì)分析,保存統(tǒng)計(jì)分析結(jié)果準(zhǔn)備進(jìn)行進(jìn)一步統(tǒng)計(jì)分析。
最后利用精致多樣的統(tǒng)計(jì)分析方法對初步統(tǒng)計(jì)結(jié)果進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)分析出的數(shù)據(jù)有:一年內(nèi)資源點(diǎn)擊與訪問計(jì)數(shù);一年內(nèi)網(wǎng)站中最常使用的資源與服務(wù);一年內(nèi)點(diǎn)擊次數(shù)最多的讀者;一年內(nèi)務(wù)分群讀者的點(diǎn)擊次數(shù)比例;一年內(nèi)點(diǎn)擊次數(shù)與閱讀次數(shù)的變化;一年內(nèi)上網(wǎng)的讀者與累積成長趨勢;一周各天的平均點(diǎn)擊次數(shù);一天內(nèi)各時(shí)段的平均點(diǎn)擊次數(shù);校內(nèi)各區(qū)讀者點(diǎn)擊次數(shù)比例;各項(xiàng)相關(guān)資源被使用的情形等等。這些數(shù)據(jù)可用Eexel軟件生成直觀的統(tǒng)計(jì)分析圖表,部分圖表詳見實(shí)際應(yīng)用一節(jié)中。本系統(tǒng)的研究主要采用訪問過程日志分析法,以內(nèi)容分析法、問卷調(diào)查法輔助研究。主要考慮:一是這種方法在電子商務(wù)和其它網(wǎng)絡(luò)應(yīng)用的量化分析,已經(jīng)有許多研究成果,可使我們的研究更為便利;二是可以經(jīng)濟(jì)的,較具體客觀的分析到網(wǎng)絡(luò)讀者信息需求特性;三是通過定量的計(jì)算,定質(zhì)的分析,形成一種綜合分析的方式,以求分析結(jié)果更為客觀和科學(xué)。
本文來源:http://www.nvnqwx.com/shiyongwen/2648562.htm