首頁(yè) > 公文范文 > 網(wǎng)絡(luò)信息檢索論文
時(shí)間:2022-05-08 04:00:46
序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來(lái)了一篇網(wǎng)絡(luò)信息檢索論文范文,愿它們成為您寫作過(guò)程中的靈感催化劑,助力您的創(chuàng)作。
摘 要
因特網(wǎng)上有海量的數(shù)據(jù),是信息的海洋,但在解決實(shí)際問(wèn)題中,仍感到缺乏真正需要的信息,出現(xiàn)了數(shù)據(jù)豐富,信息貧乏的問(wèn)題。如何通過(guò)一種有效的方法,以最少的時(shí)間與精力來(lái)獲取自己所要的信息,這就是文獻(xiàn)檢索所要解決的問(wèn)題。
【關(guān)鍵詞】文獻(xiàn) 網(wǎng)絡(luò) 信息檢索
據(jù)不完全統(tǒng)計(jì),非科技類的著作文獻(xiàn),每隔五到八年就會(huì)整倍翻一番;科技類的著作文獻(xiàn),特別是尖端領(lǐng)域的著作文獻(xiàn)增加飛快,速度驚人,如,計(jì)算機(jī)科技著作文獻(xiàn)每一至三年就翻一倍,且倍增時(shí)間也是越來(lái)越短; 大概目前有1000多萬(wàn)篇科技文獻(xiàn)會(huì)在一年時(shí)間內(nèi)出版;出版文獻(xiàn)速度與日倍增,據(jù)國(guó)外報(bào)導(dǎo),全球出版界著作文獻(xiàn)的出版量在大約在2000張每秒,4至6種新書每小時(shí),新增各種文獻(xiàn)期刊3種每小時(shí),面對(duì)日益增長(zhǎng)的文獻(xiàn)資源,如何通過(guò)一種有效的方法,以最少的時(shí)間與精力來(lái)獲取自己所要的信息,這就是文獻(xiàn)檢索所要解決的問(wèn)題。
1 文獻(xiàn)的類型
1.1 圖書
國(guó)家標(biāo)準(zhǔn)對(duì)圖書的定義是:“以印刷方式單本刊行的出版物。”國(guó)際上通常把48頁(yè)以上,不定期出版的印刷品稱為圖書。
1.2 期刊
定期或者有不規(guī)律時(shí)間間隔的具有連續(xù)性質(zhì)的出版刊物,周期一般實(shí)在一年以內(nèi)。
1.3 科技報(bào)告
關(guān)于某項(xiàng)科研成果的正式報(bào)告或研究過(guò)程中階段性報(bào)告。它的特征:報(bào)告題目、責(zé)任者、研究單位、報(bào)告完成時(shí)間以及報(bào)告號(hào)。每一個(gè)獨(dú)立的科學(xué)報(bào)告內(nèi)容完整,結(jié)果可靠,對(duì)研究項(xiàng)目研究過(guò)程敘述詳細(xì)具體,技術(shù)專業(yè)且非常全面,能夠直接使用或者借鑒。科技報(bào)告還是單獨(dú)成冊(cè),有統(tǒng)一編號(hào)和標(biāo)注可研究機(jī)構(gòu)名稱。能夠體現(xiàn)以及代表一個(gè)國(guó)家的科技研究水平,反映最新興和尖端的科學(xué)成果,是國(guó)家軟實(shí)力的象征。
1.4 會(huì)議中的文獻(xiàn)
目前全世界每年大約要召開數(shù)以千計(jì)個(gè)學(xué)術(shù)會(huì)議。會(huì)議種類繁多,因此伴隨會(huì)議產(chǎn)生了數(shù)量巨大的文字材料。這是會(huì)議文獻(xiàn)往往是科技信息發(fā)表傳播的最前沿陣地,各種一半以上的新科技成果和發(fā)明都在這些會(huì)議上最先面世的。這些會(huì)議文字材料會(huì)與圖書、期刊、或者科技報(bào)告有重復(fù)出現(xiàn)的情況。
1.5 專利文獻(xiàn)
這類文獻(xiàn)主要指發(fā)明人在專利申請(qǐng)時(shí)所提交的對(duì)于專利本身概況的說(shuō)明書。專利說(shuō)明書不僅僅具備法律效應(yīng),還對(duì)該專利的技術(shù)情況進(jìn)行了詳細(xì)說(shuō)明,是集可靠、實(shí)用和法律效應(yīng)與一體的科技材料。
1.6 技術(shù)標(biāo)準(zhǔn)
這是為了規(guī)范產(chǎn)品生產(chǎn)過(guò)程中對(duì)于科學(xué)技術(shù)使用的規(guī)范,它能夠體現(xiàn)整個(gè)國(guó)家或者地區(qū)的政策、工藝和水平。也可是說(shuō)是一種科學(xué)技術(shù)的信息來(lái)源。
1.7 政府文件
這類材料大部分是政策法規(guī)。有很強(qiáng)的約束力、政策性權(quán)威力。是政府為了某些特定科學(xué)技術(shù)的更好服務(wù)大眾的行政文件。通過(guò)這些文件能夠了解各個(gè)國(guó)家的科技水平和科技政策,具有很強(qiáng)的參考價(jià)值。
1.8 畢業(yè)論文
這類文獻(xiàn)是高等學(xué)府的學(xué)生為了領(lǐng)取畢業(yè)證書和學(xué)位證書時(shí)必須完成的作業(yè)。雖然不是很完整和詳盡,但還是有相當(dāng)?shù)膭?chuàng)造性和獨(dú)立性,參考價(jià)值也是有的。
1.9 其他類型
除去上8種之外,還有產(chǎn)品成品、技術(shù)檔案、報(bào)紙、新聞播報(bào)、手繪稿等其它類型的文獻(xiàn)。
2 文獻(xiàn)檢索的方法
2.1 直接法
直接利用網(wǎng)絡(luò)工具進(jìn)行文獻(xiàn)內(nèi)容的檢索,例如百度、谷歌、萬(wàn)方數(shù)據(jù)庫(kù)、維普數(shù)據(jù)庫(kù)等,這是最常用也是最方便的一種檢索文獻(xiàn)方式,但是因?yàn)樾畔⒘烤薮螅Ч话恪?
2.2 追溯引文法
這是一種通過(guò)“引文”來(lái)追溯查找文獻(xiàn)的方式。“引文”就是文獻(xiàn)末尾所列的參考文獻(xiàn),通過(guò)所用的參考文獻(xiàn)來(lái)反向查找需要的文獻(xiàn)。這樣做就是用“引文”找“引文”,獲得的有關(guān)文獻(xiàn)的信息越來(lái)越多,通過(guò)信息最后抽絲剝繭找到自己需要的文獻(xiàn)。這種方式同樣是因?yàn)樾畔⒘渴志薮螅斐尚实拖隆?
2.3 綜合法
這種方法就是將直接法和引文追溯法一起使用。即使用常規(guī)工具盡享檢索,又使用“引文”進(jìn)行檢索。
3 計(jì)算機(jī)檢索的步驟
3.1 確定檢索目標(biāo)
確定該問(wèn)題需要查找的文獻(xiàn)類型、所屬領(lǐng)域、地域范圍和時(shí)間區(qū)域。通過(guò)以上這些信息你定相關(guān)需要查找的關(guān)鍵字,這些關(guān)鍵字能夠體現(xiàn)文獻(xiàn)類型、所屬領(lǐng)域、地域范圍和時(shí)間。在此基礎(chǔ)上通過(guò)對(duì)查找內(nèi)容的了解提煉出核心概念,加入其中,會(huì)使檢索事半功倍。
3.2 選擇數(shù)據(jù)庫(kù)
根據(jù)以上的檢索目標(biāo),接下來(lái)就是確定檢索所使用的數(shù)據(jù)庫(kù)。在選擇的過(guò)程中,要根據(jù)要根據(jù)數(shù)據(jù)庫(kù)的種類和內(nèi)容進(jìn)行篩選或者同時(shí)進(jìn)行。例如,常規(guī)檢索就使用百度,論文檢索就使用萬(wàn)方數(shù)據(jù)庫(kù)、期刊檢索就使用維普數(shù)據(jù)庫(kù)等等,進(jìn)行對(duì)癥下藥,提高檢索文獻(xiàn)的效率。
3.3 上機(jī)檢索
上機(jī)檢索就是檢索文獻(xiàn)的實(shí)際操作過(guò)程。將檢索目標(biāo)輸入相應(yīng)的數(shù)據(jù)庫(kù)進(jìn)行查找,從而得出相關(guān)數(shù)據(jù)
3.4 評(píng)價(jià)信息
根據(jù)自己實(shí)際需要情況和檢索信息的內(nèi)容通過(guò)各種方法,例如定性評(píng)價(jià)法、定量評(píng)價(jià)法等對(duì)信息進(jìn)行綜合評(píng)價(jià),通過(guò)評(píng)價(jià)結(jié)果來(lái)決定是否使用該信息。
3.5 利用信息
根據(jù)評(píng)價(jià)結(jié)果,選取最優(yōu)的信息,進(jìn)行分析、節(jié)選等方法來(lái)合理使用 。
因特網(wǎng)上有海量的數(shù)據(jù),是信息的海洋,但在解決實(shí)際問(wèn)題中,仍感到缺乏真正需要的信息,出現(xiàn)了數(shù)據(jù)豐富,信息貧乏的問(wèn)題。希望我以上的淺析能對(duì)給位有所幫助。
摘 要:本文主要簡(jiǎn)單介紹影響網(wǎng)絡(luò)信息檢索的因素,以及面對(duì)現(xiàn)在互聯(lián)網(wǎng)的錯(cuò)綜復(fù)雜的環(huán)境下,對(duì)實(shí)現(xiàn)高效率的信息檢索提出幾點(diǎn)建議。
關(guān)鍵詞:網(wǎng)絡(luò)信息檢索;信息檢索;網(wǎng)絡(luò)信息
互聯(lián)網(wǎng)上的信息量是非常巨大的,隨著互聯(lián)網(wǎng)的技術(shù)和信息技術(shù)的不斷發(fā)展,人類接觸到的信息也是不斷變多,但是,由于在互聯(lián)網(wǎng)存在的信息資源的特點(diǎn),使得人們尋找自己想要的信息變的越來(lái)越難,人們更加迫切需要更好的檢索工具來(lái)幫助我們獲取自己想要的信息。信息社會(huì)離不開信息的作用,信息已經(jīng)是人類生活不可或缺的一部分。本文將介紹影響檢索信息的幾個(gè)因素,在此基礎(chǔ)上并提出幾點(diǎn)建議。
1.網(wǎng)絡(luò)信息檢索的現(xiàn)狀
網(wǎng)絡(luò)信息檢索最早是由國(guó)外學(xué)者Alan Emtage在1990年發(fā)明的Archie開始的,不過(guò)由于當(dāng)時(shí)網(wǎng)絡(luò)技術(shù)的應(yīng)用處于初級(jí)階段,應(yīng)用還是比較狹窄,只能簡(jiǎn)單的應(yīng)用于FTP文件的檢索。但是后來(lái)隨著萬(wàn)維網(wǎng)的出現(xiàn)以及信息技術(shù)的不斷飛躍發(fā)展,網(wǎng)絡(luò)信息檢索開始了基于網(wǎng)頁(yè)的檢索,并且迅速發(fā)展。伴隨而來(lái)的問(wèn)題就是網(wǎng)絡(luò)信息檢索的效率問(wèn)題。隨著信息資源數(shù)字化的發(fā)展,人們?cè)絹?lái)越依靠檢索來(lái)獲取自己想要的信息。但是,從目前的情況看,每天在互聯(lián)網(wǎng)上產(chǎn)生的信息量是相當(dāng)驚人的。用戶想要短時(shí)間獲取自己想要的信息已經(jīng)變得更加困難。
2.影響網(wǎng)絡(luò)信息檢索的因素
2.1 源于ICP的影響因素
ICP(即是Internet Content Provider 的簡(jiǎn)稱),它是指網(wǎng)絡(luò)信息提供者或者稱網(wǎng)站經(jīng)營(yíng)者[1]。某些ICP為了獲得額外的利潤(rùn)或是某種目的,當(dāng)用戶點(diǎn)擊某些優(yōu)質(zhì)的網(wǎng)頁(yè)的時(shí)候,在打開的同時(shí)會(huì)出現(xiàn)一些劣質(zhì)的網(wǎng)站,這些劣質(zhì)網(wǎng)站不夠規(guī)范而且存在的信息的準(zhǔn)確性也是有待商榷,另外這些ICP對(duì)采集的信息進(jìn)行頁(yè)面特征提取、主題分析并進(jìn)行相應(yīng)歸類,也即是以詞頻和詞出現(xiàn)位置的統(tǒng)計(jì)為依據(jù);這樣就為某些ICP 帶來(lái)可乘之機(jī),他們故意將一些無(wú)關(guān)的主題詞放置在重要的標(biāo)記內(nèi),或讓某些關(guān)鍵詞重復(fù)出現(xiàn)在重要的段落處,以提高其頁(yè)面被檢索的機(jī)率,然而這卻大大地影響用戶的檢準(zhǔn)率[1]。
2.2網(wǎng)絡(luò)信息資源質(zhì)量的因素
由于互聯(lián)網(wǎng)本身的特點(diǎn),即開放性,自由性和公開性導(dǎo)致了在互聯(lián)網(wǎng)上信息資源紛繁復(fù)雜,包括虛假的信息、淫穢的信息、暴力信息等等。同時(shí),在信息的端,如何控制信息源產(chǎn)生的信息準(zhǔn)確性。信息資源是不是能夠涵蓋某一方面,這些因素都會(huì)影響用戶進(jìn)行網(wǎng)絡(luò)信息檢索。
2.3檢索工具和方式的因素
傳統(tǒng)的信息資源標(biāo)引方式已經(jīng)不能適應(yīng)當(dāng)前復(fù)雜的網(wǎng)絡(luò)信息資源的類型,尤其在網(wǎng)絡(luò)新詞或是同義詞和近義詞,標(biāo)引方式就很難適應(yīng)這些新的變化,這也就導(dǎo)致了檢索工具不能檢索出未被標(biāo)引出來(lái)的信息資源,影響了檢索工具的檢全率。檢索工具的檢索方式也是多種多樣,按照布爾邏輯檢索、作者姓名,關(guān)鍵詞等方式進(jìn)行檢索,但是檢索的要求就會(huì)不一樣,使用的語(yǔ)言不具有統(tǒng)一性。這也是制約網(wǎng)絡(luò)信息檢索的重要因素。大多數(shù)搜索引擎的檢索方式比較單一,一般只提供分類檢索和關(guān)鍵詞檢索,這樣,一方面,檢索時(shí)不能從信息資源的多個(gè)方面對(duì)檢索提問(wèn)進(jìn)行限制,只能就某一關(guān)鍵詞或概念進(jìn)行籠統(tǒng)的檢索[2]。
相比較早期的檢索內(nèi)容來(lái)看,隨著人們檢索的需求發(fā)生改變,現(xiàn)在的檢索內(nèi)容也發(fā)生了變化,從最開始的檢索文本信息到如今要檢索圖片,視頻,音頻等多種形式的內(nèi)容,而從信息技術(shù)的發(fā)展看,國(guó)內(nèi)目前還沒(méi)有專業(yè)的檢索工具,影響檢索的全面性。
3.用戶本身的影響
(1)自身語(yǔ)言的障礙。由于用戶本身學(xué)歷或是地域的限制,導(dǎo)致了用戶只能掌握自己的母語(yǔ)。想要利用國(guó)外的檢索工具進(jìn)行外文檢索,也是很難完成的。目前最新的科技成果都是用英文表現(xiàn)出來(lái)的。由于語(yǔ)言的限制,影響了用戶的檢索。
(2)檢索語(yǔ)言的障礙。隨著現(xiàn)代學(xué)科的分類越來(lái)越細(xì),新興學(xué)科、邊緣學(xué)科、交叉學(xué)科不斷涌現(xiàn),每門學(xué)科應(yīng)用的術(shù)語(yǔ)、符號(hào)也隨著專深、復(fù)雜,每個(gè)學(xué)科所使用的檢索語(yǔ)言要求也是更加嚴(yán)格[2]。檢索語(yǔ)言和檢索方法和技巧的不能掌握,導(dǎo)致了不能全面利用各種檢索工具和系統(tǒng)。
(3)檢索能力的障礙。由于自身的理解能力、信息把握能力,語(yǔ)言組織能力的缺乏,在輸入檢索詞的時(shí)候可能出現(xiàn)表達(dá)不清楚,檢索出來(lái)不是用戶想要的信息。另外,用戶自身的計(jì)算機(jī)水平有限制,缺乏必要的計(jì)算機(jī)基礎(chǔ)知識(shí),隨著現(xiàn)在信息技術(shù)更新?lián)Q代過(guò)于快速,檢索工具、應(yīng)用軟件還不能掌握,嚴(yán)重影響了用戶利用檢索工具獲取信息資源。
4.提高網(wǎng)絡(luò)信息檢索效率的建議
4.1 加強(qiáng)監(jiān)管,提高信息資源的質(zhì)量
ICP是網(wǎng)絡(luò)信息的主要來(lái)源,國(guó)家或是政府應(yīng)該制定相應(yīng)的法律法規(guī),來(lái)完善行業(yè)準(zhǔn)則,保證信息源頭不會(huì)出現(xiàn)虛假、暴力、淫穢等信息資源。加強(qiáng)對(duì)各類網(wǎng)站的監(jiān)控管理,對(duì)質(zhì)量差的網(wǎng)站應(yīng)該加以限制,提高該網(wǎng)站的規(guī)范化,標(biāo)準(zhǔn)化。與此同時(shí),網(wǎng)民也可以發(fā)揮自己的力量,堅(jiān)決抵制和舉報(bào)虛假的信息。最后,積極組織開發(fā)、研制相關(guān)軟件及應(yīng)用網(wǎng)絡(luò)新技術(shù),對(duì)網(wǎng)絡(luò)信息進(jìn)行技術(shù)上的篩選、過(guò)濾,建立安全屏障,最大限度防止不良信息的侵入[3]。
4.2對(duì)網(wǎng)絡(luò)檢索工具的改進(jìn)
(1)改變傳統(tǒng)的標(biāo)引隨意性。改變以往只是依靠機(jī)器進(jìn)行標(biāo)引,把人工標(biāo)引和機(jī)器標(biāo)引相結(jié)合。規(guī)范標(biāo)引的索引詞,制定統(tǒng)一的標(biāo)準(zhǔn),加強(qiáng)對(duì)檢索詞的語(yǔ)義理解,提高檢索的智能化。對(duì)出現(xiàn)在網(wǎng)絡(luò)上的信息資源不只是簡(jiǎn)單的收集、利用。而是需要將這些信息資源進(jìn)行分析歸類,深度加工,建立一種具有多種語(yǔ)言標(biāo)引識(shí)別,提高檢索效率。
(2)完善用戶信息搜索界面,方便使用。完善檢索界面,能夠使用戶獲得更好地使用體驗(yàn),一個(gè)友好的用戶界面要能支持用戶進(jìn)行多語(yǔ)言、多種邏輯方式和多種角度提問(wèn)檢索,盡可能做到方便用戶使用[1]。改變檢索方式,使其更加自然、易懂,能適用于多種檢索平臺(tái)。
(3)改進(jìn)信息資源檢索的技術(shù),形成更加專業(yè)的檢索工具。面對(duì)多種信息資源的檢索,不能單獨(dú)只對(duì)文本信息的檢索,對(duì)于圖片、音頻、視頻等信息,需要采用更加合理的檢索工具來(lái)提高檢索效率,提高檢索的專業(yè)化。
4.3加強(qiáng)用戶檢索能力的培訓(xùn)[4]
對(duì)于用戶本身不具備的能力,需要通過(guò)不斷地學(xué)習(xí)來(lái)完善自己,才能掌握更多的語(yǔ)言和計(jì)算機(jī)的基礎(chǔ)知識(shí)。對(duì)于語(yǔ)言方面,用戶需要加強(qiáng)對(duì)語(yǔ)言的理解,能夠清楚地表達(dá)自己的信息需求,檢索的效率才能很好地體現(xiàn)出來(lái)。
檢索途徑,用戶需要了解更多檢索的方法,并不僅僅局限于只用關(guān)鍵詞進(jìn)行檢索,用戶為了獲取更多,更準(zhǔn)確的信息資源,力求掌握多種檢索途徑,進(jìn)行高級(jí)檢索。同時(shí),用戶可以進(jìn)行多個(gè)檢索平臺(tái)的檢索也是提高檢索效率的有效途徑之一,用戶利用多種語(yǔ)言在多個(gè)數(shù)據(jù)庫(kù)進(jìn)行檢索,提高用戶獲取信息資源的技能。
總之,面對(duì)信息的海洋,提高檢索的效率和檢全率是我們追求的目標(biāo)。影響網(wǎng)絡(luò)信息檢索的因素有許多方面,改進(jìn)的途徑也是非常多,但是,因特網(wǎng)是一個(gè)巨大的展示信息的平臺(tái),目前還是有許多地方存在一個(gè)不完善的地方,需要國(guó)家、政府以及個(gè)人不斷的努力,才能提高網(wǎng)絡(luò)信息檢索的效率。
(作者單位:安徽大學(xué)管理學(xué)院)
摘要:對(duì)國(guó)外有關(guān)信息檢索遠(yuǎn)程網(wǎng)絡(luò)教育情況進(jìn)行了簡(jiǎn)單的介紹,對(duì)我國(guó)該領(lǐng)域的問(wèn)題進(jìn)行了分析,最后對(duì)我國(guó)圖書館信息檢索遠(yuǎn)程網(wǎng)絡(luò)教育系統(tǒng)進(jìn)行了設(shè)計(jì)。
關(guān)鍵詞:圖書館 信息檢索 遠(yuǎn)程教育 網(wǎng)絡(luò)教育 設(shè)計(jì)
伴隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的發(fā)展,人類發(fā)展進(jìn)入信息化時(shí)代,為了更好地適應(yīng)時(shí)代的發(fā)展,我們要不斷提高對(duì)信息的獲取、分析和加工能力,而信息檢索和這些都有著直接的關(guān)系。因此,人們?cè)絹?lái)越重視信息檢索課,將其作為圖書館及檔案學(xué)等專業(yè)的基礎(chǔ)課程,也成為學(xué)生喜歡的選修科目。高校擴(kuò)招在很大程度上沖擊了課堂,而學(xué)生整體素質(zhì)的提高,一級(jí)網(wǎng)絡(luò)的普及給信息檢索網(wǎng)絡(luò)教育提供了機(jī)會(huì),促進(jìn)了信息檢索遠(yuǎn)程教育的興起和發(fā)展。
一、有關(guān)遠(yuǎn)程網(wǎng)絡(luò)教育
遠(yuǎn)程網(wǎng)絡(luò)教育作為計(jì)算機(jī)輔助教育網(wǎng)絡(luò)化的產(chǎn)物在上個(gè)世紀(jì)60年代產(chǎn)生的,計(jì)算機(jī)輔助教育是使學(xué)生通過(guò)和計(jì)算機(jī)之間的交互活動(dòng)來(lái)實(shí)現(xiàn)對(duì)學(xué)生的教育。在這當(dāng)中,計(jì)算機(jī)起到了媒介的作用。遠(yuǎn)程網(wǎng)絡(luò)教育從產(chǎn)生到現(xiàn)在得到了很大的發(fā)展,現(xiàn)在已經(jīng)發(fā)展成為了以計(jì)算機(jī)網(wǎng)為中心,集中了計(jì)算機(jī)和多媒體技術(shù),其具有很多的優(yōu)點(diǎn)。比如,具有較好的交互性、便捷性強(qiáng)、信息量大而且質(zhì)量高等,因此具有廣闊的應(yīng)用和發(fā)展前景。所謂的網(wǎng)絡(luò)教育,就是指將網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)以及多媒體技術(shù)進(jìn)行有機(jī)結(jié)合,建立在網(wǎng)絡(luò)基礎(chǔ)上的一種教育模式,遠(yuǎn)程教育是通過(guò)現(xiàn)代的傳播載體將教學(xué)的內(nèi)容傳遞到校園外的教學(xué)場(chǎng)所的一種教育模式,而遠(yuǎn)程網(wǎng)絡(luò)教育是指通過(guò)直播或者是錄像以及計(jì)算機(jī)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)課程向校園外傳遞的教育方式。
二、國(guó)內(nèi)外信息檢索遠(yuǎn)程教育情況
國(guó)外的遠(yuǎn)程網(wǎng)絡(luò)教育在最近幾年得到了迅速的發(fā)展,表現(xiàn)尤為突出的是美國(guó)。縱觀歷史,我國(guó)在該方面雖然取得了一定的成績(jī),但由于受到很多因素的影響,目前還是比較缺乏具有真正意義的信息檢索遠(yuǎn)程教育系統(tǒng)。第一,很多老師雖然都制作了多媒體課件,學(xué)校也將這些課件掛到了網(wǎng)上,但只不過(guò)是對(duì)教材的簡(jiǎn)單復(fù)制而已,沒(méi)有實(shí)質(zhì)上的意義;第二,一些可將無(wú)法適應(yīng)網(wǎng)絡(luò)環(huán)境的要求,在制作課件時(shí)由于對(duì)形式太過(guò)注重,導(dǎo)致課件的實(shí)用性不強(qiáng);第三,老師沒(méi)有對(duì)網(wǎng)絡(luò)優(yōu)勢(shì)進(jìn)行充分的利用,也做不到超時(shí)空和非線性的教學(xué),沒(méi)有將網(wǎng)絡(luò)教學(xué)的特點(diǎn)體現(xiàn)出來(lái);第四,由于缺乏通用的網(wǎng)絡(luò)教學(xué)平臺(tái)的接口,無(wú)法實(shí)現(xiàn)方便并快速的建立網(wǎng)絡(luò)教學(xué)系統(tǒng),搗實(shí)網(wǎng)絡(luò)教學(xué)只是停留在形式上;第五,學(xué)習(xí)的理論和教學(xué)實(shí)踐相脫離,因此保證不了教學(xué)的效果。
三、信息檢索遠(yuǎn)程網(wǎng)絡(luò)教育系統(tǒng)的設(shè)計(jì)思想
在信息檢索遠(yuǎn)程網(wǎng)絡(luò)教育系統(tǒng)的設(shè)計(jì)中,第一,要將網(wǎng)絡(luò)優(yōu)勢(shì)充分地發(fā)揮出來(lái),進(jìn)而實(shí)現(xiàn)實(shí)時(shí)交流和雙向交流;第二,要以老師作為教學(xué)的主體,為了使得教學(xué)質(zhì)量得到保證,要將老師的知道作用充分發(fā)揮出來(lái);第三,在設(shè)計(jì)中要考慮到信息檢索課的特點(diǎn)即實(shí)用性,要能激發(fā)學(xué)生學(xué)習(xí)的潛力和主動(dòng)性,使學(xué)生信息檢索的能力得到全面提高;第四,促進(jìn)學(xué)生創(chuàng)新能力的培養(yǎng),不斷提高學(xué)生的綜合素質(zhì),進(jìn)而更好地適應(yīng)當(dāng)今時(shí)代的發(fā)展,做到與時(shí)俱進(jìn)。
四、信息檢索遠(yuǎn)程網(wǎng)絡(luò)教育系統(tǒng)的教學(xué)模式和實(shí)現(xiàn)
在上述設(shè)計(jì)思想的指導(dǎo)下,經(jīng)過(guò)采用將學(xué)生自學(xué)、網(wǎng)上教學(xué)以及在校短期面授有機(jī)結(jié)合的教學(xué)形式。其中,短期面授主要是教學(xué)生有關(guān)信息技術(shù)方面的知識(shí),進(jìn)而為遠(yuǎn)程網(wǎng)絡(luò)教育的實(shí)現(xiàn)打下堅(jiān)實(shí)的基礎(chǔ)。遠(yuǎn)程網(wǎng)絡(luò)教育系統(tǒng)由五個(gè)部分構(gòu)成:
1.教學(xué)大綱和電子教案
教學(xué)大綱作為教學(xué)系統(tǒng)中的關(guān)鍵部分,通過(guò)教學(xué)大綱可以使學(xué)生明白教學(xué)的內(nèi)容、進(jìn)度以及目標(biāo)等,因此,教學(xué)大綱應(yīng)該以文本信息為主,而且條理要清晰,這樣才容易被學(xué)生接受。在信息檢索課中,有些教學(xué)內(nèi)容是相對(duì)固定的,電子教案中應(yīng)該以這些固定的教學(xué)內(nèi)容為主。
2.在線授課
在每個(gè)星期應(yīng)該有固定的時(shí)間進(jìn)行在線授課,這樣可以充分發(fā)揮老師的指導(dǎo)作用,因此在教學(xué)系統(tǒng)中作為核心和關(guān)鍵部分。通過(guò)網(wǎng)絡(luò)教育平臺(tái),老師可以及時(shí)對(duì)學(xué)生的學(xué)習(xí)進(jìn)行引導(dǎo),可以為學(xué)生排憂解難,使學(xué)生全面掌握一些重點(diǎn)和難點(diǎn),在某種程度上可以啟發(fā)學(xué)生的積極思維。而學(xué)生通過(guò)和老師同步的計(jì)算機(jī)演示平臺(tái),老師的整個(gè)授課過(guò)程都可以清楚地看見(jiàn)和聽(tīng)見(jiàn),這樣就可以跟著老師的思路,可以加深對(duì)知識(shí)的學(xué)習(xí)。在信息檢索課中,通過(guò)將理論的講解和對(duì)信息檢索的實(shí)時(shí)演示相結(jié)合,可以獲得很好的教學(xué)效果。在線授課環(huán)節(jié)中,實(shí)時(shí)性和雙向性是關(guān)鍵,想要保證整個(gè)教學(xué)系統(tǒng)的質(zhì)量,必須要保證該環(huán)節(jié)的質(zhì)量。
3.討論和交流社區(qū)
為了使學(xué)生更加方便地進(jìn)行討論和學(xué)習(xí)交流,老師可以對(duì)學(xué)生提出的疑問(wèn)及時(shí)進(jìn)行解答。學(xué)生可以通過(guò)郵件組和網(wǎng)絡(luò)會(huì)議等獲得學(xué)習(xí)上的指導(dǎo),老師可以通過(guò)公共郵件來(lái)和學(xué)生進(jìn)行對(duì)話和討論,進(jìn)而指導(dǎo)學(xué)生學(xué)習(xí),促進(jìn)教學(xué)目的的達(dá)成。
4.課程檔案
為了便于學(xué)生進(jìn)行復(fù)習(xí),應(yīng)該將每一次在線授課的全部過(guò)程錄制下來(lái),同時(shí)要保證錄制的質(zhì)量,這樣才能保證其具有利用的價(jià)值。
5.作業(yè)的提交和回復(fù)
學(xué)生可以發(fā)電子郵件來(lái)提交老師布置的作業(yè)任務(wù),老師收到并經(jīng)過(guò)批改之后又發(fā)給學(xué)生,在這個(gè)環(huán)節(jié)中,主要是對(duì)學(xué)生所學(xué)知識(shí)的測(cè)試,通過(guò)作業(yè),老師在很大程度上就可以看出學(xué)生掌握知識(shí)的程度,老師不斷找出存在的問(wèn)題,提高教學(xué)質(zhì)量。
在圖書館信息檢索網(wǎng)絡(luò)遠(yuǎn)程教育系統(tǒng)中,想要保證教學(xué)質(zhì)量,必須要選擇和開發(fā)合適的教育平臺(tái)。目前,國(guó)內(nèi)外都有很多的遠(yuǎn)程教育系統(tǒng)已經(jīng)投入使用,我國(guó)主要有西安交通大學(xué)軟件系統(tǒng)和上海交通大學(xué)軟件系統(tǒng),國(guó)外的很多軟件已經(jīng)進(jìn)入了我國(guó)的市場(chǎng)。盡管很多的網(wǎng)上教學(xué)支撐平臺(tái)是大學(xué)試驗(yàn)室的產(chǎn)物,依然處于開發(fā)和測(cè)試階段,如果自行開發(fā)遠(yuǎn)程教育系統(tǒng),將會(huì)花費(fèi)大量的成本。因此,從國(guó)外引進(jìn)購(gòu)買還是很劃算的。這在很大程度上促進(jìn)了對(duì)國(guó)外先進(jìn)技術(shù)的學(xué)習(xí),使我國(guó)的遠(yuǎn)程網(wǎng)絡(luò)教育水平盡快趕上并超過(guò)國(guó)際水準(zhǔn)。通過(guò)將國(guó)外的先進(jìn)網(wǎng)絡(luò)教育平臺(tái)引進(jìn)來(lái),可以在很大程度上提高我國(guó)高等教育質(zhì)量,進(jìn)而實(shí)現(xiàn)和國(guó)際接軌,更好地進(jìn)行學(xué)術(shù)交流。
此外需要注意的是,遠(yuǎn)程教育僅是一種教學(xué)方式而已,教學(xué)內(nèi)容依然作為保證教育質(zhì)量的關(guān)鍵因素,遠(yuǎn)程教育不是一成不變的電子教案,也不是純粹的錄音和錄像,遠(yuǎn)程教育最重要的就是該系統(tǒng)具有雙向互動(dòng)和實(shí)時(shí)交流的功能,這也是該系統(tǒng)的靈魂所在。
五、結(jié)束語(yǔ)
當(dāng)今處于網(wǎng)絡(luò)和信息時(shí)代,隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的迅速發(fā)展,為遠(yuǎn)程網(wǎng)絡(luò)遠(yuǎn)程教育提供了可能性,通過(guò)網(wǎng)絡(luò)平臺(tái)可以實(shí)現(xiàn)圖書館信息檢索課程的教學(xué)目的。我國(guó)相繼出臺(tái)了很多有關(guān)網(wǎng)絡(luò)教育的政策,這在很大程度上也促進(jìn)了網(wǎng)絡(luò)教育的發(fā)展和進(jìn)步,加上網(wǎng)絡(luò)教育本身具有很多優(yōu)點(diǎn),圖書館信息檢索遠(yuǎn)程教育在未來(lái)將會(huì)有著廣闊的應(yīng)用和發(fā)展前景。
摘要: 隨著多媒體應(yīng)用技術(shù)的不斷發(fā)展,在社會(huì)的各個(gè)領(lǐng)域多媒體技術(shù)得到了廣泛的應(yīng)用。圖書館作為文化和知識(shí)傳播的主要陣地,如何提升圖書館的服務(wù)效率,成為發(fā)揮圖書館社會(huì)效益的基礎(chǔ)。本研究以網(wǎng)絡(luò)時(shí)代多媒體技術(shù)在圖書館信息檢索中的應(yīng)用為研究對(duì)象,分析了多媒體技術(shù)的特點(diǎn)與圖書館信息檢索的交互性,在此基礎(chǔ)上提出了多媒體技術(shù)對(duì)圖書館信息檢索的促進(jìn)作用,最后闡述了網(wǎng)絡(luò)時(shí)代多媒體技術(shù)在圖書館信息檢索中的應(yīng)用策略。通過(guò)本研究,以期為提升多媒體技術(shù)在圖書館的應(yīng)用效果,提供理論參考。
關(guān)鍵詞: 網(wǎng)絡(luò)時(shí)代;多媒體技術(shù);圖書館;信息檢索
1 多媒體技術(shù)特點(diǎn)及意義
多媒體技術(shù)指的是,通過(guò)使用計(jì)算機(jī)把文字、圖形、聲音等進(jìn)行科技處理,實(shí)現(xiàn)這些內(nèi)容相互間的聯(lián)系,并通過(guò)多媒體技術(shù)的應(yīng)用,獲得更多的實(shí)際效果。多媒體技術(shù)主要有三個(gè)特點(diǎn):
1.1 多媒體技術(shù)的集成性 多媒體的集成性指的是把多種媒體有機(jī)地結(jié)合在一起,實(shí)現(xiàn)對(duì)文字等的表達(dá),獲得圖文聲像一體化。在多媒體產(chǎn)生出來(lái)之前,各種數(shù)據(jù)、文本、圖片等作為相對(duì)獨(dú)立的信息處理方式,借助不同的技術(shù)處理手段,例如:數(shù)據(jù)處理系統(tǒng)對(duì)相關(guān)的數(shù)據(jù)進(jìn)行專業(yè)的處理,對(duì)文本、文字進(jìn)行處理,多媒體技術(shù)獎(jiǎng)這些相關(guān)的信息處理時(shí),表現(xiàn)出了一定的集成性。
1.2 多媒體技術(shù)的交互性 多媒體技術(shù)的交互性指的是人機(jī)之間的交互,在進(jìn)行多媒體節(jié)目播放的過(guò)程中,人們可以實(shí)現(xiàn)有目的的干預(yù),借助人機(jī)交換的信息來(lái)實(shí)現(xiàn)所要達(dá)到的目的。多媒體技術(shù)不像電視機(jī)一樣,人們不能夠主動(dòng)地接受傳播的信息。而可以通過(guò)多種渠道進(jìn)行計(jì)算器交流,更好地實(shí)現(xiàn)人和信息之間,數(shù)字化的有效選擇和控制。
1.3 多媒體技術(shù)的兼容性 多媒體信息技術(shù)以數(shù)字化的形式,將多種信息儲(chǔ)存在固定的介質(zhì)中,能夠?qū)崿F(xiàn)對(duì)信息的有效加工、傳播。這些任務(wù)的完成,需要多媒體技術(shù)的兼容性。當(dāng)前多媒體技術(shù)在圖書館的應(yīng)用,主要有下面這些領(lǐng)域:圖書咨詢服務(wù)、圖書產(chǎn)品展示、圖書管理培訓(xùn)、圖書館會(huì)議、圖書館監(jiān)控管理等等。當(dāng)前多媒體技術(shù)向著高分辨率、高速度化、多維度、智能化、標(biāo)準(zhǔn)化的方向發(fā)展。
2 多媒體技術(shù)在圖書館信息檢索中的應(yīng)用
多媒體技術(shù)作為信息處理的高端技術(shù),對(duì)圖書館這一文化傳播的陣地有著積極的推動(dòng)作用。多媒體技術(shù)在圖書館信息檢索中有著重要的意義。
2.1 多媒體技術(shù)在圖書館自動(dòng)化系統(tǒng)中的應(yīng)用 圖書館自動(dòng)化系統(tǒng)所使用的多媒體結(jié)構(gòu),大部分是在大存儲(chǔ)的主機(jī)服務(wù)器下的分散終端,通過(guò)把各個(gè)功能分配在相關(guān)的終端,在應(yīng)用的時(shí)候,各個(gè)環(huán)節(jié)相互支持和影響,當(dāng)服務(wù)器的采、分、編的各個(gè)環(huán)節(jié)產(chǎn)生故障于混亂以后,會(huì)使得整個(gè)的系統(tǒng)受到不同程度的影響。多媒體系統(tǒng)能夠有效地避免這些缺陷,多媒體通過(guò)把這些塔架層次結(jié)構(gòu)系統(tǒng),借助多媒體平臺(tái)構(gòu)建一種平面的蛛網(wǎng)結(jié)構(gòu),能夠避免因?yàn)榄h(huán)節(jié)故障給整個(gè)圖書館自動(dòng)化系統(tǒng)帶來(lái)的不良影響。
當(dāng)前我們國(guó)家的圖書館網(wǎng)絡(luò)自動(dòng)化發(fā)展的速度比較慢,影響發(fā)展速度的原因有環(huán)境和配置設(shè)備的原因,也有網(wǎng)絡(luò)成員的協(xié)作和不同需求的因素。在圖書館網(wǎng)絡(luò)自動(dòng)化發(fā)展的過(guò)程中,可以通過(guò)使用多媒體技術(shù),構(gòu)建文本、圖片、圖標(biāo)等多種內(nèi)容和多種形式的數(shù)據(jù)庫(kù),滿足圖書館這一行業(yè)的要求。
2.2 多媒體技術(shù)在圖書信息處理中的應(yīng)用 隨著多媒體技術(shù)在圖書館各個(gè)領(lǐng)域的廣泛應(yīng)用,定會(huì)促進(jìn)多媒體信息搜集、信息傳遞、信息控制、信息分享等方式和方法上的改進(jìn),提高圖書館網(wǎng)絡(luò)應(yīng)用和管理的多樣化。在圖書館多媒體應(yīng)用的過(guò)程中,其使用的各種軟件平臺(tái),是在操作系統(tǒng)和應(yīng)用兩者之間,多媒體技術(shù)的兼容性能要優(yōu)于普通的微型計(jì)算機(jī),這有效地避免了因?yàn)檐浖筒僮飨到y(tǒng)的不兼容,給圖書管理等工作帶來(lái)的影響。
2.3 圖書館館藏媒體的多樣化 隨著多媒體應(yīng)用的不斷進(jìn)步,多媒體產(chǎn)品的多樣化程度越來(lái)越高,這些產(chǎn)品為圖書館提供了更為安全、有效的信息載體。隨著多媒體在圖書館信息檢索及日常工作中的廣泛應(yīng)用,有效地?cái)U(kuò)展了圖書館的存儲(chǔ)能力,并且提高了傳輸信息的一體化水平。多媒體技術(shù)的廣泛使用,促使圖書館傳統(tǒng)的印刷品為主的藏書體系,開始向著數(shù)字化的存儲(chǔ)介質(zhì)應(yīng)用方向過(guò)渡。在以電子計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)為主要標(biāo)志的現(xiàn)代化多媒體的技術(shù)表現(xiàn)下,其鮮明的特點(diǎn)使得讀者感覺(jué)越來(lái)越方便。因此,也受到了廣大讀者的廣泛使用和歡迎。圖書館館藏媒體的多樣化,實(shí)現(xiàn)了把傳統(tǒng)的館藏工作,變得更為高效和全面。
2.4 圖書信息服務(wù)內(nèi)容的多樣化 多媒體技術(shù)的發(fā)展和使用,為圖書館的服務(wù)水平提升,創(chuàng)造了更多的條件,在現(xiàn)代化的圖書管理工作中,讀者既可以進(jìn)行傳統(tǒng)紙質(zhì)書刊的借閱,也可以通過(guò)儀器閱讀相關(guān)的圖書膠片、光盤、聲音等形式的資料。當(dāng)前,北京大學(xué)圖書館、清華大學(xué)圖書館都已經(jīng)開設(shè)了多媒體閱覽室,并且收到了良好的效果。多媒體技術(shù)在圖書館中的應(yīng)用表現(xiàn)出了多種優(yōu)勢(shì),如:交互的便捷性、多樣化以及信息檢索和存儲(chǔ)的高效性等等,都為圖書館工作的開展,創(chuàng)造了良好的條件。
3 網(wǎng)絡(luò)時(shí)代多媒體技術(shù)在圖書館信息檢索中的應(yīng)用策略
3.1 規(guī)范圖書館信息檢索板塊的設(shè)置 相關(guān)的調(diào)查和研究表明,圖書館信息檢索服務(wù)的提供有效的方便了用戶使用,但是我們也發(fā)現(xiàn),例如在圖書館虛擬咨詢服務(wù)設(shè)置的時(shí)候,由于受到圖書館服務(wù)名稱和標(biāo)準(zhǔn)的影響,虛擬咨詢服務(wù)名字的選擇并不統(tǒng)一,這種情況的存在,使得用戶在使用不同圖書館提供的服務(wù)時(shí)候,需要多方面的查詢和了解,才能夠找到虛擬咨詢服務(wù)的板塊,并開展咨詢服務(wù)。因此,設(shè)置統(tǒng)一規(guī)范的虛擬咨詢服務(wù)名稱,是提高圖書館虛擬咨詢服務(wù)效率的前提。
3.2 做好圖書館信息檢索服務(wù)范圍的界定 在圖書館信息檢索服務(wù)開展的過(guò)程中,要以用戶的滿意和便捷使用信息檢索服務(wù)為宗旨開展工作。但是因?yàn)閳D書館用戶群體的龐大,使得圖書館信息檢索服務(wù)的工作量較大,因此,各個(gè)圖書館在進(jìn)行信息檢索服務(wù)設(shè)置的時(shí)候,可以對(duì)專門的咨詢服務(wù)范圍進(jìn)行界定,以提高信息檢索服務(wù)的效率,避免因?yàn)樽稍儐?wèn)題的重復(fù)性而影響服務(wù)工作的開展。明確信息檢索服務(wù)的范圍,需要對(duì)用戶咨詢的常見(jiàn)問(wèn)題進(jìn)行篩選,對(duì)服務(wù)的針對(duì)性和有效性進(jìn)行評(píng)估,以此來(lái)提升圖書館服務(wù)的專業(yè)性。
3.3 信息檢索內(nèi)容的設(shè)置 通過(guò)對(duì)調(diào)查的圖書館開設(shè)的信息檢索服務(wù)的形式分析得出,在開設(shè)WEB表格的4家圖書館中,表格的設(shè)計(jì)較為單一,只是設(shè)置了用戶的名字、工作、郵件地址、聯(lián)系方式等,接下來(lái)就是用戶提問(wèn)內(nèi)容。信息檢索服務(wù)只設(shè)置這些信息,使得圖書館服務(wù)人員,在進(jìn)行檢索策略時(shí)感覺(jué)很迷茫,這是由于工作服務(wù)人員對(duì)于已經(jīng)掌握資源的用戶需求和目的不能夠做出正確的判斷。所以,在進(jìn)行WEB表格設(shè)計(jì)的時(shí)候,可以加上用戶已經(jīng)掌握的資源、對(duì)圖書檢索的要求、答案提供的時(shí)間范圍等等。這樣更加有助于圖書館服務(wù)人員為用戶提供針對(duì)性強(qiáng)的咨詢服務(wù),提高圖書館信息檢索服務(wù)的效率。
3.4 加大對(duì)信息檢索服務(wù)方式的創(chuàng)建 當(dāng)前在圖書館網(wǎng)頁(yè)信息檢索服務(wù)中,大部分圖書館的信息檢索服務(wù)只能提供問(wèn)題瀏覽,不能提供問(wèn)題檢索服務(wù)。在圖書館搜集較多用戶問(wèn)題的時(shí)候,用戶如果需要查找某一個(gè)想要信息檢索的問(wèn)題時(shí),就顯得非常不便。因此,圖書館需要將前期用戶的問(wèn)題做成一個(gè)能夠進(jìn)行檢索的問(wèn)題數(shù)據(jù)庫(kù),為用戶提供瀏覽和自動(dòng)檢索這兩種問(wèn)題查詢的方式,將會(huì)有效的提升為用戶提供信息檢索服務(wù)的效率。但是調(diào)查表明,僅僅有4家圖書館設(shè)置了能夠檢索的FAQ。另外,在圖書館信息檢索服務(wù)提供的同時(shí),要不斷的加強(qiáng)數(shù)字資源的建設(shè),加快特色數(shù)字資源板塊的創(chuàng)建,為用戶提供更多的便捷服務(wù),使用者能夠快速的找到自己所需要的資料,既節(jié)省了用戶的查詢時(shí)間,也提升了圖書館的工作效率。
3.5 做好圖書館信息檢索的保護(hù) 在圖書館信息檢索服務(wù)開展的過(guò)程中,圖書館用戶是通過(guò)網(wǎng)絡(luò)注冊(cè)等途徑,進(jìn)入圖書館網(wǎng)站的,這就使得用戶的信息在一定權(quán)限下,能夠進(jìn)行瀏覽。因此,網(wǎng)絡(luò)環(huán)境下圖書館工作的開展,需要加強(qiáng)對(duì)圖書館用戶個(gè)人隱私的保護(hù),這種對(duì)個(gè)人信息、興趣愛(ài)好、通訊地址等內(nèi)容的保護(hù),是更好的保證用戶個(gè)人利益,提升圖書館信息檢索服務(wù)的準(zhǔn)確性、安全性的重要基礎(chǔ),對(duì)每一個(gè)開設(shè)信息檢索服務(wù)的圖書館來(lái)講,都是需要重點(diǎn)關(guān)注的內(nèi)容之一。
3.6 加大對(duì)圖書館用戶檢索技能的培訓(xùn) 在圖書館信息檢索服務(wù)提供的過(guò)程中,圖書館要做好用戶應(yīng)用圖書館檢索的培訓(xùn)。通過(guò)對(duì)圖書館問(wèn)答庫(kù)的調(diào)查發(fā)現(xiàn),當(dāng)前有一部分用戶咨詢的問(wèn)題是關(guān)于文獻(xiàn)檢索方法的問(wèn)題,圖書館咨詢服務(wù)解答人員的答案,是教會(huì)用戶怎樣利用圖書館的數(shù)據(jù)庫(kù)檢索,這種檢索服務(wù)的前期培訓(xùn),是提高圖書館信息檢索服務(wù)效率的基礎(chǔ)工作。因此,在圖書館提供信息檢索服務(wù)的同時(shí),要借助圖書館主頁(yè)、宣傳冊(cè)發(fā)放等方式,來(lái)提高用戶使用圖書館信息檢索服務(wù)的能力。
4 結(jié)語(yǔ)
綜上所述,隨著多媒體技術(shù)的不斷發(fā)展,對(duì)圖書館信息管理和日常工作來(lái)講,既是機(jī)遇也是挑戰(zhàn)。這就要求圖書館在信息管理的過(guò)程中,把握好圖書館多媒體技術(shù)應(yīng)用的契機(jī),通過(guò)多媒體技術(shù)的開發(fā),對(duì)現(xiàn)有的圖書管理、服務(wù)方式、服務(wù)內(nèi)容,進(jìn)行全面的優(yōu)化,不斷地提升圖書館工作的現(xiàn)代化水平,為廣大讀者和用戶,提供更為便捷、高效的圖書管理工作,獲得更好的經(jīng)濟(jì)和社會(huì)效益。
摘 要:本文對(duì)網(wǎng)絡(luò)信息檢索的特征、方式以及未來(lái)的發(fā)展趨勢(shì)進(jìn)行了初步的探討。
關(guān)鍵詞:網(wǎng)絡(luò) 信息檢索 趨勢(shì)
Internet在全球范圍內(nèi)的迅速發(fā)展與成熟,促成社會(huì)各領(lǐng)域信息飛速膨脹,為人們查找、獲取信息提供了豐富的信息源,越來(lái)越多
的人開始利用網(wǎng)絡(luò)來(lái)查詢信息。網(wǎng)絡(luò)信息檢索就是根據(jù)用戶的需要,從大量的網(wǎng)絡(luò)信息集合中查詢出特定(即相關(guān))的一小部分信息的過(guò)程。那么,面對(duì)網(wǎng)上大量紛繁復(fù)雜的信息資源,今后網(wǎng)絡(luò)信息檢索的發(fā)展會(huì)是怎樣呢?筆者就這一問(wèn)題進(jìn)行了探討。
1. 網(wǎng)絡(luò)信息檢索的起源
信息檢索始于上世紀(jì)50年代,60年代已經(jīng)實(shí)用化,70年代聯(lián)機(jī)檢索服務(wù)形成市場(chǎng),80年代實(shí)現(xiàn)多元化、智能化,90年代信息檢索系統(tǒng)與因特網(wǎng)結(jié)合,才出現(xiàn)了早期簡(jiǎn)單的網(wǎng)絡(luò)檢索。但由于Internet的迅猛發(fā)展使其所含的信息數(shù)量激增,在這樣一個(gè)無(wú)限、無(wú)序、浩瀚無(wú)邊的信息空間里,快速查找并獲取所需的信息已成為人們最迫切的需要。
2. 網(wǎng)絡(luò)信息檢索的特征
2.1信息檢索空間的拓寬 網(wǎng)絡(luò)信息檢索的空間比之傳統(tǒng)的情報(bào)檢索是大大地拓寬了,它可以檢索因特網(wǎng)上的各類資源,而檢索者不必預(yù)先知道某種資源的具體地址。其檢索范圍覆蓋了整個(gè)因特網(wǎng)這一全球性的網(wǎng)絡(luò)之網(wǎng)絡(luò),為訪問(wèn)和獲取廣泛分別在世界各地、成千上萬(wàn)臺(tái)服務(wù)器和主機(jī)上的大量信息提供了可能。這一優(yōu)勢(shì)是任何其它信息檢索方式所不具備的,如:國(guó)際商用聯(lián)機(jī)檢索也只能是檢索某一臺(tái)、某幾臺(tái)主機(jī)或某一局部網(wǎng)絡(luò)內(nèi)的若干數(shù)據(jù)庫(kù)。
2.2交互式作業(yè)方式 所有的網(wǎng)絡(luò)信息檢索工具具有交互式作業(yè)的特點(diǎn),能夠從用戶命令中獲取指令,即時(shí)響應(yīng)用戶的要求,執(zhí)行相應(yīng)操作,并具有良好的信息反饋功能,用戶可以在檢索過(guò)程中及時(shí)地調(diào)整檢索策略以獲取良好的檢索結(jié)果,并能就所遇到的問(wèn)題獲得聯(lián)機(jī)幫助和指導(dǎo)。
2.3用戶界面友好且操作方便 網(wǎng)絡(luò)信息檢索對(duì)用戶屏蔽了各局部網(wǎng)絡(luò)間物理差異,使用戶在使用這些服務(wù)時(shí)感到明顯的系統(tǒng)透明度。檢索者使用自己所熟悉的檢索界面和命令方式輸入查詢提問(wèn)就可以實(shí)現(xiàn)對(duì)各種異構(gòu)系統(tǒng)數(shù)據(jù)庫(kù)的訪問(wèn)、檢索。
3. 網(wǎng)絡(luò)信息常用的檢索方式
3.1鏈接法 是指用戶在閱讀超文本文檔時(shí),利用文檔中的鏈接從一網(wǎng)頁(yè)轉(zhuǎn)向另一相關(guān)網(wǎng)頁(yè)。有些類似于傳統(tǒng)文獻(xiàn)檢索中的“追溯檢索”,即根據(jù)文獻(xiàn)后所附的參考文獻(xiàn)追溯相關(guān)文獻(xiàn),一輪一輪地不斷擴(kuò)大檢索范圍。個(gè)人用戶在網(wǎng)絡(luò)瀏覽的過(guò)程中常常通過(guò)創(chuàng)建書簽或熱鏈表來(lái)將一些常用的、優(yōu)秀的站點(diǎn)地址記錄下來(lái),組織成目錄以備今后之需。但這種做法只能滿足個(gè)別、一時(shí)之需,相對(duì)于這個(gè)網(wǎng)絡(luò)信息的發(fā)展,其檢索功能似乎是微不足道,談不上真正意義上的網(wǎng)絡(luò)信息檢索。
3.2通過(guò)網(wǎng)絡(luò)資源指南來(lái)查找信息 為了對(duì)因特網(wǎng)這個(gè)無(wú)序的信息世界加以組織、管理,使大量有價(jià)值的信息納入一個(gè)有序的組織體系,專業(yè)人員做了許多努力和開發(fā)。也就是基于專業(yè)人員對(duì)網(wǎng)絡(luò)信息資源的產(chǎn)生、傳遞與利用機(jī)制的廣泛了解,和對(duì)網(wǎng)絡(luò)信息資源分布狀況的熟悉,以及對(duì)各種網(wǎng)絡(luò)信息資源的采集、組織、評(píng)價(jià)、過(guò)濾、控制、檢索等手段的全面把握而開發(fā)出的可供瀏覽和檢索的網(wǎng)絡(luò)資源主題指南。
3.3利用搜索引擎進(jìn)行信息檢索 這種方法是較為普遍、常規(guī)的網(wǎng)絡(luò)信息檢索方法。搜索引擎是提供給用戶進(jìn)行關(guān)鍵詞、詞組或自然語(yǔ)言檢索的工具。這種方式用戶可以用邏輯組合方式輸入各種關(guān)鍵詞,搜索引擎根據(jù)這些關(guān)鍵詞尋找用戶所需資源的地址,然后根據(jù)一定的順序反饋給用戶包含這些關(guān)鍵詞信息的所有網(wǎng)址和指向這些網(wǎng)址的鏈接。利用搜索引擎進(jìn)行信息檢索具有:省時(shí)省力,簡(jiǎn)單方便,檢索速度快、范圍廣,能及時(shí)獲取新增信息,這才是真正意義上的網(wǎng)絡(luò)信息檢索。
4. 網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)
4.1智能檢索 近年來(lái)被稱為智能搜索引擎的網(wǎng)絡(luò)檢索工具已經(jīng)出現(xiàn),智能搜索引擎有3個(gè)主要的特征:網(wǎng)絡(luò)蜘蛛的智能化、為特定用戶提供相關(guān)信息、搜索引擎人機(jī)接口的智能化。它可以在因特網(wǎng)中導(dǎo)引用戶,不僅在用戶搜索、瀏覽時(shí)給予直接的支持,而且能夠提供具有獨(dú)立搜索功能的智能體的幕后支持。
隨著網(wǎng)絡(luò)用戶對(duì)檢索的精度、檢索效率要求的不斷提高, 網(wǎng)絡(luò)檢索軟件開發(fā)更重視開發(fā)檢索工具在檢索功能及檢索服務(wù)上的智能化程度。
4.2可視化檢索 網(wǎng)絡(luò)檢索的可視化是指將數(shù)據(jù)庫(kù)中的不可見(jiàn)的語(yǔ)義關(guān)系用圖像形式可視化顯示并表達(dá)用戶檢索過(guò)程。可視化檢索有許多優(yōu)點(diǎn),主要表現(xiàn)在:對(duì)文獻(xiàn)或檢索式內(nèi)部語(yǔ)義關(guān)系的理解有助于用戶判斷一個(gè)檢索中的相關(guān)文獻(xiàn);可視化的環(huán)境可以為用戶提供更豐富和更直觀的信息;相關(guān)性在傳統(tǒng)的信息檢索中只指檢索結(jié)果、檢索式相關(guān),而在可視化檢索中則指檢索結(jié)果之間的相關(guān)度;使得用戶可以進(jìn)行交互式輸入,允許在信息空間進(jìn)行動(dòng)態(tài)移動(dòng),允許用戶修改數(shù)據(jù)的顯示方式,使他們理解數(shù)據(jù)的個(gè)人偏好可視化;減少了理解檢索結(jié)果的時(shí)間,可以對(duì)相關(guān)信息進(jìn)行聚類分析,而聚類分析可幫助人們發(fā)現(xiàn)新的學(xué)科點(diǎn),也可作為反饋的工具;操縱檢索的內(nèi)部過(guò)程;提高檢索系統(tǒng)與人之間的交互性;檢索結(jié)果可以模仿網(wǎng)絡(luò)環(huán)境形成拓?fù)浣Y(jié)構(gòu)圖,在拓?fù)浣Y(jié)構(gòu)圖中所有相關(guān)文獻(xiàn)或其他類型資源將被歸為同類;一個(gè)透明的檢索過(guò)程使檢索更容易更有效。
4.3多媒體信息檢索 目前,基于內(nèi)容的多媒體信息檢索是研究的熱點(diǎn)。基于內(nèi)容的多媒體信息檢索是根據(jù)媒體和媒體對(duì)象的內(nèi)容及上下文聯(lián)系在大規(guī)模多媒體數(shù)據(jù)庫(kù)中進(jìn)行檢索。多媒體信息檢索是一項(xiàng)涉及多個(gè)學(xué)科的課題,因?yàn)樗枰脠D像處理、模式識(shí)別、計(jì)算機(jī)視覺(jué)、圖像理解等領(lǐng)域的知識(shí)作為基礎(chǔ),還需從認(rèn)知科學(xué)、人工智能、數(shù)據(jù)庫(kù)管理系統(tǒng)、人機(jī)交互、信息檢索等領(lǐng)域引入新的媒體數(shù)據(jù)表示和數(shù)據(jù)模型,從而設(shè)計(jì)出可靠的、有效的檢索算法、系統(tǒng)結(jié)構(gòu)以及友好的人機(jī)界面。
4.4基于網(wǎng)格的信息檢索 網(wǎng)格概念最早于20世紀(jì)90年代中期提出,是從電力網(wǎng)概念借鑒過(guò)來(lái)的。其主要特點(diǎn)是把整個(gè)因特網(wǎng)集成為一臺(tái)巨大的超級(jí)計(jì)算機(jī),以實(shí)現(xiàn)全球范圍的計(jì)算資源、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資源、專家資源、設(shè)備資源的全面共享。互聯(lián)網(wǎng)實(shí)現(xiàn)了計(jì)算機(jī)硬件的連通,wed實(shí)現(xiàn)了網(wǎng)頁(yè)的連通,而網(wǎng)格試圖實(shí)現(xiàn)互聯(lián)網(wǎng)上所有資源的全面連通,在動(dòng)態(tài)的、異構(gòu)的虛擬組織間實(shí)現(xiàn)協(xié)同的資源共享以及協(xié)同解決問(wèn)題。共享是網(wǎng)格強(qiáng)調(diào)的重點(diǎn),但是這種共享又必須是高度可控的,需要在資源提供者和消費(fèi)者之間詳細(xì)定義哪些部分是可以被共享的,在什么條件下可以共享以及相應(yīng)的管理機(jī)制、付費(fèi)機(jī)制。
當(dāng)前,隨著計(jì)算機(jī)高科技的不斷發(fā)展,網(wǎng)絡(luò)檢索就像當(dāng)年的照相機(jī)一樣,逐步超著簡(jiǎn)單化、人性化方向發(fā)展,檢索界面越來(lái)越簡(jiǎn)單友好,越來(lái)越適用與普通用戶。用戶可以很容易地進(jìn)行網(wǎng)上自動(dòng)標(biāo)引、自動(dòng)文摘、自動(dòng)跟蹤、自動(dòng)漫游、機(jī)器翻譯、多媒體檢索欣賞、動(dòng)態(tài)連接、數(shù)據(jù)挖掘等操作,方便、 及時(shí)、準(zhǔn)確地獲得所需信息。
網(wǎng)絡(luò)信息檢索的發(fā)展永遠(yuǎn)滯后于用戶的需求,這是個(gè)不爭(zhēng)的事實(shí),但也正是用戶的需求推動(dòng)著網(wǎng)絡(luò)信息檢索技術(shù)的不斷完善。在網(wǎng)絡(luò)信息檢索不斷發(fā)展壯大的今天來(lái)展望未來(lái),人類信息需求究竟能夠被滿足到何種程度,我們拭目以待。
摘 要:在先進(jìn)科技信息化不斷發(fā)展的今天,信息檢索課程的教學(xué)方式與教學(xué)內(nèi)容發(fā)生了很大變化。利用多媒體和聯(lián)接網(wǎng)絡(luò)的方式進(jìn)行教學(xué),把信息檢索相關(guān)的基本常識(shí)、有關(guān)資源等大部分內(nèi)容做成教學(xué)用的資料并且做出簡(jiǎn)單的說(shuō)明,然后讓學(xué)生們直接從網(wǎng)絡(luò)上拷貝和下載,進(jìn)而加強(qiáng)自己的信息量。本文綜合分析網(wǎng)絡(luò)信息檢索教學(xué)現(xiàn)在發(fā)展的情況基礎(chǔ)上,討論了怎樣在現(xiàn)狀的基礎(chǔ)上更好的發(fā)展來(lái)對(duì)網(wǎng)絡(luò)信息檢索教學(xué)進(jìn)行改革。改革的重點(diǎn)主要是教學(xué)的內(nèi)容與方式及師資部分上加強(qiáng)創(chuàng)新,提升信息檢索教學(xué)的質(zhì)量,滿足高科技時(shí)代不斷發(fā)展的需要。
關(guān)鍵詞:教學(xué)改革;信息檢索;教學(xué)設(shè)計(jì);網(wǎng)絡(luò)環(huán)境
1 信息檢索教學(xué)的背景分析
現(xiàn)在的教學(xué)中因?yàn)樾@網(wǎng)和圖書館設(shè)備自動(dòng)化的建設(shè)不斷發(fā)展。各類的讀物、在網(wǎng)絡(luò)上有許多的資料文獻(xiàn)都是可以直接搜索到的,而且在校園的網(wǎng)絡(luò)中利用圖書館的系統(tǒng)來(lái)搜索所需要的資料已成為了他們生活中不可或缺的組成部分。同時(shí)利用局域網(wǎng)和Internet等方法將圖書館信息資源融合起來(lái),變成校園內(nèi)的共享資源。讓全體師生在利用網(wǎng)絡(luò)檢索信息時(shí)更加的高效方便。當(dāng)前,學(xué)校圖書館的統(tǒng)計(jì)中可以看到購(gòu)進(jìn)的光盤和用于網(wǎng)絡(luò)數(shù)據(jù)庫(kù)的經(jīng)費(fèi)原來(lái)的20萬(wàn)元左右增加至近70萬(wàn)元,數(shù)字且還在持續(xù)上升。同時(shí)購(gòu)進(jìn)的資料種類也越加的豐富和廣泛。從前一些只有在圖書館信息檢索室里才可以搜索得出來(lái)的一些數(shù)據(jù),因?yàn)楦鞣矫娴陌l(fā)展和完善,那些原本在特定地方才能搜索的數(shù)據(jù)現(xiàn)已全部上傳至了網(wǎng)絡(luò)中。無(wú)論是誰(shuí)都可以利用網(wǎng)絡(luò)來(lái)找到自己所需要的信息。而且一些網(wǎng)絡(luò)數(shù)據(jù)庫(kù)公在搜索上采用的是鏡像站或?qū)>€訪問(wèn)的技術(shù),所有這些做出的改革都為信息檢索的傳授提供了一個(gè)的好的大環(huán)境。
2 分析信息檢索教學(xué)的現(xiàn)狀
2.1 信息知識(shí)更新速度太快
現(xiàn)在先進(jìn)技術(shù)的創(chuàng)新和計(jì)算機(jī)應(yīng)用的普及,信息的媒介已越來(lái)越傾向于電子化的趨勢(shì)。信息的數(shù)量如氣球般迅速膨脹起來(lái)。無(wú)論是線性還是非線性或是以聯(lián)想的的方式,都有益于對(duì)檢索和交叉檢索的良性的發(fā)展。而且在這一點(diǎn)上它相比較于系統(tǒng)的回溯檢索速度而言紙?bào)w數(shù)據(jù)庫(kù)的速度是遠(yuǎn)遠(yuǎn)不如的。但是,它也存在著不足,如信息資源標(biāo)引深度過(guò)深、標(biāo)引規(guī)范也非常迥異,檢索工具種類雜亂,這些問(wèn)題都給網(wǎng)絡(luò)用戶的使用中造成了很大的不便。
2.2 學(xué)生網(wǎng)絡(luò)搜索存在不便
網(wǎng)絡(luò)上現(xiàn)有各類的專業(yè)性強(qiáng)的檢索查詢工具和對(duì)應(yīng)的軟件以及各種各樣的搜索引擎,這部分的搜索引擎都有著自己的優(yōu)勢(shì)和獨(dú)特之處,但正因?yàn)槿绱烁黝惖囊娌僮鞯牟襟E不同,而造成了學(xué)生覺(jué)得使用這些工具非常的繁瑣的感覺(jué),進(jìn)而不愿意去使用它們。再因?yàn)榫W(wǎng)絡(luò)上的信息資源量非常大、類別雜亂、組織分散,學(xué)生又普遍缺乏網(wǎng)絡(luò)檢索知識(shí)和技巧,所以在上網(wǎng)檢索信息時(shí),很多人經(jīng)常會(huì)發(fā)生兩個(gè)極端的情況。一是搜索出上千條信息,二是一條信息都沒(méi)有。網(wǎng)絡(luò)環(huán)境下學(xué)生的搜索的技能需要努力加強(qiáng)。
2.3教學(xué)大綱更新過(guò)慢
很多的高校在傳授信息檢索時(shí)上傳授的主要教學(xué)內(nèi)容非常的單一、落后,更新的速度也很慢。就算有時(shí)修改更新了,其內(nèi)容調(diào)整的力度也很不足。在實(shí)踐網(wǎng)絡(luò)信息檢索的教學(xué)中顯然滿足不了當(dāng)前學(xué)生的需要。而且理論或?qū)嶋H操作課程現(xiàn)在都無(wú)法對(duì)使用網(wǎng)絡(luò)的信息用戶的最基本主要的需求進(jìn)行滿足。也無(wú)法確保學(xué)生們能夠掌握好網(wǎng)絡(luò)信息檢索的實(shí)際操作。甚至不能讓學(xué)生對(duì)搜索引擎的網(wǎng)上信息檢索技術(shù)有個(gè)全面的認(rèn)識(shí)。
2.4 教材內(nèi)容單薄、老化
國(guó)內(nèi)的教學(xué)中以手工方式進(jìn)行檢索為教學(xué)的主要內(nèi)容的學(xué)校普遍存在,許多的計(jì)算機(jī)檢索知識(shí)很落后,其他相關(guān)的網(wǎng)絡(luò)信息檢索的教材種類整體上很貧乏。現(xiàn)有的教學(xué)材料來(lái)看,這部分的教材內(nèi)容上在Intemet基本概念[1]、主要功能及對(duì)各網(wǎng)絡(luò)資源的介紹上比例較多,但在關(guān)于網(wǎng)絡(luò)信息檢索的工具、技巧和實(shí)際操作等內(nèi)容上比重就顯得相對(duì)較少。所以在Internet信息資源的變化迅速和飛快的發(fā)展的需求,改善教學(xué)材料的內(nèi)容的形式也更加的急迫。
2.5 機(jī)檢實(shí)戰(zhàn)經(jīng)驗(yàn)非常不足
現(xiàn)在很多的高校資金不足使得許多設(shè)備沒(méi)有辦法購(gòu)買,學(xué)生們只好一批一批的使用計(jì)算機(jī),有時(shí)還會(huì)重復(fù)操作老師在課堂上教過(guò)的相關(guān)內(nèi)容。使用計(jì)算機(jī)的時(shí)間也常常就只有兩三個(gè)課時(shí)罷了,這很大程度上不能滿足學(xué)生對(duì)網(wǎng)絡(luò)這塊知識(shí)學(xué)習(xí)的需要,更不能根據(jù)學(xué)生已有的問(wèn)題針對(duì)性的進(jìn)行指導(dǎo)和糾正。部分學(xué)校只是進(jìn)行演示,甚至有的學(xué)校因?yàn)闂l件的限制根本不進(jìn)行演示。有演示的學(xué)校他們的實(shí)習(xí)也如蜻蜓點(diǎn)水般點(diǎn)到為止式的教學(xué),這根本取得不了有效的上課成效。
2.6 師資設(shè)備貧乏
信息檢索課程他與其他的課程密不可分,他們既有聯(lián)系又有分工。老師們?cè)趯W(xué)習(xí)有關(guān)學(xué)科的專業(yè)知識(shí)和網(wǎng)絡(luò)操作的基礎(chǔ)上還要不斷更新自己的專業(yè)素質(zhì)。很多學(xué)校的一些老師都是由圖書館或其他科目的老師兼職性的擔(dān)任,他們的專業(yè)知識(shí)不夠,而且缺乏合理的知識(shí)結(jié)構(gòu)。一些甚至沒(méi)有進(jìn)行過(guò)相關(guān)的專業(yè)系統(tǒng)的學(xué)習(xí)培訓(xùn),輕易草率的就開始進(jìn)行教學(xué),而且那些教師沒(méi)花很多的精力到傳授知識(shí)上及教學(xué)研究中去。這樣的現(xiàn)狀慢慢的發(fā)展一定會(huì)影響到將來(lái)的教學(xué)質(zhì)量。
3 信息檢索教學(xué)改革設(shè)計(jì)
3.1 制訂符合時(shí)展的教學(xué)大綱
指導(dǎo)文件是教學(xué)的主體大綱[2],也是不能缺少的教學(xué)行為依據(jù)。它對(duì)教學(xué)的廣度、深度及教學(xué)效果有直接的影響。在網(wǎng)絡(luò)的背景下,本來(lái)有的資料在教學(xué)時(shí)是作為主要內(nèi)容來(lái)說(shuō)已經(jīng)不再適用于現(xiàn)在實(shí)際情況的教學(xué)了,只有盡快的制定出統(tǒng)一明確的教學(xué)方向和目標(biāo),才能使信息資料檢索教學(xué)得以規(guī)范化,才能全面的讓教師的教學(xué)思路統(tǒng)一起來(lái)。以達(dá)到預(yù)期的教學(xué)效果、考核標(biāo)準(zhǔn)等。因此,這主要內(nèi)容對(duì)于網(wǎng)絡(luò)信息檢索計(jì)劃學(xué)時(shí)比例偏低。建上網(wǎng)實(shí)踐課學(xué),制定動(dòng)態(tài)教學(xué)大綱。并且應(yīng)適當(dāng)增加至總學(xué)時(shí)的百分之三十以上。那么老師們就可以打破“大綱”束縛,并能隨時(shí)增加一些豐富的內(nèi)容,打破常規(guī)性的教學(xué)模式,使信息檢索教學(xué)更加的生動(dòng)有趣,富有創(chuàng)造性,做到真正適應(yīng)時(shí)展的需求。
3.2 不斷更新教學(xué)講義
努力的融入一些新的內(nèi)容:
(l)網(wǎng)絡(luò)基本知識(shí)。簡(jiǎn)介Internet的作用和各種瀏覽器的操作方法、Internet的信息資源分類和分布情況、Internet的信息檢索原理等等。這是很大的一個(gè)范圍。在傳授中可以根據(jù)一些學(xué)生的具體對(duì)這方面專業(yè)知識(shí)的興趣和需要,針對(duì)性地去指導(dǎo)和教學(xué)。
(2)網(wǎng)絡(luò)搜索工具。重點(diǎn)介紹Internet檢索工具概述、搜索引擎的操作原理、搜索引擎的分類、選擇并使用各種技能等等。比如在查尋網(wǎng)絡(luò)信息時(shí),就需要了解信息源的URL,但查URL的工具常用的有搜索引擎和主題指南這兩類。主題指南和它的主題層次用列表的方式公開信息,讓本來(lái)不明確的信息需求通過(guò)層層列表而清晰起來(lái)。搜索引擎是通過(guò)輸人關(guān)鍵詞進(jìn)行檢索訪問(wèn)的,各類的引擎都是大同小異的,所以要有選擇地介紹幾類。
(3)專業(yè)光盤或鏡像數(shù)據(jù)庫(kù)檢索。說(shuō)明國(guó)內(nèi)外光盤數(shù)據(jù)庫(kù)或鏡像數(shù)據(jù)庫(kù)的檢索功能和操作方法。數(shù)據(jù)庫(kù)的檢索功略,電子版書刊網(wǎng)絡(luò)操作基本程序,和操作數(shù)據(jù)庫(kù)檢索實(shí)例等等。讓那些進(jìn)行了實(shí)例的同學(xué)可以深刻地理解檢索策略的制定、檢索技巧的運(yùn)用。
(4)網(wǎng)絡(luò)信息的檢索。非常仔細(xì)的去講解通過(guò)網(wǎng)絡(luò)在線所獲得的科技報(bào)告。像許多國(guó)家的已申請(qǐng)專利了的用網(wǎng)絡(luò)信息搜索出的文摘和其方法及技術(shù)、專門的檢索技術(shù),和使用各種各樣的搜索引擎搜索出的所有信息的方法和技巧。例如在使用DIALOG和OCLC搜索系統(tǒng)[3]時(shí),應(yīng)該著重講解這些系統(tǒng)在Web方式和Telnet方式下的它們的搜索方法的相似點(diǎn)和不同點(diǎn)在哪。通過(guò)這樣講解不但可以讓學(xué)生了解和認(rèn)識(shí)網(wǎng)絡(luò)信息檢索的基本知識(shí)和原理,還可以為幫助解決學(xué)生們?cè)谑褂镁W(wǎng)絡(luò)時(shí)碰到的問(wèn)題提前做好準(zhǔn)備。
四 信息檢索傳授內(nèi)容與要點(diǎn)改革建議
1、介紹信息檢索知識(shí)與信息資源是教學(xué)基礎(chǔ),訓(xùn)練學(xué)生對(duì)信息的識(shí)別能力
傳授知識(shí)時(shí)使用Powerpoint軟件制作一個(gè)300余張的教學(xué)課件,其內(nèi)容包括講解信息檢索的概念、定義、語(yǔ)言、工具等基本知識(shí)的幻燈片[4]150余張,,關(guān)于搜索引擎的有30多張,關(guān)于網(wǎng)站的有40多張,說(shuō)明常用數(shù)據(jù)庫(kù)的有30多張,同時(shí)以自身主修的專業(yè)為參考依據(jù),篩選出可以檢索出的網(wǎng)站的數(shù)據(jù)庫(kù)。上課時(shí),進(jìn)行一些基本的說(shuō)明。對(duì)部分重點(diǎn)、難點(diǎn)內(nèi)容可以進(jìn)行課堂演示,在課后的時(shí)候還可以通過(guò)網(wǎng)絡(luò)將課件與學(xué)生分享或直接拷貝給學(xué)生。對(duì)三大檢索刊物及各專業(yè)領(lǐng)域的重點(diǎn)數(shù)據(jù)庫(kù),舉例說(shuō)明與講解,讓使學(xué)生對(duì)有關(guān)專業(yè)方面的主要檢索工具做到心中有數(shù)。
2、解析查詢鍛煉學(xué)生搜索能力
如何高效的利用網(wǎng)絡(luò)數(shù)據(jù)移動(dòng)到自我的目的是現(xiàn)在學(xué)生非常關(guān)注和關(guān)心的內(nèi)容。這點(diǎn)可以進(jìn)行分析和講解。對(duì)數(shù)據(jù)庫(kù)的講解,主要分為兩類,一類是中文類(全文和摘要),一類是外文(全文和摘要),可以分開講解。上課時(shí)讓那些對(duì)所教授的內(nèi)容提出不動(dòng)的學(xué)生讓其親自操作一遍,了解其操作的整個(gè)過(guò)程。
利用搜索而得出的結(jié)果來(lái)說(shuō)明詞符、通配符、邏輯運(yùn)算符和其他一些以限定的符號(hào)
3、查全率和查準(zhǔn)率是教學(xué)的難點(diǎn),鍛煉學(xué)生的篩選能力
在傳授的過(guò)程中可以分成下面三個(gè)部分:
(1)選取檢索詞。要注意檢索詞選取的多樣性,檢索詞能反映出信息感念的準(zhǔn)確性和內(nèi)容的全面性。
(2)檢索式的結(jié)構(gòu)。要形成完整的檢索概念,擬定適合的檢索順序,并利用邏輯算符或位置算符進(jìn)行邏輯匹配
(3) 檢索策略修正。在檢索時(shí),要利用獲得的檢索結(jié)果,進(jìn)行檢索策略的修正,從而獲得更加準(zhǔn)確的結(jié)果。在方法上我們可以利用有著后綴代碼的關(guān)鍵字和使用有著前綴的索引達(dá)到限制主體的效果來(lái)應(yīng)對(duì)檢索加過(guò)中記錄數(shù)過(guò)于龐大、無(wú)用信息太多的情況。
五結(jié)論
在現(xiàn)代這是一個(gè)離不開網(wǎng)絡(luò)與檢索的時(shí)代,傳授網(wǎng)絡(luò)教學(xué)的工作人員們只有人不斷地提高自己的專業(yè)水平,努力地更新自己的專業(yè)知識(shí),快速的調(diào)整教學(xué)方式方法。只有這樣才能不被當(dāng)前的迅猛發(fā)展的高新時(shí)代淘汰掉。
作者單位:武漢市第一商業(yè)學(xué)校,湖北 武漢 430022
摘 要:隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,計(jì)算機(jī)技術(shù)也從傳統(tǒng)的單機(jī)運(yùn)行發(fā)展到網(wǎng)絡(luò)、網(wǎng)格化發(fā)展,當(dāng)前計(jì)算機(jī)網(wǎng)絡(luò)發(fā)展模式主要為:客戶端/服務(wù)器, 瀏覽器/服務(wù)器模式,這兩種模式都存在著對(duì)服務(wù)器要求非常高,海量信息調(diào)度、檢索存在著耗時(shí)高等問(wèn)題,而peer-to-peer(P2P)正是針對(duì)此問(wèn)題二提出的分布式計(jì)算模式。此種模式具有存儲(chǔ)內(nèi)容集中、檢索方便、系統(tǒng)組織協(xié)調(diào)能力優(yōu)良等特點(diǎn)。
關(guān)鍵詞:P2P技術(shù);網(wǎng)絡(luò)信息檢索;研究
1 P2P技術(shù)概述
1.1 P2P定義
P2P是Peer-to-Peer(對(duì)等網(wǎng)絡(luò),對(duì)等計(jì)算)的簡(jiǎn)稱,中文譯名為對(duì)等互聯(lián)或者點(diǎn)對(duì)點(diǎn)技術(shù),在P2P網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)被稱為peer(對(duì)等體)。P2P是一種網(wǎng)絡(luò)模型,在這種網(wǎng)絡(luò)中所有的節(jié)點(diǎn)是對(duì)等的(稱為對(duì)等點(diǎn)),各節(jié)點(diǎn)無(wú)主從之分,具有相同的責(zé)任與能力并協(xié)同完成任務(wù)。對(duì)等點(diǎn)之間通過(guò)直接互連共享信息資源、處理器資源、存儲(chǔ)資源甚至高速緩存資源等,無(wú)需依賴集中式服務(wù)器或資源就可完成。
P2P網(wǎng)絡(luò)并不是一種專門的新興技術(shù),而是假設(shè)在互聯(lián)網(wǎng)絡(luò)中的結(jié)構(gòu)基礎(chǔ)。互聯(lián)網(wǎng)最基本的協(xié)議TCP/IP并沒(méi)有客戶機(jī)和服務(wù)器的概念,所有的設(shè)備都是通訊的平等的一端。在十年之前,所有的互聯(lián)網(wǎng)上的系統(tǒng)都同時(shí)具有服務(wù)器和客戶機(jī)的功能。當(dāng)然,后來(lái)發(fā)展的那些架構(gòu)在TCP/IP之上的軟件的確采用了客戶機(jī)/服務(wù)器的結(jié)構(gòu):瀏覽器和Web服務(wù)器,郵件客戶端和郵件服務(wù)器。但是,對(duì)于服務(wù)器來(lái)說(shuō),它們之間仍然是對(duì)等聯(lián)網(wǎng)的。以email為例,互聯(lián)網(wǎng)上并沒(méi)有一個(gè)巨大的、唯一的郵件服務(wù)器來(lái)處理所有的email,而是對(duì)等聯(lián)網(wǎng)的郵件服務(wù)器相互協(xié)作把email傳送到相應(yīng)的服務(wù)器上去。另外用戶之間email則一直對(duì)等的聯(lián)絡(luò)渠道。
1.2 P2P發(fā)展的影響
由于各種信息資源的發(fā)展和不斷壯大,通過(guò)共享資源的方式來(lái)提升數(shù)據(jù)的傳送、文件共享的功能要求將會(huì)越來(lái)越高,而當(dāng)前的應(yīng)用系統(tǒng)采用的方式大都是用服務(wù)器共享的方式,這已經(jīng)開始嚴(yán)重制約著信息傳遞的數(shù)據(jù),因而P2P作為一種新的共享方式出現(xiàn),成為了時(shí)代的寵兒,它為文件共享、分布式計(jì)算機(jī)和信息交流提供了一種更加靈活和高效的模式,也為信息安全帶來(lái)了新的挑戰(zhàn)。
2 基于P2P技術(shù)的網(wǎng)絡(luò)信息檢索
2.1 基于P2P技術(shù)的網(wǎng)絡(luò)信息檢索的提出
傳統(tǒng)的信息檢索基于C/S模式,在該模式中,數(shù)據(jù)的分發(fā)采用專門的服務(wù)器,多個(gè)客戶端都從此服務(wù)器獲取數(shù)據(jù)。這種模式的優(yōu)點(diǎn)是:數(shù)據(jù)的一致性容易控制,系統(tǒng)也容易管理,但這種模式對(duì)于大規(guī)模網(wǎng)絡(luò)的環(huán)境容易造成性能瓶頸。在網(wǎng)絡(luò)邊緣信息不斷豐富的今天,我們必須在互聯(lián)網(wǎng)上設(shè)置擁有強(qiáng)大處理能力和高寬帶的高性能計(jì)算機(jī),配合高檔的服務(wù)器軟件,再將大量的數(shù)據(jù)集中存放在上面。這種架構(gòu)使我們對(duì)服務(wù)端的投入巨大,因此服務(wù)器的個(gè)數(shù)只能是有限的,這就使系統(tǒng)容易出現(xiàn)單一失效點(diǎn)。同時(shí)C/S模式使得互聯(lián)網(wǎng)中無(wú)論是信息還是資源均向同一方向集中,它的網(wǎng)絡(luò)優(yōu)勢(shì)往往被局限于企業(yè)內(nèi)部,制約了企業(yè)間的信息交流,而且網(wǎng)絡(luò)安全性較差也是一個(gè)不容忽視的問(wèn)題。從目前公布的數(shù)據(jù)來(lái)看,容量最大的搜索引擎也不過(guò)是抓取了整個(gè)網(wǎng)頁(yè)數(shù)量的40%左右。傳統(tǒng)的集中式引擎無(wú)法勝任實(shí)時(shí)性強(qiáng)的海量信息檢索,P2P技術(shù)的蓬勃發(fā)展卻為信息檢索提供了全新的思路。在P2P網(wǎng)絡(luò)中,每個(gè)參與網(wǎng)絡(luò)的主機(jī)既是內(nèi)容的消費(fèi)者,又是內(nèi)容的提供者,各個(gè)結(jié)點(diǎn)各自對(duì)自己本機(jī)上存儲(chǔ)的信息做索引,所有信息提供者一起構(gòu)成一個(gè)龐大的分布式數(shù)據(jù)庫(kù)以供檢索,這可以有效解決動(dòng)態(tài)網(wǎng)頁(yè)信息檢索的問(wèn)題,同時(shí)P2P網(wǎng)絡(luò)中的每一個(gè)企業(yè)的信息點(diǎn)都是一個(gè)獨(dú)立的Peer節(jié)點(diǎn),每個(gè)Peer節(jié)點(diǎn)之間進(jìn)行對(duì)等通訊,避免了傳統(tǒng)C/S結(jié)構(gòu)的低效和高成本,數(shù)據(jù)的集中處理又避免了P2P帶來(lái)的數(shù)據(jù)分散。
2.2 基于P2P技術(shù)的網(wǎng)絡(luò)信息檢索的原理
在P2P網(wǎng)絡(luò)中,每個(gè)參與的節(jié)點(diǎn)既是服務(wù)器又是客戶端,既是信息的提供者又是信息的消費(fèi)者。P2P信息檢索的目的就是網(wǎng)絡(luò)中的任意節(jié)點(diǎn)都可以提交檢索的請(qǐng)求,然后這些檢索通過(guò)某種路由機(jī)制被路由到和檢索相關(guān)的節(jié)點(diǎn)上去,存儲(chǔ)有和該檢索相關(guān)信息的節(jié)點(diǎn)將會(huì)回應(yīng)請(qǐng)求,把本地相關(guān)的內(nèi)容以對(duì)等的形式直接傳送到請(qǐng)求節(jié)點(diǎn)上,示意圖見(jiàn)圖1。
圖中的檢索過(guò)程分為以下幾個(gè)階段:
每個(gè)節(jié)點(diǎn)在加入網(wǎng)絡(luò)的時(shí)候,會(huì)對(duì)存儲(chǔ)在本節(jié)點(diǎn)上的內(nèi)容進(jìn)行索引,以滿足本地內(nèi)容檢索的目的。然后按某種預(yù)定的規(guī)則選擇一些節(jié)點(diǎn)作為自己的鄰居,加入到P2P網(wǎng)絡(luò)當(dāng)中。
(1)發(fā)起者P提出檢索請(qǐng)求q,并將q發(fā)送給自己的鄰居。
(2)P的鄰居收到q后,再按照某種策略轉(zhuǎn)發(fā)給它在網(wǎng)絡(luò)中的其它鄰居節(jié)點(diǎn)。這樣,q就在整個(gè)網(wǎng)絡(luò)中傳播開來(lái)。
(3)收到請(qǐng)求q的節(jié)點(diǎn)如果存儲(chǔ)有相應(yīng)內(nèi)容信息,則將對(duì)應(yīng)的內(nèi)容返回。
2.3 基于P2P技術(shù)的網(wǎng)絡(luò)信息檢索的主要分類
P2P檢索主要分成3種類型:結(jié)構(gòu)化的P2P、網(wǎng)絡(luò)的搜索技術(shù)以及針對(duì)這2種類型的改進(jìn)技術(shù)。前出現(xiàn)的P2P系統(tǒng)具備足夠的語(yǔ)義,能夠處理復(fù)雜查詢,以稱為新一代的P2P檢索技術(shù)。
P2P信息檢索主要是要提高交互式作業(yè)方式、用戶透明度,拓寬信息檢索空間、提高信息檢索的準(zhǔn)確性。
2.4 P2P檢索技術(shù)的方法
P2P查詢的關(guān)鍵技術(shù)包含比較廣泛,核心技術(shù)包括索引構(gòu)造技術(shù)、路由策略及查詢優(yōu)化等,下面將分別對(duì)它們進(jìn)行介紹。
2.4.1 索引構(gòu)造技術(shù)
索引構(gòu)造技術(shù)直接影響P2P系統(tǒng)的路由策略以及系統(tǒng)的查詢效率,因此,構(gòu)造具有豐富語(yǔ)義和高效的索引對(duì)于P2P系統(tǒng)是非常關(guān)鍵的,一般索引構(gòu)造技術(shù)分成基于模式的索引和實(shí)例索引,模式索引為PDMS所特有,考慮了語(yǔ)義異構(gòu)問(wèn)題。實(shí)例索引包括:①通過(guò)散列將原始數(shù)據(jù)標(biāo)識(shí)符映射到ID集合,再將ID集合映射到負(fù)責(zé)該ID的peer,可以具有多種拓?fù)湫螒B(tài)的散列索引;②把數(shù)據(jù)庫(kù)中B+樹思想在P2P環(huán)境下進(jìn)行擴(kuò)展產(chǎn)生的樹形索引。實(shí)例索引有多種分布方法:本地分布、集中式分布和分布式分布。本地索引中各peer只維持對(duì)自己的數(shù)據(jù)的引用,而不管其他節(jié)點(diǎn)上的數(shù)據(jù)的信息;集中式索引需單個(gè)服務(wù)器上保存許多peer上數(shù)據(jù)的引用,索引是集中的,但數(shù)據(jù)是分布的;分布式索引指向目標(biāo)的指針存放在多個(gè)peer上,可有效分散查詢負(fù)載和索引的存儲(chǔ)負(fù)載,具有更強(qiáng)的健壯性和可擴(kuò)展性。
2.4.2 查詢優(yōu)化
由于P2P網(wǎng)絡(luò)動(dòng)態(tài)的特性,不能假定具備數(shù)據(jù)分布的全局視圖,也不能在這些網(wǎng)絡(luò)中采用靜態(tài)的拓?fù)浜筒樵冇?jì)劃,使得提交的查詢不太可能在整個(gè)查詢處理過(guò)程中都保持原來(lái)的性質(zhì)。為此,對(duì)查詢進(jìn)行優(yōu)化變得非常重要,這樣可以加快查詢執(zhí)行的效率,同時(shí)減少網(wǎng)絡(luò)流量。
2.5 基于P2P技術(shù)的網(wǎng)絡(luò)信息檢索的特點(diǎn)
P2P系統(tǒng)具有自組織性、對(duì)稱性、可擴(kuò)展性以及分布控制等優(yōu)良特性。隨著P2P系統(tǒng)的廣泛應(yīng)用,該系統(tǒng)被認(rèn)為是未來(lái)分布式計(jì)算的關(guān)鍵技術(shù),可以應(yīng)用于數(shù)據(jù)共享、CPU周期共享、及時(shí)信息傳輸以及協(xié)同工作組件等方面,同時(shí)在搜索引擎、數(shù)據(jù)流管理、語(yǔ)義網(wǎng)、協(xié)作信息過(guò)濾等領(lǐng)域具有廣闊的應(yīng)用前景。對(duì)P2P的研究主要集中在搜索、存儲(chǔ)、安全和應(yīng)用4個(gè)方面,而搜索是P2P技術(shù)的核心。
P2P信息檢索通過(guò)分布式存儲(chǔ)和處理能力為大范圍的Web文件搜索提供可能,傳統(tǒng)式的搜索引擎對(duì)于數(shù)據(jù)的更新緩慢不能滿足用戶實(shí)時(shí)性要求。受網(wǎng)絡(luò)爬蟲采集信息能力的限制,傳統(tǒng)的搜索引擎很難進(jìn)行深度采集深層次的網(wǎng)頁(yè)信息。與傳統(tǒng)的檢索技術(shù)相比較,基于P2P信息檢索技術(shù)有以下優(yōu)點(diǎn):(1)P2P信息檢索充分利用以大規(guī)模分布形式存在的信息。(2)彌補(bǔ)傳統(tǒng)搜索引擎無(wú)力深度挖掘網(wǎng)站信息的弱點(diǎn)。(3)挖掘移動(dòng)終端的信息。(4)構(gòu)建人性化的信息終端。
傳統(tǒng)的信息檢索,必須借助網(wǎng)絡(luò)檢索工具Internet上的信息極其豐富,這些信息分布在全世界不同的計(jì)算機(jī)主機(jī)上,基于超文本結(jié)構(gòu)在Internet上,基于WWW的信息組織采用了超文本方式。基于P2P技術(shù)的信息檢索技術(shù)以人為本的理念使客戶使用起來(lái)更加方便、容易,檢索的更加徹底和透明。未來(lái)的P2P檢索技術(shù)主要是和3G技術(shù),移動(dòng)智能技術(shù)結(jié)合起來(lái),使用戶深切感受到21世紀(jì)網(wǎng)絡(luò)時(shí)代的方便。
3 基于P2P技術(shù)的研究
3.1 基于P2P的網(wǎng)絡(luò)信息資源的檢索-搜索引擎的研究
3.1.1 Caching技術(shù)
在對(duì)等網(wǎng)絡(luò)中,索引信息的擴(kuò)散是通過(guò)查詢來(lái)驅(qū)動(dòng)的,成功的查詢結(jié)果被緩存下來(lái),使得索引信息可以再網(wǎng)絡(luò)擴(kuò)散開來(lái)。資源搜索效率可否再次成百倍地提高,即在用戶未提出問(wèn)題時(shí)就為他準(zhǔn)備好答案,Caching技術(shù)可以使資源效率達(dá)到10-100。盡管網(wǎng)絡(luò)資源無(wú)限爆炸,但每一個(gè)成員及其每一次查詢,所涉及到的回答域都是有限的,并且基本保持固定不變,這就是局部性原理。計(jì)算機(jī)體系結(jié)構(gòu)中關(guān)鍵技術(shù)指令和數(shù)據(jù)在不久的將來(lái)可能被再次訪問(wèn),即下一程序指令在前條指令的概率非常大,因此,實(shí)踐局部性往往會(huì)引起對(duì)最近使用區(qū)域的集中訪問(wèn);空間局部性指的是一個(gè)進(jìn)程訪問(wèn)的各項(xiàng)進(jìn)程彼此很近,即下一次程序指令在前條指令附近的概率非常大。前者就是程序Cache,后者就是數(shù)據(jù)Cache的理論依據(jù)。
3.1.2 分布式的Gnutella搜索機(jī)制
在Gnutella中,每個(gè)節(jié)點(diǎn)共享一些文件,并提供基于文件名的本地查詢操作。它使用消費(fèi)洪泛的方式搜索其他節(jié)點(diǎn)上的文件。發(fā)起搜索操作的節(jié)點(diǎn)向所有鄰居節(jié)點(diǎn)發(fā)送Query消息,而接到Query消息的節(jié)點(diǎn)進(jìn)行本地查詢,并把查詢進(jìn)一步轉(zhuǎn)發(fā)給自己的所有鄰居。為避免無(wú)窮遞歸,每個(gè)搜索消息都有一個(gè)TTL域,它隨著轉(zhuǎn)發(fā)的進(jìn)行而遞減,TTL為零的消息則不再被轉(zhuǎn)發(fā)。每個(gè)請(qǐng)求都有一個(gè)準(zhǔn)一的標(biāo)識(shí)號(hào)。已收到請(qǐng)求的節(jié)點(diǎn)如發(fā)現(xiàn)已處理過(guò),則丟棄該請(qǐng)求。
Gnutella的搜索機(jī)制可以看出,個(gè)別節(jié)點(diǎn)失效對(duì)查詢結(jié)果影響較小,能動(dòng)態(tài)適應(yīng)網(wǎng)絡(luò)拓?fù)渥兓试S節(jié)點(diǎn)動(dòng)態(tài)加入或退出。
4 結(jié)束語(yǔ)
基于P2P對(duì)等檢索技術(shù)的發(fā)展將會(huì)為互聯(lián)網(wǎng)信息搜索技術(shù)提供出了全新的解決方案,它讓Internet上的共享方式提升到了一個(gè)新的水平,讓人們能夠以更方便、快捷的方式參與到網(wǎng)絡(luò)交互中去,讓人們能夠更好的體驗(yàn)到數(shù)據(jù)共享、數(shù)據(jù)應(yīng)用。
【摘 要】隨著信息技術(shù)、計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,圖書館正在經(jīng)歷前所未有的偉大變革。在人們逐漸告別了手工檢索,實(shí)現(xiàn)圖書館自動(dòng)化的同時(shí),也渴望著圖書館能真正打破時(shí)空的界限,館藏資源實(shí)現(xiàn)數(shù)字化,正是由于社會(huì)的需求,數(shù)字圖書館應(yīng)運(yùn)而生并且迅速發(fā)展起來(lái)。本文主要探討網(wǎng)絡(luò)環(huán)境下高校數(shù)字圖書館的信息檢索。
【關(guān)鍵詞】網(wǎng)絡(luò)環(huán)境 數(shù)字圖書館 信息檢索
數(shù)字圖書館提供的信息資源主要包括電子圖書、電子期刊、電子報(bào)紙、電子參考工具書與百科全書、OPAC、數(shù)據(jù)庫(kù)、音像資料等。數(shù)字化圖書館必須具備三個(gè)基本要素:數(shù)字化資源、網(wǎng)絡(luò)化存取和分布式管理。數(shù)字化資源是數(shù)字圖書館的“物質(zhì)”基礎(chǔ)。高速的數(shù)字通信網(wǎng)絡(luò)是數(shù)字圖書館的存在手段。分布式管理是數(shù)字圖書館發(fā)展的高級(jí)階段,全世界的數(shù)字圖書館只要遵循統(tǒng)一的訪問(wèn)協(xié)議,就可以實(shí)現(xiàn)資源共享[1]。
1高校數(shù)字圖書館的特點(diǎn)
1.1信息資源數(shù)字化
自動(dòng)化圖書館與數(shù)字化圖書館最大的區(qū)別就在于前者只是實(shí)現(xiàn)了典藏、借閱等流程的機(jī)械化、自動(dòng)化,而數(shù)字化圖書館是實(shí)現(xiàn)了文獻(xiàn)內(nèi)容的數(shù)字化。數(shù)字圖書館的文獻(xiàn)內(nèi)容包括已有的館藏文獻(xiàn)、商用電子資源、自建資源、互聯(lián)網(wǎng)免費(fèi)資源,在文獻(xiàn)的級(jí)次上包括一次文獻(xiàn)、二次文獻(xiàn)、三次文獻(xiàn)。館藏資源數(shù)字化一方面對(duì)文獻(xiàn)起到了保護(hù)作用,特別是對(duì)于古籍善本和歷史珍貴文獻(xiàn)的保護(hù)更具有深遠(yuǎn)的意義;另一方面也方便讀者檢索、瀏覽,不必考慮復(fù)本量。
1.2信息傳遞網(wǎng)絡(luò)化
網(wǎng)絡(luò)和信息技術(shù)的發(fā)展使數(shù)字圖書館超越了時(shí)空觀念。通過(guò)網(wǎng)絡(luò),讀者可以在任何時(shí)間、任何地點(diǎn)訪問(wèn)數(shù)字圖書館,而不必考慮開館時(shí)間和地理位置的不便,從而大大縮短了信息傳遞時(shí)間,也加快了信息交流與反饋的速度。通過(guò)網(wǎng)絡(luò)將各個(gè)圖書館及信息服務(wù)中心連接起來(lái),極大的促進(jìn)了資源共享。
1.3廣泛的可存取性
廣泛的可存取性包括兩層含義:一是信息資源來(lái)自世界各地的研究機(jī)構(gòu)、大學(xué)、企業(yè)、團(tuán)體和個(gè)人;二是讀者可以隨時(shí)獲得所需信息資源,從而實(shí)現(xiàn)“信息存取自由化”。
1.4信息資源共享
由于出版物的增多,圖書館經(jīng)費(fèi)的緊張,任何圖書館都無(wú)法全部收藏所有的出版物,數(shù)字圖書館的出現(xiàn)給資源共享提供了良好的基礎(chǔ)平臺(tái),極大地提高了廣大社會(huì)公眾對(duì)文獻(xiàn)信息資源的可獲得性[2]。
2網(wǎng)絡(luò)環(huán)境下高校數(shù)字圖書館信息檢索
許多高校圖書館,在數(shù)字化方面,也做了大膽嘗試,比如很多高校都購(gòu)買《中國(guó)學(xué)術(shù)期刊》網(wǎng)絡(luò)版數(shù)據(jù),建立在校園網(wǎng)中可以自由閱讀的封閉式鏡像站點(diǎn);也有許多高校購(gòu)買超星或書生的數(shù)據(jù)庫(kù),建立自己的數(shù)字圖書館鏡像站點(diǎn)。高校數(shù)字圖書館大多包含以下幾個(gè)方面的內(nèi)容:館藏資源檢索、網(wǎng)上圖書、網(wǎng)上期刊等等。
2.1網(wǎng)上館藏資源檢索
所謂網(wǎng)絡(luò)圖書檢索一般是指把實(shí)體圖書館的館藏資源以書目信息數(shù)據(jù)庫(kù)的形式錄入到計(jì)算機(jī)中,并在Internet上,允許所有或特定的網(wǎng)絡(luò)用戶對(duì)館藏書籍按照一定的方法進(jìn)行檢索。由于把書籍全文全部轉(zhuǎn)錄成為數(shù)字形式存在一些具體問(wèn)題,包括要解決圖文混排及文章特殊要求、作者著作版權(quán)、工作量以及是否確實(shí)需要等問(wèn)題,目前大部分網(wǎng)絡(luò)圖書檢索一般只限于書目、作者、摘要、出版社等基本信息,原書仍在圖書館。因此,館藏資源檢索就是檢索圖書書目信息,對(duì)讀者了解館藏有很大幫助。網(wǎng)絡(luò)圖書檢索一般比較簡(jiǎn)單,國(guó)內(nèi)外的圖書檢索系統(tǒng)差別不大,一般都可以使用www方式和Telnet方式進(jìn)行免費(fèi)訪問(wèn)和檢索。使用Telnet方式一般需要授權(quán),但大部分訪問(wèn)者仍可以使用一些公共賬號(hào)(如public)進(jìn)行登錄。高校圖書館館藏資源檢索系統(tǒng)一般都有圖書檢索功能、新書通報(bào)、圖書催還、讀者借閱情況查詢、網(wǎng)上預(yù)約和網(wǎng)上續(xù)借,一般還有圖書館的服務(wù)簡(jiǎn)介、規(guī)章制度、開館時(shí)間等等,是讀者利用圖書館的好幫手。使用圖書檢索,讀者可以看到要查找的圖書的排架號(hào),按照排架號(hào)去圖書館書架上找書,并且可以看到該書的借閱情況:是在編、在架還是借出;一般在辦理借書證時(shí)圖書館都要給讀者一個(gè)初始密碼,讀者可以自己修改密碼,在查詢自己的借閱情況和網(wǎng)上預(yù)約、網(wǎng)上續(xù)借時(shí),需使用該密碼[3]。
2.2網(wǎng)上圖書
目前,網(wǎng)上有許多數(shù)字圖書館或網(wǎng)上書屋,讀者在網(wǎng)上可免費(fèi)閱讀或下載圖書。比較大的網(wǎng)上圖書館有書生數(shù)字圖書館、超星數(shù)字圖書館、黃金書屋等等。許多高校根據(jù)專業(yè)設(shè)置,購(gòu)買電子圖書數(shù)據(jù)和專用設(shè)備,建立數(shù)字圖書館鏡像站點(diǎn)。下面,我們以書生數(shù)字圖書館為例,介紹網(wǎng)上圖書的查詢、閱讀方法。北京書生科技有限公司是一家以技術(shù)起家的典型IT公司,主要業(yè)務(wù)是數(shù)字化信息加工和經(jīng)營(yíng),依靠先進(jìn)的硬件設(shè)備和技術(shù),將圖書、報(bào)刊等傳統(tǒng)出版物數(shù)字化[4]。
2.3網(wǎng)上期刊
《中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)》是目前國(guó)內(nèi)最大的連續(xù)動(dòng)態(tài)更新的中國(guó)期刊全文數(shù)據(jù)庫(kù),累積全文文獻(xiàn)近千萬(wàn)篇,分9大專輯,126個(gè)專題文獻(xiàn)數(shù)據(jù)庫(kù)。另外,還有重慶維普期刊全文數(shù)據(jù)庫(kù),也可查看中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)。下面我們以《中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)》為例,介紹網(wǎng)上期刊查閱方法。用戶在登錄界面中輸人登錄用戶名和密碼后,即進(jìn)入檢索主界面,系統(tǒng)默認(rèn)登錄進(jìn)入初級(jí)檢索系統(tǒng),在初級(jí)檢索界面中,點(diǎn)擊高級(jí)檢索鏈接就可以進(jìn)入高級(jí)檢索界面。網(wǎng)絡(luò)信息檢索工具是指在因特網(wǎng)上提供信息檢索服務(wù)的計(jì)算機(jī)系統(tǒng),其檢索的對(duì)象是存在于因特網(wǎng)信息空間中各種類型的網(wǎng)絡(luò)信息資源。較為典型的傳統(tǒng)信息查詢工具有Gopher、Archie、WAIS等,它們分別可以查詢Gopher資源、FIP資源和WAIS資源。還包括目前發(fā)展最為迅速、最受人們歡迎的信息檢索工具——WWW(即萬(wàn)維網(wǎng))上的檢索工具。
結(jié)論
為了迎接新技術(shù)革命的挑戰(zhàn),迎接信息社會(huì)和知識(shí)經(jīng)濟(jì)時(shí)代的到來(lái),高等教育必須要培養(yǎng)出具有較強(qiáng)的知識(shí)信息意識(shí)、較高的自學(xué)能力和獨(dú)立研究問(wèn)題能力的高素質(zhì)人才,以適應(yīng)社會(huì)發(fā)展的需要。在高等學(xué)校中,圖書館和教師、實(shí)驗(yàn)室一起并列為辦學(xué)的“三大支柱”。教師在教學(xué)中起主導(dǎo)作用,這種主導(dǎo)作用不僅體現(xiàn)在傳授基本理論、基礎(chǔ)知識(shí)和基本技能方面,更重要的是啟發(fā)引導(dǎo)學(xué)生學(xué)會(huì)獨(dú)立自學(xué)方法,掌握獲取知識(shí)的技能。通過(guò)對(duì)網(wǎng)絡(luò)環(huán)境下高校圖書館信息檢索進(jìn)行分析,有利于大學(xué)生能夠更好地運(yùn)用圖書館學(xué)習(xí)知識(shí),掌握知識(shí)。
【摘 要】本文主要對(duì)網(wǎng)絡(luò)信息檢索進(jìn)行論述。
【關(guān)鍵詞】網(wǎng)絡(luò)信息;檢索
隨著信息技術(shù)的高速發(fā)展,信息資源的越來(lái)越顯得重要,而網(wǎng)絡(luò)信息資源也逐步成為這個(gè)信息時(shí)代的核心資源。信息檢索技術(shù)也很快得到發(fā)展,在此網(wǎng)絡(luò)信息檢索隨著網(wǎng)絡(luò)的發(fā)展也應(yīng)運(yùn)而生。網(wǎng)絡(luò)信息檢索,就是將描述特定用戶所需網(wǎng)絡(luò)信息的提問(wèn)特征,與信息儲(chǔ)存的檢索標(biāo)識(shí)進(jìn)行異同比較,從中找出與提問(wèn)一致或基本一致的網(wǎng)絡(luò)信息的過(guò)程。相對(duì)傳統(tǒng)文獻(xiàn)檢索,網(wǎng)絡(luò)信息檢索顯現(xiàn)出了很多的優(yōu)越性,如不受時(shí)間地點(diǎn)的限制,檢索方式多樣化,多元化等。但是我覺(jué)得網(wǎng)絡(luò)信息檢索的發(fā)展還不是十分完善,仍存在些問(wèn)題,如目前檢索工具在信息搜集缺乏統(tǒng)一的規(guī)范管理,檢索過(guò)程會(huì)出現(xiàn)很多雷同,甚至無(wú)用的垃圾信息等。以下從網(wǎng)絡(luò)信息檢索目前存在的問(wèn)題,及針對(duì)問(wèn)題面臨的以后的發(fā)展方向進(jìn)行了探討。
隨著網(wǎng)上信息資源的膨脹發(fā)展,一種搜索引擎,無(wú)論它多么完善都不可能滿足一個(gè)人所有的檢索需求。如果遇到文獻(xiàn)普查、專題查詢、新聞?wù){(diào)查與溯源、軟件及MP3下載地址搜索等情況,人們就更需要使用多種搜索引擎來(lái)比較、篩選和相互印證。為解決逐一登陸各搜索引擎,在各搜索引擎中分別多次輸入同一檢索請(qǐng)求等煩瑣操作,基于網(wǎng)絡(luò)檢索工具的檢索工具產(chǎn)生了。
目前這列檢索工具只要有兩種:集成搜索引擎和元搜索引擎。所謂集成搜索引擎是在一個(gè)檢索界面上鏈接若干種獨(dú)立的搜索引擎,檢索時(shí),一次檢索輸入,可以指定搜索引擎也可以要求多個(gè)引擎同時(shí)檢索,搜索結(jié)果由各搜索引擎分別以不同頁(yè)面提交的網(wǎng)絡(luò)檢索工具,其實(shí)是利用網(wǎng)站鏈接技術(shù)形成的搜索引擎集合。集成搜索引擎制作與維護(hù)技術(shù)簡(jiǎn)單,可隨時(shí)對(duì)所鏈接的搜索引擎進(jìn)行增刪調(diào)整和及時(shí)更新,尤其大規(guī)模專業(yè)搜索引擎集成鏈接,深受特定用戶群歡迎。如國(guó)內(nèi)天網(wǎng)搜霸和百度搜霸,國(guó)外比較著名的有“搜索之家” “網(wǎng)際瑞士軍刀”等。
另一個(gè)是元搜索引擎,用戶只需遞交一次檢索請(qǐng)求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將所有查詢結(jié)果集中起來(lái)以整體統(tǒng)一的格式呈現(xiàn)到用戶面前。國(guó)外比較著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前國(guó)內(nèi)現(xiàn)在還沒(méi)有見(jiàn)到真正意義上的元搜索引擎。元搜索引擎雖沒(méi)有網(wǎng)頁(yè)搜尋機(jī)制,亦無(wú)獨(dú)立的索引數(shù)據(jù)庫(kù),但在檢索請(qǐng)求提交、檢索接口和檢索結(jié)果顯示等方面,均有自己研發(fā)的特色元搜索技術(shù)支持。目前元搜索引擎技術(shù)主要有并行處理式和串行處理式兩大類。并行式元搜索引擎運(yùn)行時(shí)是將查詢請(qǐng)求同時(shí)發(fā)向各個(gè)獨(dú)立搜索引擎,然后將的結(jié)果按特定的順序呈現(xiàn)給用戶;串行式元搜索引擎運(yùn)行時(shí)是將查詢請(qǐng)求先發(fā)向某個(gè)獨(dú)立搜索引擎,待其返回結(jié)果后再將請(qǐng)求發(fā)往另一個(gè)獨(dú)立搜索引擎。
從第一個(gè)元搜索引擎Metacrawler誕生至今,這一新型的網(wǎng)絡(luò)檢索工具異軍突起,發(fā)展迅速,目前可用的元搜索引擎已近百種。由于元搜索引擎的功能受著源搜索引擎和元搜索技術(shù)的雙重制約,元搜索引擎比較理想的并不多見(jiàn)。信息檢索專家邢志宇將元搜索引擎存在的問(wèn)題歸納如下:(1)大多元搜索引擎不支持多語(yǔ)種,尤其是漢語(yǔ)檢索;(2)一些元搜索引擎實(shí)現(xiàn)檢索語(yǔ)法轉(zhuǎn)換的能力有限,不支持指定字段檢索,不能充分發(fā)揮各個(gè)獨(dú)立搜索引擎的高級(jí)檢索功能;(3)部分元搜索引擎無(wú)源搜索引擎列表,用戶不能自主選擇和調(diào)用源搜索引擎;(4)大部分元搜索引擎僅支持調(diào)用AltaVista、Excite、、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人為地限制了搜索資源的利用;(5)在檢索結(jié)果上,元搜索引擎只能返回十幾、數(shù)十條“相關(guān)度”較高的結(jié)果,大量可能有價(jià)值的源搜索引擎的檢索結(jié)果被忽視,影響檢索結(jié)果的全面性。
Internet的發(fā)展使信息采集、傳播和利用無(wú)論是從規(guī)模還是速度都達(dá)到了空前的水平。我覺(jué)得未來(lái)網(wǎng)絡(luò)信息檢索技術(shù)的發(fā)展方向如下:
1.智能化
現(xiàn)有的檢索引擎存在著查全率和查準(zhǔn)率低的問(wèn)題,未來(lái)的搜索引擎技術(shù)必須具有能及時(shí)挖掘新信息和及時(shí)能鏈接新增的信息,多途徑檢索功能,用戶可以交互式檢索,搜索出滿意的信息。提高網(wǎng)絡(luò)信息檢索技術(shù)水平并實(shí)現(xiàn)智能檢索,智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢索是基于自然語(yǔ)言的檢索形式,機(jī)器根據(jù)用戶所提供的以自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索,智能檢索技術(shù)就是采用人工智能進(jìn)行信息檢索的技術(shù),它可以模擬人腦的思維方式,分析用戶以自然語(yǔ)言表達(dá)的檢索請(qǐng)求,自動(dòng)形成檢索策略進(jìn)行智能、快速、高效的信息檢索。最近幾年,智能信息檢索作為人工智能的一個(gè)獨(dú)立研究分支得到了迅速發(fā)展,而且目前已有一些搜索引擎支持智能檢索,但智能化程度還不高,這方面還有待進(jìn)一步的發(fā)展。
2.標(biāo)準(zhǔn)化
現(xiàn)在的網(wǎng)站信息瞬息萬(wàn)變,雜亂紛繁,很是需要進(jìn)行分類整理。目前雖然有大量的搜索引擎,但還沒(méi)有一個(gè)統(tǒng)一嚴(yán)格的分類方法來(lái)管理,網(wǎng)絡(luò)信息資源在組織分類上需要制定一個(gè)統(tǒng)一的分類標(biāo)準(zhǔn)。還要規(guī)范網(wǎng)絡(luò)術(shù)語(yǔ),提高資源共享的程度,這樣可以有效保證用戶的檢索效率。
3.個(gè)性化
科技的發(fā)展要以人為本,隨著科學(xué)技術(shù)的發(fā)展,個(gè)性化服務(wù)也將成為網(wǎng)絡(luò)信息檢索的一個(gè)發(fā)展方向。隨著互聯(lián)網(wǎng)的飛速發(fā)展,每個(gè)人的對(duì)信息的需求將不再滿足于標(biāo)準(zhǔn)化、單一化的大眾需求。不同的人需要不同的服務(wù),如殘疾人士對(duì)網(wǎng)絡(luò)信息檢索的要求就要區(qū)別于常人,要是信息檢索能很好的識(shí)別語(yǔ)音檢索就能很有效的滿足他們的信息需求。如何使用戶更方便、快捷地使用各種檢索工具,滿足用戶各種檢索要求,個(gè)性化服務(wù)也會(huì)成為網(wǎng)絡(luò)信息檢索重要的發(fā)展方向。
在這個(gè)知識(shí)大爆炸的時(shí)代,要想從浩如煙海的信息資源中快速準(zhǔn)確地找到自己所需的信息,就需要我們?cè)诓粩嘈畔z索實(shí)踐中總結(jié)及掌握一些檢索技巧。當(dāng)然也需要我們不斷的發(fā)現(xiàn)問(wèn)題,努力解決問(wèn)題。也由衷地希望隨著科技的發(fā)展,網(wǎng)絡(luò)信息檢索技術(shù)越來(lái)越成熟,能給人們帶來(lái)各式各樣的服務(wù),讓我們的生活更加便利。
[摘要]:鑒于現(xiàn)代信息技術(shù)的迅猛發(fā)展,現(xiàn)代人愈來(lái)愈依賴于網(wǎng)絡(luò)來(lái)檢索各類信息。但是,因?yàn)榫W(wǎng)絡(luò)信息資源數(shù)量太多,用戶要想在最短時(shí)間之中得到自身所需信息往往會(huì)極其困難。分析網(wǎng)絡(luò)環(huán)境下信息檢索的常見(jiàn)問(wèn)題,并提出了有針對(duì)性的對(duì)策。
[關(guān)鍵詞]:網(wǎng)絡(luò)環(huán)境 信息 檢索
信息檢索可以從廣義和狹義等兩個(gè)層面進(jìn)行定義。廣義上,信息檢索主要是指把信息依據(jù)某種方式來(lái)進(jìn)行組織與存儲(chǔ),并且依據(jù)用戶之所需查詢到有用信息的整個(gè)過(guò)程,所以又被稱之為信息存儲(chǔ)和檢索。狹義上,信息檢索則是指從存儲(chǔ)的各種信息中查找出有用信息的整個(gè)過(guò)程。自從上個(gè)世紀(jì)末以來(lái),網(wǎng)絡(luò)得到了極大的發(fā)展,人們進(jìn)行信息檢索的平臺(tái)也轉(zhuǎn)移到了網(wǎng)絡(luò)上,網(wǎng)絡(luò)信息檢索已經(jīng)取代了原來(lái)的手工檢索。因此,應(yīng)用網(wǎng)絡(luò)進(jìn)行快速而有效的檢索以得到相應(yīng)的資源,已經(jīng)成為當(dāng)前信息查詢者亟待探討的重要課題。
一、網(wǎng)絡(luò)環(huán)境下信息檢索的常見(jiàn)問(wèn)題
一是網(wǎng)絡(luò)信息過(guò)于泛濫。如今,任何組織與個(gè)人均可通過(guò)網(wǎng)絡(luò)相關(guān)信息,導(dǎo)致網(wǎng)絡(luò)信息量飛速增加,而信息的質(zhì)量與精度則不斷降低,那些龐雜、虛假、冗余及政治反動(dòng)類信息加大了信息的不可確定性,一些網(wǎng)站質(zhì)量不高,且長(zhǎng)時(shí)間不進(jìn)行更新,導(dǎo)致用戶面對(duì)這些信息顯得無(wú)所適從,因而無(wú)法找到所需信息。二是搜索引擎存在不足。雖然搜索引擎能夠發(fā)揮網(wǎng)絡(luò)導(dǎo)航之作用,但是也存在著類目設(shè)計(jì)不規(guī)范,內(nèi)容存在重復(fù)和交叉現(xiàn)象等,而且重復(fù)鏈接信息偏多,查準(zhǔn)率過(guò)低。三是用戶信息意識(shí)不強(qiáng)。盡管網(wǎng)絡(luò)環(huán)境下用戶可運(yùn)用網(wǎng)絡(luò)來(lái)獲得信息,但尚有許多用戶缺乏良好的信息意識(shí),對(duì)于網(wǎng)絡(luò)信息檢索不夠熟悉,難以快速獲取相關(guān)信息。
二、網(wǎng)絡(luò)環(huán)境下強(qiáng)化信息檢索的對(duì)策
(一)通過(guò)提出信息需求以明確檢索目標(biāo)
用戶在檢索前一定要深入分析,明確所要檢索的目標(biāo)信息,這是確定檢索策略的根本措施,也是判斷檢索效率高低之重點(diǎn)。一是要了解所要檢索信息的主體內(nèi)容以及涉及到的學(xué)科范圍,并且明確檢索內(nèi)容及其目的,這是用戶選擇檢索工具的首要步驟。二是確定需要文獻(xiàn)類型、年代和文獻(xiàn)范圍等,在了解清楚以上內(nèi)容之后再來(lái)選擇相應(yīng)的數(shù)據(jù)庫(kù)并開展限定檢索。三是應(yīng)明確查新、查準(zhǔn)以及查全等指標(biāo)性要求。如果想知識(shí)本領(lǐng)域的最新動(dòng)態(tài)和進(jìn)展,就應(yīng)當(dāng)注重“新”;如果要切實(shí)解決研究當(dāng)中的某些具體內(nèi)容,而且不要產(chǎn)生誤查,就應(yīng)當(dāng)注重實(shí)“準(zhǔn)”;如果要了解某領(lǐng)域發(fā)展的整個(gè)過(guò)程,而且期望得到全部相關(guān)文章,就應(yīng)當(dāng)注重“全”。
(二)選用合適的檢索數(shù)據(jù)庫(kù)和檢索工具
目前,網(wǎng)絡(luò)資源的種類相當(dāng)多。每個(gè)檢索系統(tǒng)常常涵蓋了多個(gè)數(shù)據(jù)庫(kù)。在進(jìn)入到系統(tǒng)以后,一般都會(huì)出現(xiàn)分類目錄讓用戶進(jìn)行選擇。比如,中國(guó)知網(wǎng)中就包含了中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)、中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)、中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)、中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù)等大量數(shù)據(jù)庫(kù),而且在每一個(gè)數(shù)據(jù)庫(kù)之下又會(huì)出現(xiàn)不一樣的主題分類。因此,用戶要依據(jù)待查內(nèi)容的范圍以決定選擇哪個(gè)數(shù)據(jù)庫(kù)。至于方向性的信息檢索則可運(yùn)用百度、谷歌等目錄型檢索工具,依據(jù)主題目錄體系之引導(dǎo)來(lái)查詢信息。此外,還可運(yùn)用高等院校圖書館或者其他圖書保存單位的聯(lián)機(jī)性檢索。要查找學(xué)術(shù)性比較強(qiáng)的信息,建議優(yōu)先查找中國(guó)期刊網(wǎng)和人大復(fù)印資料等專題類的數(shù)據(jù)庫(kù)。要查詢事實(shí)數(shù)據(jù)則應(yīng)選擇具有權(quán)威性的官方數(shù)據(jù)庫(kù)。
(三)實(shí)施概念分析以確認(rèn)檢索詞
實(shí)施計(jì)算機(jī)檢索是否能夠得到滿意的成效,一個(gè)關(guān)鍵環(huán)節(jié)就是要選好檢索詞。只要檢索詞分析得當(dāng),就能更好地進(jìn)行選詞和進(jìn)行邏輯上的組配。檢索詞分析主要有:一般概念、隱含概念以及核心概念等不同概念的選取和分析。
(四)合理構(gòu)造信息檢索表達(dá)形式
在構(gòu)造信息檢索表達(dá)形式之時(shí),應(yīng)當(dāng)全面運(yùn)用檢索工具所支持的檢索計(jì)算,允許運(yùn)用檢索標(biāo)識(shí)與各類限定等,這也是實(shí)施有效檢索的重要基礎(chǔ)。信息檢索表達(dá)形式的構(gòu)造內(nèi)容可以分為以下四種,即布爾邏輯計(jì)算符、位置計(jì)算符、字段限定以及截詞檢索計(jì)算符等。
(五)合理地調(diào)整信息檢索方式
在制定明確的檢索方式,并且輸入到檢索系統(tǒng)之后,該系統(tǒng)所檢索出來(lái)的結(jié)果并不是肯定能夠滿足用戶心中所設(shè)想的信息檢索要求,所以,在檢索時(shí)常常應(yīng)當(dāng)依據(jù)預(yù)檢的狀況來(lái)實(shí)施多次判斷和調(diào)節(jié),并且不斷地調(diào)整信息檢索的方向、強(qiáng)度和內(nèi)容等,一直到完全達(dá)到要求為止。其中主要包含了擴(kuò)大信息檢索的范圍以提升查全率,縮小信息檢索的范圍以提升查準(zhǔn)率。
(六)不斷提升廣大用戶的信息素質(zhì)
不管是進(jìn)行手工信息檢索還是實(shí)施網(wǎng)絡(luò)信息檢索,均是由人來(lái)進(jìn)行操作的,因此,其中人的因素往往占據(jù)了支配性的地位,無(wú)論是實(shí)施手工信息檢索,還是開展網(wǎng)絡(luò)信息檢索,均需具備良好的信息素質(zhì)。提升用戶的信息素質(zhì)與思想素質(zhì),這是提升信息檢索能力的重要基礎(chǔ)。知識(shí)、技能與能力等三者均為知識(shí)素質(zhì)的重要體現(xiàn),三者之間是相輔相成的。其中,知識(shí)為基礎(chǔ),而技能則是關(guān)鍵。唯有具備了必要的檢索能力以及相當(dāng)廣博的能力內(nèi)涵,并且具備良好的檢索技能,這樣才能具備較強(qiáng)的信息檢索水平。隨著我國(guó)教育事業(yè)的持續(xù)深化和現(xiàn)代文明的不斷進(jìn)步,現(xiàn)代人知識(shí)能力的提高均為信息能力之提升提供了良好的發(fā)展背景,而技術(shù)之進(jìn)步又為用戶信息素質(zhì)之提升提供了良好的技術(shù)背景。可見(jiàn),在用戶們進(jìn)行持續(xù)不斷的信息學(xué)習(xí)和實(shí)踐之后,必然能夠提升自身的信息素質(zhì),從而更好地進(jìn)行信息檢索。
三、結(jié)束語(yǔ)
當(dāng)前,我們身處信息化時(shí)代,網(wǎng)絡(luò)信息資源已經(jīng)成了現(xiàn)代人日常工作以及生活中無(wú)法缺少的重要資源。筆者堅(jiān)信,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的進(jìn)一步發(fā)展,網(wǎng)絡(luò)環(huán)境下的信息檢索必然會(huì)更加普及。用戶只要具備相應(yīng)的檢索工具以及檢索方法,就能快速在巨量信息中找出需要的查詢結(jié)果,得到相應(yīng)的信息。
摘 要 本文闡述了數(shù)據(jù)挖掘的基本理論,及其在網(wǎng)絡(luò)信息檢索中的應(yīng)用,分析了數(shù)據(jù)挖掘?qū)W(wǎng)絡(luò)信息資源、網(wǎng)絡(luò)信息檢索結(jié)果、用戶檢索需求等方面性能的提升,并對(duì)網(wǎng)絡(luò)信息檢索未來(lái)發(fā)展進(jìn)行了展望。
關(guān)鍵詞 數(shù)據(jù)挖掘 網(wǎng)絡(luò)信息檢索 數(shù)據(jù)挖掘
目前,網(wǎng)絡(luò)信息資源數(shù)據(jù)形式豐富多樣,數(shù)量巨大,并呈幾何級(jí)數(shù)的速度增長(zhǎng),基本滿足了人們的信息檢索的量的需求,然而如何快速、高效地找到自己所需要的信息,網(wǎng)絡(luò)信息檢索在查全率和查準(zhǔn)率上還相對(duì)欠缺。網(wǎng)絡(luò)搜索引擎通常會(huì)返回給用戶成千上萬(wàn)檢索到的網(wǎng)頁(yè),其中大部分與用戶的檢索要求無(wú)關(guān),另外就網(wǎng)絡(luò)上的知識(shí)發(fā)現(xiàn)而言,即使檢索精度再高,搜索引擎也不能夠勝任。因此,人們需要比信息檢索更精確高效的、能包含網(wǎng)絡(luò)數(shù)據(jù)庫(kù)在內(nèi)的新的數(shù)據(jù)挖掘技術(shù),數(shù)據(jù)挖掘正是在這樣的應(yīng)用需求下產(chǎn)生并迅速發(fā)展起來(lái)的。但是,數(shù)據(jù)庫(kù)領(lǐng)域采用的數(shù)據(jù)挖掘技術(shù)所涉及的多是結(jié)構(gòu)化數(shù)據(jù),為了處理網(wǎng)絡(luò)上的異質(zhì)、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)挖掘成為數(shù)據(jù)挖掘研究的一個(gè)重要分支。
1 網(wǎng)絡(luò)信息檢索
網(wǎng)絡(luò)信息檢索一般指因特網(wǎng)檢索,是通過(guò)網(wǎng)絡(luò)接口軟件,用戶可以在一處終端查詢各地上網(wǎng)的信息資源。網(wǎng)絡(luò)信息檢索主要依靠計(jì)算機(jī)科學(xué)技術(shù)、網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)的確切特征來(lái)創(chuàng)建相應(yīng)的索引結(jié)構(gòu)、數(shù)據(jù)庫(kù)等,能很好地處理已經(jīng)發(fā)生或存在的靜態(tài)信息。網(wǎng)絡(luò)信息檢索工具包括傳統(tǒng)的服務(wù)工具:遠(yuǎn)程登錄、文件傳輸服務(wù)、電子郵件、電子公告牌、廣域消息服務(wù)、Gopher、WWW、基于Z39.50的信息檢索服務(wù)、服務(wù)器和NAT,以及搜索引擎和中外著名網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索。這些工具都能有效地組織和檢索海量數(shù)據(jù),但對(duì)數(shù)據(jù)未來(lái)的變化趨勢(shì)等動(dòng)態(tài)信息缺乏有效的統(tǒng)計(jì)和預(yù)測(cè)。
2 數(shù)據(jù)挖掘及Web數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining),即從大量模糊的數(shù)據(jù)中發(fā)現(xiàn)隱含的規(guī)律性內(nèi)容,解決數(shù)據(jù)的應(yīng)用質(zhì)量問(wèn)題的技術(shù),是一種還處于發(fā)展中,已經(jīng)部分投入實(shí)際生產(chǎn)實(shí)踐的技術(shù)框架。
Web數(shù)據(jù)挖掘是從數(shù)據(jù)挖掘技術(shù)發(fā)展而來(lái),簡(jiǎn)單地說(shuō)是將數(shù)據(jù)挖掘技術(shù)應(yīng)用到Web上,也稱為Web挖掘。其技術(shù)性的定義是:Web數(shù)據(jù)挖掘,是一項(xiàng)涉及Web、數(shù)據(jù)挖掘、信息學(xué)、計(jì)算機(jī)語(yǔ)言學(xué)等多個(gè)領(lǐng)域的綜合技術(shù)。Web數(shù)據(jù)挖掘的目的是為了揭示網(wǎng)絡(luò)信息中隱含的知識(shí),它是比信息檢索層次更高、更精確的一種技術(shù)。它能夠根據(jù)用戶個(gè)性化定義的要求,根據(jù)目標(biāo)的特征信息在網(wǎng)絡(luò)上或者數(shù)據(jù)庫(kù)中進(jìn)行有目的的信息檢索。Web數(shù)據(jù)挖掘中幾種常用的技術(shù)是:關(guān)聯(lián)規(guī)則技術(shù)、分類技術(shù)、聚類技術(shù)、路徑分析技術(shù)和序列模式技術(shù)。
3 數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息檢索中的應(yīng)用
目前,作為網(wǎng)絡(luò)信息檢索最重要最常用的工具:搜索引擎,只能處理用戶給出的特定關(guān)鍵詞形式表示的簡(jiǎn)單目標(biāo),而無(wú)法處理用戶給出的樣本形式的復(fù)雜模糊目標(biāo),對(duì)網(wǎng)絡(luò)數(shù)據(jù)未來(lái)的變化趨勢(shì)等動(dòng)態(tài)信息也缺乏有效的統(tǒng)計(jì)和預(yù)測(cè)。而將數(shù)據(jù)挖掘技術(shù)運(yùn)用的網(wǎng)絡(luò)信息檢索中,可以使網(wǎng)絡(luò)信息檢索過(guò)程及結(jié)果更加快速、精確、個(gè)性化。
(1)數(shù)據(jù)挖掘提高網(wǎng)絡(luò)信息內(nèi)容自動(dòng)摘要的準(zhǔn)確率。網(wǎng)絡(luò)信息資源一般都有關(guān)鍵詞和內(nèi)容摘要供用戶檢索選擇之用,但大部分的自動(dòng)摘要都是簡(jiǎn)單的抽取網(wǎng)頁(yè)文檔的前幾句內(nèi)容,而僅僅是通過(guò)位置來(lái)確定的,這種方式很不準(zhǔn)確,不能精確的反映網(wǎng)頁(yè)的全部?jī)?nèi)容,所以保證自動(dòng)摘要的正確性非常重要。數(shù)據(jù)挖掘中的文本抽取就是從文檔中抽出關(guān)鍵信息,對(duì)文檔本身的內(nèi)容而不是位置來(lái)進(jìn)行文本內(nèi)容的總結(jié),以自然語(yǔ)言理解為基礎(chǔ),更可揭示網(wǎng)絡(luò)信息的主題特征知識(shí)及其之間的相互關(guān)聯(lián)知識(shí),對(duì)文檔進(jìn)行語(yǔ)義甚至語(yǔ)用的標(biāo)注,因此它更能反映出Web文檔中的真正信息,然后以簡(jiǎn)單的形式進(jìn)行摘要或表示,可以提煉出文檔最重要的信息生成關(guān)鍵字或摘要,使自動(dòng)摘要的質(zhì)量和準(zhǔn)確性很大的提高。
(2)數(shù)據(jù)挖掘拓寬網(wǎng)絡(luò)信息資源量。網(wǎng)絡(luò)信息資源數(shù)量眾多,分布范圍很廣,大部分可以直接用網(wǎng)絡(luò)信息檢索工具查詢到的信息都是網(wǎng)頁(yè)中的文字、表格、圖形、圖像、聲音、視頻或好友網(wǎng)頁(yè)的鏈接及目錄結(jié)構(gòu)等。但是還有一些潛在網(wǎng)絡(luò)信息不容易被搜索引擎等工具查詢到,如用ASP,JSP或PHP生成的動(dòng)態(tài)網(wǎng)頁(yè);一些專業(yè)數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù);在Robot Exclusion框架協(xié)議下被拒絕搜索訪問(wèn)的網(wǎng)站;由用戶的提問(wèn)而動(dòng)態(tài)生成的結(jié)果;存在于商業(yè)數(shù)據(jù)庫(kù)管理系統(tǒng)中的數(shù)據(jù)等,它們無(wú)法被索引,從而無(wú)法提供有效的檢索方式,這些結(jié)構(gòu)化的或用html標(biāo)記的半結(jié)構(gòu)化數(shù)據(jù)都可以用數(shù)據(jù)挖掘中的內(nèi)容挖掘進(jìn)行處理,網(wǎng)絡(luò)頁(yè)面內(nèi)容挖掘常采用的技術(shù)是文本挖掘和多媒體挖掘,可為這些網(wǎng)絡(luò)信息提供明確的摘要或索引,使得本來(lái)不容易搜索到,潛在隱藏的信息能被明確的搜索到,從而大大拓寬了網(wǎng)絡(luò)信息的資源量。
4 網(wǎng)絡(luò)信息檢索的未來(lái)展望
數(shù)據(jù)挖掘能發(fā)現(xiàn)網(wǎng)絡(luò)中隱含的有價(jià)值的信息和知識(shí),從而提高標(biāo)引、自動(dòng)摘要、自動(dòng)分類和自動(dòng)聚類等的準(zhǔn)確率;能促進(jìn)用戶興趣模型的構(gòu)建,從而為用戶提供更好的個(gè)性化信息服務(wù)。此外,它獨(dú)特的分析方法能發(fā)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)知識(shí)之間的各種關(guān)系,使網(wǎng)站建設(shè)和檢索結(jié)果的分布更加合理。隨著本體、網(wǎng)絡(luò)、自然語(yǔ)言處理、信息可視化和人工智能等技術(shù)的發(fā)展,將數(shù)據(jù)挖掘與這些技術(shù)進(jìn)行結(jié)合,未來(lái)的網(wǎng)絡(luò)信息檢索將朝這更加精準(zhǔn)、個(gè)性和智能化方向發(fā)展。