首頁 > 精品范文 > 數(shù)據(jù)庫論文
時間:2023-03-17 18:06:04
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇數(shù)據(jù)庫論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
【摘要題】實踐研究
1調(diào)查情況介紹
為了配合中國高等教育文獻保障系統(tǒng)(CALIS)“十五”期間的建設(shè)和中國高等學(xué)校數(shù)字圖書館聯(lián)盟(CADLA,下稱聯(lián)盟)工作的開展,2002年4月,CALIS在成員館中間發(fā)放了《數(shù)字圖書館建設(shè)情況調(diào)查表》;2002年5月和6月在聯(lián)盟理事館(注:目前中國高等學(xué)校數(shù)字圖書館聯(lián)盟理事館都是CALIS成員館。)中間發(fā)放了《學(xué)位論文數(shù)據(jù)庫建設(shè)情況調(diào)查表》和《教學(xué)參考書數(shù)據(jù)庫情況調(diào)查表》。
截至2002年6月30日,共回收《數(shù)字圖書館建設(shè)情況調(diào)查表》89份,其中書面報告22份,電子版報告67份。這些調(diào)查報告中有29份來自綜合性院校,34份來自工科院校,9份來自人文社會科學(xué)類院校,來自其他專業(yè)性院校,如醫(yī)學(xué)類院校、農(nóng)林院校和師范類院校的報告分別為5份、4份和6份。圖1給出對提交調(diào)查報告的學(xué)校按地區(qū)進行統(tǒng)計得到的結(jié)果。根據(jù)統(tǒng)計數(shù)字和圖表可以看到,此次在CALIS成員館中進行的數(shù)字圖書館建設(shè)情況調(diào)查具有一定的代表性,比較全面地反映了高校數(shù)字圖書館建設(shè)的整體情況。
圖1提交調(diào)查報告的學(xué)校按地區(qū)統(tǒng)計的結(jié)果
對于在22個聯(lián)盟理事館中間進行的“學(xué)位論文數(shù)據(jù)庫建設(shè)情況”和“教學(xué)參考書數(shù)據(jù)庫情況”重點調(diào)研,各單位均及時對調(diào)查內(nèi)容進行了反饋。
針對上面的三份調(diào)查,本文第二部分從幾個主要方面對各成員館數(shù)字圖書館建設(shè)情況進行了分析總結(jié);第三部分給出CALIS在“十五”期間將要建設(shè)的兩個子項目“高校學(xué)位論文全文數(shù)據(jù)庫”和“教學(xué)參考書數(shù)據(jù)庫”在成員館中間開展的情況;最后對目前成員館數(shù)字圖書館建設(shè)中急需解決的主要問題進行匯總。
2整體分析
通過CALIS的宣傳和培訓(xùn),大部分成員館意識到開展數(shù)字圖書館建設(shè)的必要性和重要性。調(diào)查結(jié)果顯示,在2000年前后成員館根據(jù)各自對數(shù)字圖書館的理解、現(xiàn)有基礎(chǔ)、階段性工作重點、人員情況,開始從專業(yè)性或校園范圍的文獻信息保障體系、數(shù)字圖書館應(yīng)用系統(tǒng)、數(shù)字資源、基礎(chǔ)設(shè)施等各方面進行建設(shè),全面推動圖書館向電子化、數(shù)字化方面發(fā)展,并在資金投入力度方面予以重視。
2.1專業(yè)性、校園范圍的文獻保障體系
眾所周知,CALIS在“九五”期間建設(shè)了三級文獻信息保障體系。四個全國中心、七個地區(qū)中心分別構(gòu)成文獻信息保障體系的第一級和第二級,在全國和地區(qū)范圍內(nèi)行使文獻信息保障功能。但是由于人力、物力、財力的原因,這些中心還不能滿足所有高校圖書館和用戶的全部需要。根據(jù)本次調(diào)查的結(jié)果,目前有10個學(xué)校正在開展專業(yè)性或校園范圍內(nèi)的文獻信息保障系統(tǒng)建設(shè)。其中北京師范大學(xué)圖書館正在構(gòu)造有一定規(guī)模的“中文教育數(shù)字圖書館”,將分布于國內(nèi)外的中文教育資源納入統(tǒng)一的檢索系統(tǒng);上海財經(jīng)大學(xué)圖書館在數(shù)字圖書館理念以及相應(yīng)的管理機制等方面進行了研究與實踐,提出了建設(shè)“財經(jīng)文獻資源信息中心”的設(shè)想;電子科技大學(xué)圖書館“西南地區(qū)電子信息學(xué)科與文獻信息中心”的建設(shè)已具雛形;首都師范大學(xué)圖書館和北京工業(yè)大學(xué)圖書館受北京市教委的委托籌建了“北京高校網(wǎng)絡(luò)圖書館”;內(nèi)蒙古大學(xué)圖書館“多功能蒙古學(xué)文獻信息研制服務(wù)中心”的建設(shè)頗具民族特色;安徽大學(xué)、北京理工大學(xué)、大連海事大學(xué)、福州大學(xué)、哈爾濱工業(yè)大學(xué)的圖書館,依托校園網(wǎng)建立與本校學(xué)科發(fā)展、人才培養(yǎng)相配套的,以信息服務(wù)為重心的全方位、多層次、高效率的文獻信息服務(wù)體系。
2.2數(shù)字圖書館應(yīng)用系統(tǒng)
考慮圖書館的工作特點,針對圖書館的需要,研究和開發(fā)數(shù)字圖書館建設(shè)中急需的各種應(yīng)用系統(tǒng),已經(jīng)被列入各成員館的計劃中。本次調(diào)查發(fā)現(xiàn)有16個圖書館正在應(yīng)用系統(tǒng)方面進行技術(shù)攻關(guān)。其中開展數(shù)字圖書館原型試驗系統(tǒng)研發(fā)的學(xué)校主要有北京大學(xué)、復(fù)旦大學(xué)、西安交通大學(xué)、廈門大學(xué)、中山大學(xué)、武漢大學(xué)等高校的圖書館,這些圖書館研制的內(nèi)容包括數(shù)字圖書館體系結(jié)構(gòu)、元數(shù)據(jù)、信息存儲與檢索、互操作等相關(guān)技術(shù)與解決方案;上海交通大學(xué)、北京大學(xué)、北京航空航天大學(xué)等10余所高校圖書館開發(fā)了“視頻點播系統(tǒng)”,采用大容量存儲設(shè)備存儲多媒體資料在校園網(wǎng)內(nèi)提供多媒體視頻、音頻資料的網(wǎng)上實時點播;復(fù)旦大學(xué)圖書館正在開發(fā)“圖書館電子資源跨平臺檢索系統(tǒng)”,實現(xiàn)統(tǒng)一界面查詢,讀者可以通過書刊名、文章名、關(guān)鍵詞、著者、媒介類型、數(shù)據(jù)來源等檢索項(包括組合檢索項),查詢系統(tǒng)連接的各個數(shù)據(jù)庫;天津大學(xué)、廈門大學(xué)、西北師范大學(xué)等7所高校圖書館專門成立了“特色資源數(shù)字化加工中心”,開展紙本文獻數(shù)字化、多媒體資源加工、電子剪報、數(shù)據(jù)庫制作的相關(guān)硬件環(huán)境設(shè)備建設(shè)及軟件支撐平臺建設(shè),形成數(shù)字化資源的收集、加工、分類標(biāo)引、整合、、更新、維護等的完整系統(tǒng);電子科技大學(xué)圖書館開發(fā)了“專題數(shù)據(jù)庫系統(tǒng)”,為圖書館的數(shù)據(jù)庫建設(shè)提供平臺,包括開發(fā)、分類、全文檢索、遠程查詢、科學(xué)管理和升級等功能,能全面、準(zhǔn)確、高效地達到網(wǎng)絡(luò)化數(shù)據(jù)庫系統(tǒng)的應(yīng)用標(biāo)準(zhǔn);吉林大學(xué)、中國人民大學(xué)圖書館利用相關(guān)技術(shù),建立了標(biāo)準(zhǔn)化的知識服務(wù)系統(tǒng)平臺,開發(fā)了“服務(wù)子系統(tǒng)”,為用戶提供個性化服務(wù),包括信息定制、協(xié)作咨詢、知識挖掘、多媒體教學(xué)、VOD點播、重點學(xué)科導(dǎo)航等;西安交通大學(xué)圖書館正在集中力量,依托CALIS西北地區(qū)中心搭建一個統(tǒng)一的軟硬件平臺,建設(shè)地區(qū)性數(shù)字資源中心、數(shù)字化中心、存儲中心、交換中心以及數(shù)字圖書館研究與開發(fā)中心,為用戶提供集成化的智能服務(wù)。
2.3數(shù)字資源建設(shè)
資源建設(shè)是數(shù)字圖書館建設(shè)的基礎(chǔ),也是各館開展數(shù)字圖書館嘗試的主要選擇。“九五”期間在CALIS的宏觀調(diào)控和統(tǒng)一規(guī)劃下,一方面,各館大幅度增加電子文獻的引進,以網(wǎng)絡(luò)版數(shù)據(jù)庫為主,并引進部分光盤數(shù)據(jù)庫;另一方面,各館在自建資源方面取得了很大的突破,CALIS組織成員館共同建設(shè)了聯(lián)合目錄數(shù)據(jù)庫、中文現(xiàn)刊目次庫、學(xué)位論文文摘庫等數(shù)據(jù)庫。在提交調(diào)查報告的89所圖書館中,85%以上的圖書館參與了CALIS“九五”期間的子項目建設(shè),在支持CALIS資源建設(shè)工作的同時推動本館的數(shù)字化進程,起到了事半功倍的效果。
與此同時,CALIS有選擇性地支持24個單位根據(jù)本館的特色館藏、資源特性,在網(wǎng)絡(luò)環(huán)境下建立特色館藏,逐步把有價值的特色信息資源組織起來,建設(shè)成CALIS重點學(xué)科專題數(shù)據(jù)庫,以便比較集中、更深層次地揭示各高校收集的富有學(xué)科特色的文獻。目前CALIS重點學(xué)科專題數(shù)據(jù)庫包括24家成員館建成的25個重點學(xué)科專題數(shù)據(jù)庫,數(shù)據(jù)量已達280萬條以上,通過因特網(wǎng)進行服務(wù),實現(xiàn)資源共享。
在CALIS的帶動下,在24家成員館的示范作用下,為了更好地滿足本校教學(xué)科研的需要,其他的CALIS成員館紛紛開展本館特色資源的調(diào)研、論證和建設(shè)工作。本次調(diào)查統(tǒng)計結(jié)果顯示,目前正在進行數(shù)據(jù)庫建設(shè)的CALIS成員館有74所,每個館根據(jù)各自的條件和實力,或者百花齊放,如中山大學(xué)、西安交通大學(xué)、上海交通大學(xué)等17所高校圖書館同時進行幾個數(shù)據(jù)庫的建設(shè);或者一支獨秀,在數(shù)據(jù)庫建設(shè)的質(zhì)量上下功夫。
成員館自建的這些數(shù)據(jù)庫圍繞著CALIS制定的“建設(shè)具有中國特色、地區(qū)特色和高等教育特色的專題數(shù)據(jù)庫”的原則,或者對館藏特色文獻數(shù)字化,或者做某個學(xué)科或?qū)n}的數(shù)字資源建設(shè)工作,比較系統(tǒng)全面地對某個專題進行綜合報道。數(shù)據(jù)庫各具特色,有的體現(xiàn)中國文化淵源歷史,有的介紹人物生平、業(yè)績、著作,有的針對某個學(xué)科或?qū)I(yè)做全面的介紹,有的展現(xiàn)科技動態(tài)。數(shù)據(jù)庫形式多樣,包括圖象、文字、解說、全文和文摘,具有學(xué)科知識數(shù)據(jù)庫的特點。揭示的內(nèi)容比普通二次文獻庫要深,豐富了高校資源。數(shù)據(jù)庫內(nèi)容豐富,包含中外文期刊、會議論文、專利文獻、產(chǎn)品、事實數(shù)據(jù)、研究機構(gòu)信息,或集各種信息于一體。有的數(shù)據(jù)庫具備良好的檢索系統(tǒng),提供WEB界面的查詢,有些還使用全文檢索系統(tǒng)和多媒體系統(tǒng),可提供全文、關(guān)鍵詞、題名、出處、文摘等多檢索點檢索;為配合學(xué)校的教學(xué)和科研,為推廣高校科學(xué)技術(shù)成果,展示廣大科研人員的勞動成果和聰明才智,給廣大讀者提供豐富的有價值的科研資料做出了積極的貢獻,彌補了圖書館經(jīng)費緊缺造成的紙本資源的不足,為高校數(shù)字圖書館的工作積累了豐富的經(jīng)驗和技術(shù)。
2.4基礎(chǔ)設(shè)施建設(shè)
基礎(chǔ)設(shè)施建設(shè)是各館進行數(shù)字圖書館建設(shè)的一個重要部分。調(diào)查發(fā)現(xiàn),有28所圖書館正在從基礎(chǔ)設(shè)施建設(shè)入手,創(chuàng)造數(shù)字圖書館的基本環(huán)境。其中22所圖書館對本館的自動化和網(wǎng)絡(luò)系統(tǒng)進行了升級與改造,旨在建立先進可靠的高速信息網(wǎng)絡(luò)系統(tǒng),建設(shè)先進的圖書館集成管理系統(tǒng),實現(xiàn)圖書館日常業(yè)務(wù)科學(xué)全面的自動化管理,為國內(nèi)外資源共享提供環(huán)境;9所學(xué)校建設(shè)了多功能電子閱覽室、多媒體教學(xué)、網(wǎng)絡(luò)培訓(xùn)教室,提升了圖書館的開發(fā)和應(yīng)用能力,為師生提供多媒體信息服務(wù);北京理工大學(xué)、北京化工大學(xué)等4所院校還斥資數(shù)千萬建設(shè)了新館舍,給師生提供了舒適的教學(xué)科研環(huán)境。
2.5資金支持
《數(shù)字圖書館建設(shè)情況調(diào)查表》中還包括對各個學(xué)校用于數(shù)字圖書館建設(shè)的資金額度及其來源的調(diào)查。調(diào)查結(jié)果顯示各成員館數(shù)字圖書館的建設(shè)資金分別來源于“211工程”建設(shè)經(jīng)費“985”工程,國家“教育振興行動計劃”,國家和省級自然科學(xué)基金,各省市教委、學(xué)校的專項撥款,與企業(yè)共建,捐助,圖書館年運作經(jīng)費,學(xué)校自籌等10多個方面。由此可見圖書館動用了所有力量,通過各種渠道支持數(shù)字圖書館建設(shè)。小到學(xué)校,大到國家,建設(shè)數(shù)字圖書館的意識都明顯增強,對此投入的資金大幅度增加,部分學(xué)校得到的數(shù)字圖書館建設(shè)的資金更是令人可喜。表1將各館數(shù)字圖書館經(jīng)費情況按幾個等級進行了統(tǒng)計。需要說明的是有17個學(xué)校未對數(shù)字圖書館資金的投入進行說明,無法進行統(tǒng)計。對72個成員館的統(tǒng)計結(jié)果顯示,38.9%的學(xué)校數(shù)字圖書館建設(shè)的資金額度大于100萬,其中有8.3%的高校十分重視數(shù)字圖書館的建設(shè),投入了數(shù)千萬資金支持數(shù)字圖書館的建設(shè),但是,我們還應(yīng)該看到,有超過一半的圖書館用于數(shù)字圖書館建設(shè)的資金小于10萬,無力開展規(guī)模性的、目的明確的數(shù)字圖書館建設(shè)活動。“十五”期間,為了在更大范圍內(nèi)共建、共知、共享,CALIS任重道遠。
表1數(shù)字圖書館建設(shè)資金狀況統(tǒng)計
3重點調(diào)研
下面根據(jù)聯(lián)盟理事館對《學(xué)位論文數(shù)據(jù)庫建設(shè)情況調(diào)查表》和《教學(xué)參考書數(shù)據(jù)庫情況調(diào)查表》的反饋意見,綜合CALIS成員館對《數(shù)字圖書館建設(shè)情況調(diào)查表》的反饋意見,對CALIS成員館“學(xué)位論文數(shù)據(jù)庫”和“教學(xué)參考數(shù)據(jù)庫”的建設(shè)情況進行分析。
3.1學(xué)位論文全文數(shù)據(jù)庫建設(shè)
“高校學(xué)位論文文摘數(shù)據(jù)庫”是CALIS“九五”建設(shè)的一項重要成果,是高校間開展文獻傳遞的重要基礎(chǔ)數(shù)據(jù)庫之一。“九五”期間共有90余所成員館參與了CALIS學(xué)位論文文摘數(shù)據(jù)庫的建設(shè),學(xué)位論文文摘數(shù)據(jù)提交量已經(jīng)達到10萬條。由于學(xué)位論文內(nèi)容豐富、新穎、情報價值高,對某一專題有獨到的見解和系統(tǒng)論述,對科研和生產(chǎn)有較大參考價值,讀者需求呈上升趨勢,為此,“十五”期間,CALIS將在該庫的基礎(chǔ)上進一步建設(shè)“高校學(xué)位論文全文數(shù)據(jù)庫”,全面實現(xiàn)博、碩士學(xué)位論文資源的共享。根據(jù)《數(shù)字圖書館建設(shè)調(diào)查》和《高校學(xué)位論文全文數(shù)據(jù)庫建設(shè)調(diào)查》的統(tǒng)計結(jié)果,CALIS成員館中有29家開展了學(xué)位論文全文數(shù)據(jù)庫的籌備和建設(shè)工作,其中13家來自聯(lián)盟理事館;目前這些學(xué)校學(xué)位論文的全文數(shù)據(jù)加起來有18100條,主要采用WORD和PDF格式保存,也有個別學(xué)校采用JPG格式和DJVU格式;其中北京大學(xué)、上海交通大學(xué)和東南大學(xué)圖書館學(xué)位論文建設(shè)工作開展較早,可以追溯到1996年;北京大學(xué)、清華大學(xué)和西安交通大學(xué)圖書館數(shù)據(jù)庫建設(shè)規(guī)模較大,有超過5000條的全文數(shù)據(jù);已經(jīng)具有學(xué)位論文數(shù)據(jù)庫提交系統(tǒng)的學(xué)校有11個,其中北京大學(xué)、清華大學(xué)等圖書館的系統(tǒng)已經(jīng)比較成熟,不僅具有學(xué)位論文提交系統(tǒng),而且同時開發(fā)了學(xué)位論文檢索系統(tǒng),并考慮了學(xué)位論文的編目、校驗、統(tǒng)計,設(shè)計了學(xué)位論文管理系統(tǒng);目前北京大學(xué)和西安交通大學(xué)圖書館的學(xué)位論文數(shù)據(jù)庫系統(tǒng)是開放的,讀者可以檢索到摘要級,其他學(xué)校的學(xué)位論文系統(tǒng)有的要進行用戶認證,有的通過IP限制訪問;對于學(xué)位論文的版權(quán)問題,各個學(xué)校還沒有很好的解決方案。比較實際的解決方法是和論文作者簽署論文使用協(xié)議,限于校園網(wǎng)使用。成員館的上述工作為“十五”期間CALIS學(xué)位論文全文數(shù)據(jù)庫的建設(shè)提供了很好的基礎(chǔ)。2002年5月底,CALIS管理中心邀請在學(xué)位論文建設(shè)方面有一定基礎(chǔ)的15個聯(lián)盟理事館召開了“高校學(xué)位論文全文數(shù)據(jù)庫建設(shè)工作研討會”。會議統(tǒng)一了對高校學(xué)位論文全文數(shù)據(jù)庫建設(shè)的認識,明確了高校學(xué)位論文全文數(shù)據(jù)庫建設(shè)的指導(dǎo)思想為在統(tǒng)一的建庫標(biāo)準(zhǔn)規(guī)范下,實現(xiàn)共建、共享。會上大家總結(jié)出學(xué)位論文建設(shè)的主要環(huán)節(jié)包括總體工作流程、標(biāo)準(zhǔn)規(guī)范、論文提交、應(yīng)用系統(tǒng)、管理與版權(quán)等。會后,CALIS管理中心根據(jù)各成員館的意見,整理了《高校學(xué)位論文全文數(shù)據(jù)庫建設(shè)參考》,為其他準(zhǔn)備開展學(xué)位論文全文數(shù)據(jù)庫建設(shè)的學(xué)校提供參考,加快高校特色資源共建共享的進程。北京大學(xué)、清華大學(xué)、武漢大學(xué)、西安交通大學(xué)、廈門大學(xué)、東南大學(xué)等學(xué)校還表示愿意根據(jù)會議精神,在對各自的應(yīng)用系統(tǒng)進行修改后,盡快向兄弟院校免費提供。與此同時,大家還認同了將CALIS學(xué)位論文全文數(shù)據(jù)庫設(shè)計為“集中索引、分布式存儲”的數(shù)據(jù)庫的思路。
3.2教學(xué)參考書數(shù)據(jù)庫建設(shè)
CALIS管理中心充分意識到,建設(shè)教學(xué)參考書數(shù)據(jù)庫,對高校的公共基礎(chǔ)課、專業(yè)基礎(chǔ)課和一部分精選專業(yè)課的教學(xué)參考書提供上網(wǎng)服務(wù),可以滿足教育事業(yè)發(fā)展的需要,有效地解決各校教參復(fù)本量少的問題,在“十五”期間將“教學(xué)參考書數(shù)據(jù)庫”建設(shè)提到了議事日程上來。
根據(jù)《數(shù)字圖書館建設(shè)情況調(diào)查表》和《教學(xué)參考書數(shù)據(jù)庫情況調(diào)查表》反饋的結(jié)果,目前CALIS成員館教學(xué)參考書數(shù)據(jù)庫建設(shè)基本的情況是:14個學(xué)校已經(jīng)建有一定規(guī)模的教學(xué)參考書數(shù)據(jù)庫,另有11個學(xué)校開始籌劃;其中教參數(shù)據(jù)庫建庫時間最早的是中國人民大學(xué)圖書館,始于1996年;北京大學(xué)圖書館1999年開始建庫;包括復(fù)旦大學(xué)、清華大學(xué)圖書館在內(nèi)的8所高校圖書館從2000年開始建庫;其他的圖書館是在近一年里才開始和計劃進行教學(xué)參考書數(shù)據(jù)庫的建設(shè);這些學(xué)校的教學(xué)參考書書目數(shù)據(jù)量加在一起有49500條,全文數(shù)據(jù)有5100條,其中復(fù)旦大學(xué)的書目數(shù)據(jù)量最多,已達26,500條,中國人民大學(xué)的全文數(shù)據(jù)最多,有3000條;對于教學(xué)參考書數(shù)據(jù)庫系統(tǒng),有7所圖書館使用TRS全文數(shù)據(jù)庫進行二次開發(fā),有3所圖書館采用快葳公司的DIPS系統(tǒng),2所圖書館館使用方正Apabi系統(tǒng);選擇MARC做為教參元數(shù)據(jù)進行著錄的有5家,選擇DC做元數(shù)據(jù)的有3家;對于全文,一般采用WORD和PDF格式;對于版權(quán)問題,中國人民大學(xué)、西安交通大學(xué)、中國科技大學(xué)圖書館目前的解決辦法是限于校園網(wǎng)使用,其中中國人民大學(xué)圖書館已經(jīng)開始對教師著作征詢版權(quán),清華大學(xué)和上海交通大學(xué)圖書館目前的政策是部分解決版權(quán),同時結(jié)合訪問控制,北京大學(xué)圖書館、復(fù)旦大學(xué)圖書館正在考慮和專業(yè)公司合作,全面解決版權(quán);目前在主頁上有教學(xué)參考書項目鏈接的圖書館,有上海交通大學(xué)、復(fù)旦大學(xué)和廈門大學(xué),其中復(fù)旦大學(xué)圖書館的檢索系統(tǒng)可以對外提供服務(wù),非校園網(wǎng)用戶可以瀏覽到書目級。
CALIS在6月中旬邀請22家中國高等學(xué)校數(shù)字圖書館聯(lián)盟理事單位召開了“教學(xué)參考書數(shù)據(jù)庫建設(shè)研討會”。會上,大家根據(jù)各自的工作經(jīng)驗對CALIS將在“十五”期間進行的教學(xué)參考書數(shù)據(jù)庫的建設(shè)工作提出了很好的建議:(1)標(biāo)準(zhǔn)規(guī)范方面:希望CALIS在標(biāo)準(zhǔn)、系統(tǒng)等方面提出方案與要求。(2)建設(shè)內(nèi)容:在學(xué)科上有所側(cè)重和分工。(3)版權(quán)問題:提出統(tǒng)一的版權(quán)解決方案。(4)管理方面:以211工程或CALIS名義,請學(xué)校教務(wù)部門將教參書的收集納入教務(wù)管理工作,以保證教參考書的權(quán)威性和新穎性。(5)建設(shè)方式:由CALIS組織購買一批有版權(quán)的電子參考書,同時在CALIS協(xié)調(diào)下,由部分高校分工建設(shè),共享數(shù)據(jù),成本分攤。(6)合作思路:和數(shù)據(jù)庫商與系統(tǒng)商合作開發(fā)系統(tǒng)和解決版權(quán)。(7)系統(tǒng)建設(shè):第一步參建各校分別建立教參信息庫,同時把數(shù)據(jù)集中起來建立CALIS教學(xué)參考信息庫;第二步建設(shè)電子全文數(shù)據(jù)庫。
針對以上建議,CALIS正在積極征集包括系統(tǒng)、資源、讀者使用、服務(wù)模式、實施、經(jīng)費預(yù)算等在內(nèi)的教學(xué)參考書數(shù)據(jù)庫的解決方案并通過申報、調(diào)研、審批方式確定承建單位。
4小結(jié)
CALIS管理中心通過“數(shù)字圖書館”、“學(xué)位論文數(shù)據(jù)庫”和“教學(xué)參考書數(shù)據(jù)庫”建設(shè)情況調(diào)查,從各個方面了解了成員館數(shù)字圖書館建設(shè)的情況,同時掌握了CALIS“十五”期間將建設(shè)的“學(xué)位論文數(shù)據(jù)庫”和“教學(xué)參考書數(shù)據(jù)庫”在成員館中的發(fā)展現(xiàn)狀。
為了傳承和弘揚大禹文化,受哲學(xué)社會科學(xué)研究院委托,單位成立了大禹文化研究中心,并召開了多次國內(nèi)學(xué)術(shù)會議。目前,在海峽兩岸研究人員的支持下,研究所已經(jīng)收集了大量有關(guān)大禹的書籍、考古資料。這些資料即包括已經(jīng)收集到的視頻、照片、古籍原件等多種實體內(nèi)容,也包括被“歷代石刻史料匯編”、“公元集成圖片庫”、“中國基本古籍庫”、“中國歷代典籍總目系統(tǒng)”、“中國數(shù)字方志庫”、“瀚堂典藏古籍?dāng)?shù)據(jù)庫”等專題數(shù)據(jù)庫所搜錄的文獻,還包括以大禹文化為主題新聞與資料。縱觀歷史,大禹文化在發(fā)展中進步,許多事實新聞,如“五水共治”等就是大禹文化建設(shè)的補充。因此,大禹文化資料庫的建設(shè)也是一個長期的與時俱進的過程。
2資料庫建設(shè)相關(guān)技術(shù)
2.1大數(shù)據(jù)技術(shù)
進入大數(shù)據(jù)時代,人們開始發(fā)現(xiàn)很多主題都開始變成了大數(shù)據(jù)。目前,大禹文化研究數(shù)據(jù)雖然不多,但由于大禹的歷史悠久,隨著考古技術(shù)的提升、大禹的歷史文化資料會變得越來越豐富,以大禹為主題的傳奇故事會以動漫、歷史劇等形式傳播出去。隨著水文化得到人們的重視,融合大禹元素的水文化傳播的信息也會大量增長。此外,大禹文化相關(guān)的電子商務(wù)以及無線傳感、虛擬空間技術(shù)在大禹主題旅游行業(yè)的應(yīng)用也會帶來大數(shù)據(jù)。因此,針對大禹主題的大數(shù)據(jù)研究也會成為一個重要研究方向,可以在這些大數(shù)據(jù)中獲得新的研究點。
2.2云計算
目前由于大禹文化研究資料分布在許多不同專題數(shù)據(jù)庫中,需要人工進行整合。這會耗費了大量的人力,造成的研究的瓶頸。為此,如果有必要通過商業(yè)和技術(shù)協(xié)議將其各庫中擁有的大禹文化資料共享出來,用云服務(wù)的方式為研究者提供統(tǒng)一的檢索平臺,以產(chǎn)生更大的社會效益。事實上,在教育領(lǐng)域,CALIS等圖書館共享平臺已經(jīng)在提供一個通用的文獻資料云,并取得了良好的效果。但大禹研究者需要更為專業(yè)的數(shù)據(jù)庫,如果能夠?qū)⒋笥碇黝}信息較為精確地從各大數(shù)據(jù)庫中抽取出來再作整理,必然能夠降低研究者檢索文獻的難度,增加其搜索內(nèi)容的廣度。因此,開展基于云服務(wù)的大禹專題數(shù)據(jù)庫構(gòu)建方法研究就顯得十分必要。
2.3垂直搜索引擎技術(shù)
由于收集資料的專業(yè)化和檢索方式的專門化,使得垂直搜索引擎具有通用搜索引擎不可替代的功能。事實上,除專題數(shù)據(jù)庫外,互聯(lián)網(wǎng)是獲取大禹專題信息的重要渠道。而建立專題數(shù)據(jù)庫類似于建立一個垂直搜索引擎。有了大禹主題的垂直搜索引擎,許多最新的研究資料也可以從互聯(lián)網(wǎng)中獲取。由此要做的工作就是設(shè)計大禹主題的網(wǎng)絡(luò)爬蟲,用爬蟲不斷抓取互聯(lián)網(wǎng)中的大禹文化研究資料,然后以搜索引擎的方式供研究者使用,并用統(tǒng)計方法對不斷增長的資料進行分析。事實上,許多專題數(shù)據(jù)庫(如國研網(wǎng))就是含有專題文獻摘要的搜索引擎。顯然,構(gòu)建大禹主題垂直搜索引擎會是專題數(shù)據(jù)庫建設(shè)主要內(nèi)容。
2.4多媒體信息檢索技術(shù)
大禹文化研究資料包括了大量視頻、照片等多媒體信息。但為這些多媒體信息建立標(biāo)簽需要花費大量人力,需要引入自動標(biāo)引技術(shù)。目前手寫體識別、截圖搜索、智能問答、視頻流中人臉識別等技術(shù)已得到廣泛的應(yīng)用。可以將這些多媒體技術(shù)用于對大禹文化資料的自動匹配和檢索,以增強研究者獲取資料的便捷性,進一步提升大禹文化專題數(shù)據(jù)庫的建設(shè)水平。
3資料庫設(shè)計思路
3.1設(shè)計目標(biāo)
結(jié)合人工與計算機技術(shù),建立能夠?qū)Υ笥砦幕黝}相關(guān)信息的采集、加工和的平臺,為研究者提供較搜索引擎更為精確的研究資料,較其他專題數(shù)據(jù)庫更為完善的文獻數(shù)據(jù),較圖書館更為豐富的多媒體信息。
3.2信息采集功能設(shè)計
一般來講,專題數(shù)據(jù)庫的信息采集流程為:①確定專題信息的收集范圍,實現(xiàn)專題信息的手工采集、自動采集;②按照數(shù)字文獻格式標(biāo)準(zhǔn)體系對采集的專題信息進行存儲,生成數(shù)字化文獻;③以手工或自動的方式生成數(shù)字化文獻的元數(shù)據(jù)對元數(shù)據(jù)進行自動標(biāo)引,采用一定的標(biāo)準(zhǔn)進行組織;④對不同的數(shù)據(jù)庫制作者賦予不同的權(quán)限,以手工或批量方式添加、修改、刪除元數(shù)據(jù),使元數(shù)據(jù)與數(shù)字對象建立對應(yīng),實現(xiàn)對元數(shù)據(jù)和數(shù)字對象的管理。按照數(shù)據(jù)的來源不同,需要設(shè)置不同采集形式,具體如下:已有資料電子化。即將已有的書籍和文獻資料人工轉(zhuǎn)換為掃描件,部分材料運用OCR技術(shù)轉(zhuǎn)換為文字格式,并將實物拍攝成照片,運用多媒體技術(shù)做好各類資料的文本標(biāo)注。這樣就可以和已有的視頻等電子資料整合成多媒體資料集。用深度搜索引擎技術(shù),從各大數(shù)據(jù)庫中自動提取出大禹文化主題相關(guān)的文獻資料,直接引入其在原有數(shù)據(jù)庫中的文獻標(biāo)識進行標(biāo)注。設(shè)計好大禹文化主題網(wǎng)絡(luò)爬蟲,實時從互聯(lián)網(wǎng)中抓取主題相關(guān)資料,保存在搜索引擎專用的數(shù)據(jù)庫中。再應(yīng)用自動推薦技術(shù),向數(shù)據(jù)庫管理員推薦有價值的文獻資料,由管理員將互聯(lián)網(wǎng)中的文獻列入專題數(shù)據(jù)庫中供研究者檢索,即將文獻標(biāo)引為不同的標(biāo)志,如果文獻是從專題數(shù)據(jù)庫中獲取標(biāo)明“引入”,搜索引擎直接獲取標(biāo)明“互聯(lián)網(wǎng)”,數(shù)據(jù)庫管理員人工確認的則標(biāo)明“人工入庫”。運用云技術(shù),將資料庫建在云端,與其他專題數(shù)據(jù)庫建立合作關(guān)系,獲得大禹專題文獻的推送服務(wù)。可以從專業(yè)文獻資料庫、垂直搜索引擎和多媒體信息檢索庫的角度來開展資料的收集和整理。
3.3信息檢索功能設(shè)計
為提升專題數(shù)據(jù)庫的功能,實現(xiàn)更好的用戶體驗,具體設(shè)計如下:實現(xiàn)一般文獻資料數(shù)據(jù)庫應(yīng)有的文本檢索功能。該數(shù)據(jù)庫提供主題、關(guān)鍵詞、摘要、標(biāo)題、內(nèi)容等關(guān)鍵信息的全文檢索,并以pdf文件形式提供文獻資料。在大禹文獻數(shù)據(jù)庫中分析并整理出專業(yè)名詞集,形成大禹文化語義本體,為檢索者提供同義詞識別、主題相關(guān)檢索詞推薦等功能,并能夠按照訪問量、下載量、文獻引用量、發(fā)表時間等方式進行排序。對收集到的照片、視頻等多媒體資料作自動標(biāo)注,建立多媒體檢索庫,實現(xiàn)文本到多媒體信息統(tǒng)一檢索接口。這里主要參考的標(biāo)準(zhǔn)是Mpeg-7,實現(xiàn)對視頻中幀、鏡頭、情節(jié)和節(jié)目的分離;同時用Sphinx來提取語音中的信息,實現(xiàn)語音向文本的自動轉(zhuǎn)換。這樣用戶就可以用關(guān)鍵詞、截圖、語音等方式來搜索資料庫中的多媒體資料。例如,用戶給出大禹陵的照片,就可以檢索到出現(xiàn)過該照片信息的視頻文件。提供智能問答系統(tǒng),讓研究者可以與虛擬資料庫管理員進行在線交流,由計算機自動提供文獻資料情況的解釋說明,從而提高專業(yè)數(shù)據(jù)庫服務(wù)的質(zhì)量。具體實現(xiàn)過程為:建立FAQ庫;對用戶的提問進行分析,將問題轉(zhuǎn)換成查詢關(guān)鍵詞;在FAQ庫中查到問題對應(yīng)的答案;對于在庫中查不到的問題,則給出提問要求,讓用戶進一步明確意圖;對多次查詢沒有結(jié)果的問題則從互聯(lián)網(wǎng)上獲取答案,并推薦給用戶;如果用戶認可推薦的答案,則將這個問題和答案組合加入到FAQ中去。事實上,清華大學(xué)圖書館的智能聊天機器人已經(jīng)實現(xiàn)了這樣的功能,并大大改善了查詢者的用戶體驗。運用大數(shù)據(jù)技術(shù),提供數(shù)據(jù)分析接口,讓研究者能夠從不斷增長的數(shù)據(jù)中快速分析出想要的統(tǒng)計信息。主要要實現(xiàn)流處理和批處理兩種處理方式。流處理主要針對不需要永久化存儲的過程信息,如相關(guān)旅游服務(wù)的實時信息和商品銷售信息。批處理則是針對長期積累在數(shù)據(jù)庫中的大數(shù)據(jù)進行分析。要通過檢索功能的優(yōu)化,實現(xiàn)具有大數(shù)據(jù)分析環(huán)境、面向新媒體的新型數(shù)據(jù)庫檢索平臺。
3.4信息檢索評估方法設(shè)計
在數(shù)據(jù)庫建設(shè)完成后,可以用信息檢索的傳統(tǒng)方法對構(gòu)建好的數(shù)據(jù)庫要進行測試與評估,方法如下:
3.4.1雙率檢測
雙率檢測,即對數(shù)據(jù)庫檢索的查全率和查準(zhǔn)率進行評估。先要設(shè)計一套測試用關(guān)鍵詞和測試用資料,然后對關(guān)鍵詞查詢的結(jié)果進行統(tǒng)計,獲取查詢結(jié)果與測評用資料的實際匹配程度。同時統(tǒng)計出被查得文獻資料個數(shù)與實際已經(jīng)存儲資料個數(shù)的比值。在查詢時要考慮查詢對象除文本資料外,還有多媒體資料,要設(shè)計多種樣本進行評估。
3.4.2對大數(shù)據(jù)統(tǒng)計分析結(jié)果進行評估
對大數(shù)據(jù)統(tǒng)計分析結(jié)果進行評估。即用人工評價的方式來對統(tǒng)計結(jié)果的正確性以及推薦結(jié)果的合理性進行打分,從而為優(yōu)化統(tǒng)計分析算法打下基礎(chǔ)。
3.4.3響應(yīng)時間測評
設(shè)計不同的關(guān)鍵詞組合,記錄查詢的時間,評估出系統(tǒng)的響應(yīng)速度,設(shè)定響應(yīng)閾值,并分析響應(yīng)緩慢的原因。
3.4.4語義本體合理性評估
設(shè)計專業(yè)術(shù)語中容易混淆的一組關(guān)鍵詞進行檢索,統(tǒng)計出同義詞和專用詞轉(zhuǎn)換的成功率,以利于優(yōu)化大禹主題本體的設(shè)計。信息檢索評估的體系十分復(fù)雜,要抓住專題數(shù)據(jù)庫針對強的特點來測試,測試的主要目的是提高用戶體驗。
4結(jié)束語
(一)學(xué)生英語水平參差不齊
《數(shù)據(jù)庫應(yīng)用》課程針對的是大二學(xué)生,這些學(xué)生在大一時已經(jīng)完成了大學(xué)英語的學(xué)習(xí),基本具備了四千左右的詞匯量和一定的英語閱讀方面的能力。但仍然有較大一部分學(xué)生很難或根本不會用英語與他人進行交流,停留在“聾子英語”、“啞巴英語”上,使得學(xué)習(xí)的信心不足,這就有可能使工科學(xué)生出現(xiàn)極大的恐懼情緒和厭學(xué)情緒,不管是英語水平還是專業(yè)理解能力都不是在一個水平線上,更進一步導(dǎo)致學(xué)生的水平參差不齊。
(二)專業(yè)英語與專業(yè)課內(nèi)容相結(jié)合的適應(yīng)時間較長
對于計算機專業(yè)的學(xué)生來講,《數(shù)據(jù)庫應(yīng)用》課程的雙語教學(xué)過程,不僅需要學(xué)生掌握數(shù)據(jù)庫方面的專業(yè)詞匯,而且還需要學(xué)生將專業(yè)術(shù)語與專業(yè)課的學(xué)習(xí)結(jié)合起來,這將需要有一定的適應(yīng)時間,而且這個時間還可能很長。而在教學(xué)過程中,學(xué)生是主體,如果在這個過程中適應(yīng)時間太長,使得學(xué)生并沒有從雙語教學(xué)中獲益,這將影響雙語教學(xué)的初衷,達不到應(yīng)有的教學(xué)效果。
(三)師資方面的問題
雙語教學(xué),要求授課教師不僅要有扎實的專業(yè)知識,同時也要有良好的英語表達能力。對民辦院校而言,在計算機專業(yè)中,雙語方面優(yōu)秀師資比較欠缺。一是,由于我院所處的地理位置離市區(qū)相對較遠,這就導(dǎo)致很多非常優(yōu)秀的教師不太愿意來我院授課;二是,由于限于資金等種種因素,我系教師被送到國外進行學(xué)習(xí)和進修的機會非常少。對于我院現(xiàn)有的校內(nèi)老師而言,外語專業(yè)的教師對計算機的專業(yè)課程缺乏了解,而計算機專業(yè)教師又普遍不具備良好的外語口語表達能力。雖然在我院從事雙語教學(xué)的教師都具有碩士及碩士以上學(xué)位,同時在計算機專業(yè)課程授課的功底非常扎實,而且在英語科技文章的閱讀能力也相對較強,但大部分的教師都沒有國外的學(xué)習(xí)或進修的經(jīng)歷,在口語等方面比較薄弱。若完全采用英語課件和英語授課,在教學(xué)過程中有很大的困難。
二、《數(shù)據(jù)庫應(yīng)用》課程雙語教學(xué)改革的具體實施
(一)教學(xué)目標(biāo)
雙語教學(xué)首先要有正確的教學(xué)目標(biāo),在《數(shù)據(jù)庫應(yīng)用》課程中,英語授課僅僅是一種手段,其最終目的是培養(yǎng)學(xué)生通過所學(xué)的數(shù)據(jù)庫專業(yè)知識并且運用其中的技術(shù)去實際解決問題,從而激發(fā)學(xué)生在計算機領(lǐng)域中繼續(xù)學(xué)習(xí)和研究的愿望。首先應(yīng)把《數(shù)據(jù)庫應(yīng)用》課程中的專業(yè)知識的學(xué)習(xí)放在首位,然后把雙語教學(xué)中的英語教學(xué)作為一種滲透。在該課程的雙語教學(xué)過程中應(yīng)該積極使用英語授課,要求學(xué)生能夠讀懂、理解課程的內(nèi)容和表達方式即可。因此,教師應(yīng)明確該課程的核心教學(xué)的目的,歸納如下:通過對《數(shù)據(jù)庫應(yīng)用》雙語課程的講授,學(xué)生應(yīng)該理解和掌握數(shù)據(jù)庫系統(tǒng)的基本原理及相關(guān)應(yīng)用技術(shù)。學(xué)生通過在該課程中學(xué)習(xí)的數(shù)據(jù)庫的專業(yè)知識,將它們運用到實際中去,解決有關(guān)數(shù)據(jù)庫的實際問題,能夠應(yīng)對數(shù)據(jù)庫應(yīng)用系統(tǒng)設(shè)計、應(yīng)用和維護的任務(wù)。從而,學(xué)生逐步形成獨立發(fā)現(xiàn)問題、思考問題、分析和實際解決問題的能力,同時提高學(xué)生的自學(xué)能力和創(chuàng)新能力等。
(二)教學(xué)模式
目前,國外的雙語教學(xué)有多種模式。沉浸式(im-mersionprogram)、保持式(maintenancebilingualedu-cation)、過渡式(transitionalbilingualeducation)等。在民辦高校中開展《數(shù)據(jù)庫應(yīng)用》課程的雙語教學(xué),首先要根據(jù)該課程的實際要求、學(xué)生在雙語教學(xué)過程中的接受能力和英語的詞匯和閱讀水平等具體情況,來決定在我院的《數(shù)據(jù)庫應(yīng)用》雙語課程中的具體模式。然后再根據(jù)課程的教學(xué)進度和進展情況以及學(xué)生對課程的適應(yīng)情況,可以對該課程進行及時調(diào)整,最終達到掌握數(shù)據(jù)庫的專業(yè)知識和提高學(xué)生實際英語能力的雙重目標(biāo)。同時考慮《數(shù)據(jù)庫應(yīng)用》課程的特點和《數(shù)據(jù)庫應(yīng)用》雙語教學(xué)仍處在初期,因此,《數(shù)據(jù)庫應(yīng)用》課程的雙語教學(xué)模式采用中文講授+英文課件,即在授課過程中,使用英文教材,教師在講授專業(yè)知識時以中文為主,同時介入英語表達,循序漸進,逐步提高學(xué)生在《數(shù)據(jù)庫應(yīng)用》課程中的理論知識和運用水平的基礎(chǔ)上,保證學(xué)生英語專業(yè)詞匯和閱讀能力水平的提高。
(三)課堂教學(xué)的組織實施和教學(xué)方法
1.采用案例引導(dǎo)、任務(wù)驅(qū)動式的教學(xué)模式。
在授課過程中,教師應(yīng)該根據(jù)課程的內(nèi)容,為學(xué)生安排學(xué)習(xí)任務(wù),使學(xué)生在完成所布置任務(wù)的同時掌握相關(guān)數(shù)據(jù)庫的知識。在案例引導(dǎo)、任務(wù)驅(qū)動式模式下,教師必須要縱觀整個《數(shù)據(jù)庫應(yīng)用》課程,充分發(fā)掘英語教材,精心設(shè)計問題,為學(xué)生提供自主學(xué)習(xí)的良好機會。在設(shè)計任務(wù)時,問題可以使用課本后面的練習(xí)題,也可根據(jù)課本內(nèi)容自編相關(guān)的題目。然后根據(jù)教學(xué)大綱和本課程的教學(xué)重點和難點,同時還要考慮學(xué)生在完成過程中可能遇到的困難去擬定相關(guān)的題目。通過自主的發(fā)現(xiàn)和探索、自主的質(zhì)疑、和同學(xué)進行討論等多種方式,學(xué)生不僅體驗到成功解決問題的快樂,而且激發(fā)了學(xué)習(xí)《數(shù)據(jù)庫應(yīng)用》雙語課程的興趣,因此,增強了學(xué)習(xí)的信心和勇氣。
2.組織討論和演講。
在上課時,授課教師應(yīng)該鼓勵學(xué)生當(dāng)“老師”,給學(xué)生創(chuàng)造使用英語交流和實踐的機會。針對在上課中遇到的問題,教師應(yīng)多鼓勵學(xué)生學(xué)會獨立思考問題、大膽質(zhì)疑并且敢于發(fā)表自己不同的觀點。另外,在課堂上還可以挑選出幾個有代表性的學(xué)生進行演講。最后,教師對學(xué)生的表現(xiàn)和學(xué)生對問題的分析進行總結(jié)。這就使得在雙語教學(xué)過程中,學(xué)生所獲得的是在豐富的情境中,不斷發(fā)展著的英語表達能力和專業(yè)知識的運用能力。同時在雙語教學(xué)中進行討論,能夠讓學(xué)生提高該課程的主動性和積極性,從而為培養(yǎng)學(xué)生運用英語的能力打下堅實的基礎(chǔ)。
3.上機實驗和課程設(shè)計過程。
《數(shù)據(jù)庫應(yīng)用》課程應(yīng)該注重理論和實踐相結(jié)合。每周的理論課之后,都安排相應(yīng)的實驗課。學(xué)生可以通過上機練習(xí)達到真正理解課堂上的知識。此外,在課程快結(jié)束的時候,為每組學(xué)生分配一個實際的數(shù)據(jù)庫應(yīng)用系統(tǒng)的開發(fā)項目。這樣可以使學(xué)生去思考和實踐數(shù)據(jù)庫開發(fā)設(shè)計中具體的思路和方法,最終完成課程設(shè)計的任務(wù)。課程設(shè)計的開展,促使學(xué)生將所學(xué)的知識運用到實際的開發(fā)過程中去,并且使學(xué)生將所學(xué)到的知識融會貫通并且鞏固和提高。最后,學(xué)生需上交具體實現(xiàn)的系統(tǒng)和一份英文的課程設(shè)計報告,這將培養(yǎng)學(xué)生撰寫英文文檔和論文的能力。
(四)雙語考核形式
《數(shù)據(jù)庫應(yīng)用》雙語課程的期末綜合測評成績采用過程考試和期末考試兩種方法。過程考試即平時成績,包括考勤、作業(yè)、實驗、學(xué)生參與的課堂內(nèi)容的情況。教師制定一個具體的評價指標(biāo),對平時成績參照評價指標(biāo)進行詳細的記錄。期末考試采用閉卷方式,主要考查學(xué)生對教材上基本知識點的掌握程度。過程考試和期末考試成績按一定的比例計算。采用過程考試和期末考試相結(jié)合的方法是評價《數(shù)據(jù)庫應(yīng)用》教學(xué)效果的一個重要手段,而且這兩項合理的結(jié)合能促進學(xué)生英語能力的提高和數(shù)據(jù)庫專業(yè)知識的學(xué)習(xí)。
三、總結(jié)
(1)資產(chǎn)信息管理。包括資產(chǎn)登記,資產(chǎn)標(biāo)簽打印,資產(chǎn)信息修改,資產(chǎn)信息刪除。(2)合同信息管理。包括合同登記,合同信息修改,合同刪除和合同付款驗收。(3)供應(yīng)商管理。包括原廠商登記,原廠商查詢變更,供應(yīng)商登記,供應(yīng)商查詢變更。(4)資產(chǎn)領(lǐng)用管理。包括資產(chǎn)領(lǐng)用,資產(chǎn)領(lǐng)用單打印,資產(chǎn)領(lǐng)用變更,資產(chǎn)歸還,資產(chǎn)領(lǐng)用單刪除,資產(chǎn)領(lǐng)用查詢變更。(5)資產(chǎn)維修管理。包括維修登記,維修記錄變更,維修記錄刪除。(6)資產(chǎn)處置管理。包括處置登記,處置查詢變更,處置記錄變更,處置記錄刪除。(7)資產(chǎn)卡片管理。包括卡片登記,卡片變更,卡片刪除。(8)查詢統(tǒng)計管理。包括供應(yīng)商查詢,合同查詢,資產(chǎn)信息統(tǒng)計查詢,資產(chǎn)領(lǐng)用查詢,卡片領(lǐng)用查詢。(9)系統(tǒng)管理。包括數(shù)據(jù)字典,用戶管理,權(quán)限分配和角色分配。
2關(guān)鍵技術(shù)
2.1數(shù)據(jù)庫設(shè)計
數(shù)據(jù)庫是資產(chǎn)管理系統(tǒng)的重要組成部分,數(shù)據(jù)庫結(jié)構(gòu)的好壞將對應(yīng)用系統(tǒng)的效率以及實現(xiàn)的效果產(chǎn)生直接影響。合理的數(shù)據(jù)庫結(jié)構(gòu)設(shè)計可以提高數(shù)據(jù)存儲的效率,保證數(shù)據(jù)的一致性、安全性和完整性。本系統(tǒng)采用關(guān)系型數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫是建立在嚴(yán)格的數(shù)學(xué)概念的基礎(chǔ)上。概念單一,實體與實體間的聯(lián)系都用關(guān)系表示,故其數(shù)據(jù)結(jié)構(gòu)簡單、清晰,存取路徑對用戶透明。因此有更高的數(shù)據(jù)獨立性和更好的安全保密性。系統(tǒng)運用實體聯(lián)系圖的方法來進行數(shù)據(jù)庫概念結(jié)構(gòu)設(shè)計。依據(jù)以上的設(shè)計,系統(tǒng)中設(shè)計出的實體有:資產(chǎn)實體、用戶實體、供應(yīng)商實體、部門實體等。
2.2數(shù)據(jù)字典
系統(tǒng)根據(jù)機構(gòu)權(quán)限的不同實行級別管理,分為省聯(lián)社級、市級、市級農(nóng)商行、縣級、網(wǎng)點級五個級別。省聯(lián)社級為最高級別,網(wǎng)點級為最低級別。所以系統(tǒng)開發(fā)時首先要規(guī)定統(tǒng)一的數(shù)據(jù)格式和規(guī)范編碼規(guī)則。系統(tǒng)以數(shù)據(jù)字典的形式來規(guī)范數(shù)據(jù)。數(shù)據(jù)字典用于設(shè)定計量單位、資產(chǎn)狀態(tài)、領(lǐng)用類型、報修類型等一些基本數(shù)據(jù)的管理。通常由服務(wù)器系統(tǒng)管理員統(tǒng)一管理。本系統(tǒng)將數(shù)據(jù)字典的格式規(guī)范成三個字段:字典域(進行分級管理),字典域編碼和字典域名稱。
2.3個性化用戶視圖
本系統(tǒng)按不同的用戶類型來分組,給不同的用戶分配不同的角色,不同的角色擁有不同的訪問權(quán)限。系統(tǒng)根據(jù)登錄用戶角色的不同,來生成不同角色所對應(yīng)的不同的菜單和功能。即具有不同權(quán)限的用戶,在登錄到系統(tǒng)之后會看到不同的用戶操作界面。從而產(chǎn)生了基于角色的個性化用戶視。本系統(tǒng)在設(shè)計方面嚴(yán)格執(zhí)行“一人一角色”的操作權(quán)限,更好的確保了系統(tǒng)操作的方便性和安全性。
3系統(tǒng)實現(xiàn)
通過對農(nóng)信社資產(chǎn)管理進行深入地研究,詳盡全面地分析了資產(chǎn)管理系統(tǒng)的需求,該系統(tǒng)采用C#編程語言,后臺數(shù)據(jù)庫為關(guān)系型數(shù)據(jù)庫SQLServer2005開發(fā)了三層架構(gòu)的資產(chǎn)管理系統(tǒng)。系統(tǒng)采用典型的C/S架構(gòu),主要是基于數(shù)據(jù)量和安全性方面的考慮。系統(tǒng)分為三層,第一層為客戶層(Client),第二層為業(yè)務(wù)邏輯層(BusinessLogic),第三層為數(shù)據(jù)層(Data)。
4結(jié)束語
關(guān)鍵詞:嵌入式系統(tǒng);移動數(shù)據(jù)庫;移動計算;事務(wù)處理
0引言
數(shù)據(jù)庫技術(shù)一直隨著計算的發(fā)展而不斷進步,隨著移動計算時代的到來,嵌入式操作系統(tǒng)對移動數(shù)據(jù)庫系統(tǒng)的需求為數(shù)據(jù)庫技術(shù)開辟了新的發(fā)展空間。隨著智能移動終端的普及,嵌入式移動數(shù)據(jù)庫技術(shù)目前已經(jīng)從研究領(lǐng)域逐步走向廣泛的應(yīng)用領(lǐng)域。
在數(shù)據(jù)庫系統(tǒng)的研究歷史中,傳統(tǒng)的分布計算與分布式數(shù)據(jù)庫的研究是基于有線網(wǎng)絡(luò)和固定主機的。這些都采用了一些默認的隱含假設(shè),例如固定網(wǎng)絡(luò)連接、對等通信代價、主機節(jié)點固定不變等。但進入20世紀(jì)90年代以來,隨著移動通信技術(shù)和網(wǎng)絡(luò)技術(shù)迅速發(fā)展,加之移動計算機和移動通信設(shè)備的大量普及,許多計算節(jié)點可以在移動過程中與網(wǎng)絡(luò)建立連接,使得上述假設(shè)條件不成立。移動計算環(huán)境具有移動性、低帶寬、頻繁斷接性、網(wǎng)絡(luò)通信的非對稱性、電源電力的有限性等特點,使得傳統(tǒng)分布式數(shù)據(jù)庫中的方法和技術(shù)不能直接應(yīng)用于移動數(shù)據(jù)庫。
1嵌入式移動數(shù)據(jù)庫的定義
從數(shù)據(jù)庫技術(shù)的發(fā)展過程來看,計算環(huán)境和數(shù)據(jù)庫技術(shù)基本保持著一種同步發(fā)展的態(tài)勢,互相影響、互相促進。移動計算的概念是對“任何時間、任何地點的立即通訊”的擴展。在分布式計算的基礎(chǔ)上,計算環(huán)境進一步擴展為包含各種移動設(shè)備、具有無線通信能力的服務(wù)網(wǎng)絡(luò),構(gòu)成了一個新的計算環(huán)境,即移動計算環(huán)境。相應(yīng)地,數(shù)據(jù)庫系統(tǒng)先后出現(xiàn)了集中式數(shù)據(jù)庫系統(tǒng)、分布式數(shù)據(jù)庫系統(tǒng)、B/A/S多層結(jié)構(gòu)的數(shù)據(jù)庫系統(tǒng)、嵌入式數(shù)據(jù)庫和移動數(shù)據(jù)庫。當(dāng)然,這些系統(tǒng)也可以共存在同一個計算環(huán)境中。
一般說來,嵌入式移動數(shù)據(jù)庫可以從系統(tǒng)的體系結(jié)構(gòu)方面來定義:嵌入式移動數(shù)據(jù)庫系統(tǒng)是支持移動計算或某種特定計算模式的數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)庫系統(tǒng)與操作系統(tǒng)、具體應(yīng)用集成在一起,運行在各種智能型嵌入設(shè)備或移動設(shè)備上。其中,嵌入在移動設(shè)備上的數(shù)據(jù)庫系統(tǒng)由于涉及數(shù)據(jù)庫技術(shù)、分布式計算技術(shù),以及移動通訊技術(shù)等多個學(xué)科領(lǐng)域,目前已經(jīng)成為一個十分活躍的研究和應(yīng)用領(lǐng)域——嵌入式移動數(shù)據(jù)庫或簡稱為移動數(shù)據(jù)庫(EMDBS)。
2嵌入式移動數(shù)據(jù)庫的體系結(jié)構(gòu)及其主要特點
2.1體系結(jié)構(gòu)
在傳統(tǒng)的分布式計算系統(tǒng)中,各個計算節(jié)點之間是通過固定網(wǎng)絡(luò)連接并保持網(wǎng)絡(luò)的持續(xù)連接性的,而移動計算系統(tǒng)改變了這種假設(shè)條件。移動計算系統(tǒng)是固定節(jié)點和移動節(jié)點構(gòu)成的分布計算系統(tǒng)。
移動計算的網(wǎng)絡(luò)環(huán)境具有鮮明的特點:移動性、斷接性、帶寬多樣性、可伸縮性、弱可靠性、網(wǎng)絡(luò)通信的非對稱性、電源能力的局限性等。移動環(huán)境中的分布式數(shù)據(jù)庫就是移動數(shù)據(jù)庫。它是傳統(tǒng)分布式數(shù)據(jù)庫系統(tǒng)的擴展,可以看作客戶與固定服務(wù)器節(jié)點動態(tài)連接的分布式系統(tǒng)。移動數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)如圖1所示。
其中,移動客戶機MC(MobileClient)包括便攜式電腦、PDA等;MSS(MobileSupportStation)支持移動計算的固定節(jié)點,具有無線通信接口;FH(FixedHost)沒有無線通信接口,安裝有數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)。
2.2主要特點
移動數(shù)據(jù)庫的計算環(huán)境是傳統(tǒng)分布式數(shù)據(jù)庫的擴展,它可以看作客戶端與固定服務(wù)器節(jié)點動態(tài)連接的分布式系統(tǒng)。因此移動計算環(huán)境中的數(shù)據(jù)庫管理系統(tǒng)是一種動態(tài)分布式數(shù)據(jù)庫管理系統(tǒng)。由于移動數(shù)據(jù)庫在移動計算的環(huán)境下應(yīng)用在嵌入型操作系統(tǒng)之上,所以它具有:微小內(nèi)核結(jié)構(gòu)、對標(biāo)準(zhǔn)SQL的支持、事務(wù)管理功能、完善的數(shù)據(jù)同步機制、支持多種連接協(xié)議、完備的數(shù)據(jù)庫管理功能和支持多種嵌入型操作系統(tǒng)的特點和功能需求。
在移動數(shù)據(jù)庫中還需要考慮諸多傳統(tǒng)計算環(huán)境下不需要考慮的問題,如對斷接操作的支持、對位置相關(guān)查詢的支持、對查詢優(yōu)化的特殊考慮以及對提高有限資源的利用率和對系統(tǒng)效率的考慮等等。為了有效地解決上述問題,諸如復(fù)制與緩存技術(shù)、移動事務(wù)處理、數(shù)據(jù)廣播技術(shù)、移動查詢處理與查詢優(yōu)化、位置相關(guān)的數(shù)據(jù)處理及查詢技術(shù)、移動信息技術(shù)等技術(shù)仍在不斷的發(fā)展和完善,它們會進一步促進移動數(shù)據(jù)庫技術(shù)的發(fā)展。
3嵌入式移動數(shù)據(jù)庫的關(guān)鍵技術(shù)
移動數(shù)據(jù)庫涉及的理論和技術(shù)含蓋了當(dāng)今通信、計算機和嵌入式系統(tǒng)的最新成果,其中在移動環(huán)境下如何進行數(shù)據(jù)管理是實現(xiàn)移動數(shù)據(jù)庫的關(guān)鍵。根據(jù)目前國際有關(guān)機構(gòu)研究的研究表明這些關(guān)鍵技術(shù)主要集中在以下幾個方面。
3.1數(shù)據(jù)復(fù)制與緩存
復(fù)制是在多個移動節(jié)點上維護數(shù)據(jù)的備份,包括服務(wù)器之間的復(fù)制和移動計算機上保存數(shù)據(jù)庫的復(fù)制。一般前者稱為復(fù)制后者稱為緩存。復(fù)制的主要目的是提高分布式數(shù)據(jù)庫系統(tǒng)的可用性、可靠性和訪問性能。首要的問題是如何維護多個復(fù)制節(jié)點上數(shù)據(jù)狀態(tài)的一致性。按照維護復(fù)制一致性的方式來劃分,現(xiàn)有的復(fù)制協(xié)議可以分為嚴(yán)格一致協(xié)議和弱一致協(xié)議兩種。嚴(yán)格一致協(xié)議要求任何時刻所有數(shù)據(jù)庫的復(fù)制都是一致的;而弱一致協(xié)議允許各個復(fù)制之間存在暫時的不一致,但這種不一致總能夠保持在一定的界限之內(nèi),而且總是能夠趨于一致(收斂性)。目前,針對移動計算特點開展數(shù)據(jù)復(fù)制/緩存技術(shù)的研究最具代表性的是:J.Gray的兩級復(fù)制機制、CODA系統(tǒng)以及緩存失效報告廣播技術(shù)等,另外,SYBASE公司的移動數(shù)據(jù)庫產(chǎn)品SQLANYWHERE和SQLREMOTE也采用該技術(shù)來支持移動計算環(huán)境。
3.2數(shù)據(jù)廣播
通俗地講,數(shù)據(jù)廣播是指在移動計算環(huán)境中,利用客戶機與服務(wù)器通信的不對稱性,以周期性廣播的形式向客戶機發(fā)送數(shù)據(jù)。其最大的優(yōu)點是,廣播開銷不依賴移動用戶數(shù)量的變化而變化,借助數(shù)據(jù)廣播,可以在一定程度上解決移動數(shù)據(jù)庫系統(tǒng)的斷接問題。數(shù)據(jù)廣播的研究可分為服務(wù)器和客戶機兩個方面:服務(wù)器主要考慮如何組織廣播數(shù)據(jù),即數(shù)據(jù)廣播的調(diào)度;移動節(jié)點主要考慮如何利用本地緩存進一步減少查詢廣播數(shù)據(jù)的時間。在國內(nèi),長沙國防科技大學(xué)的周興銘院士對數(shù)據(jù)廣播進行了深入研究,提出了數(shù)據(jù)廣播的多盤調(diào)度算法。衡量數(shù)據(jù)廣播調(diào)度算法好壞的參數(shù)是訪問時間和調(diào)諧時間。
3.3位置相關(guān)查詢優(yōu)化
在移動數(shù)據(jù)庫中,存在著與位置相關(guān)信息的查詢及更新。查詢通常是與位置相關(guān)的,即使是同一個問題,在不同的地方,所得查詢結(jié)果是不同的,如“最近的超市在哪里?”。移動查詢優(yōu)化技術(shù)是指在傳統(tǒng)分布式數(shù)據(jù)庫查詢優(yōu)化技術(shù)的基礎(chǔ)上,利用多種方法,消除帶寬多樣性、斷接等因素造成的影響,使查詢引擎能夠根據(jù)當(dāng)前可用網(wǎng)絡(luò)條件采取恰當(dāng)?shù)膬?yōu)化策略;同時,針對移動計算機有限電源能力,合理地組織本地數(shù)據(jù)庫管理、遠程數(shù)據(jù)庫訪問等耗電能較多的操作,達到節(jié)能目的,延長關(guān)鍵數(shù)據(jù)的可用時間。
采用基于分割的地址更新策略時,由位置服務(wù)器維護的移動用戶對象包含以下數(shù)據(jù)成員和方法:
分割集合——記錄MSS的分割情況,例如{Cell1,Cell2},{Cell3,Cell4,Cell5};
LOC——記錄移動用戶最近報告的地址(無線單元的ID),例如Cell1;
ERR——移動用戶當(dāng)前所在的分割,例如,若LOC=Cell1,則ERR={Cell1,Cell2};
loc()——一個方法,用于返回該用戶的實際地址,即上面介紹的地址查詢過程。
在移動查詢的應(yīng)用中,有各種各樣涉及地址的查詢,例如“請尋找一家校園附近的超市”,“查找X,Y,Z,這三人都在同一條公路上,且Y在X與Z之間”,等等。一般地,可以把這一類地址相關(guān)查詢表示為:
SELECTx1,x2,…,xn
FROMUsers
WHERE(x1.loc=l1∧…∧xn.loc=ln)∧C(l1,…,ln)∧W(x1,…,xn)
其中C(l1,…,ln)是關(guān)于地址l1,…,ln的n元約束條件,而W(x1,…,xn)是關(guān)于對象x1,x2,…,xn非地址屬性的n元約束條件,Users是所有移動用戶的集合。
3.4移動事務(wù)處理
事務(wù)處理是數(shù)據(jù)庫管理系統(tǒng)的一個基本功能,主要用于維護數(shù)據(jù)的一致性,支持多用戶的并發(fā)訪問,使用戶可以可靠地查詢和更新數(shù)據(jù)庫。一般來說,用戶對數(shù)據(jù)庫系統(tǒng)的訪問都是通過事務(wù)來完成的。在傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)中,一個事務(wù)由一系列讀寫操作組成。事務(wù)處理必須滿足四個準(zhǔn)則,即原子性、一致性、隔離性和永久性(簡稱ACID)。移動計算環(huán)境的特點,使傳統(tǒng)數(shù)據(jù)庫系統(tǒng)中的事務(wù)處理技術(shù)不能滿足移動事務(wù)處理的要求。
通常,將移動客戶機發(fā)出的事務(wù)叫移動事務(wù),它屬于分布事務(wù)。移動事務(wù)處理具有以下特點:
1)移動性。這不僅指移動事務(wù)執(zhí)行期間,發(fā)出事務(wù)的移動客戶機是移動的,而且事務(wù)本身也在相應(yīng)地移動。
2)長事務(wù)。由于無線網(wǎng)絡(luò)通信的低帶寬、高延遲以及移動客戶機的頻繁斷接性,都可能使移動事務(wù)成為長事務(wù)。
3)易錯性。由于移動客戶機不如固定結(jié)點可靠,而且無線網(wǎng)絡(luò)通信也不如固定網(wǎng)絡(luò)穩(wěn)定,因此,與一般事務(wù)相比,移動事務(wù)更容易出錯。
4)異構(gòu)性。由于客戶機的移動性,移動事務(wù)可能要訪問分布的異構(gòu)數(shù)據(jù)庫系統(tǒng)。
總之,移動事務(wù)不同于傳統(tǒng)事務(wù),傳統(tǒng)的ACID模型已不能很好地描述移動事務(wù),需要為移動事務(wù)尋找更好的模型。維護數(shù)據(jù)的一致性和解決過區(qū)切換(handoff)問題是移動事務(wù)管理的重要任務(wù)。
4嵌入式移動數(shù)據(jù)庫的應(yīng)用方向
移動數(shù)據(jù)庫技術(shù)的許多特性都與信息時代的不斷進步的需求相吻合,有著廣闊的發(fā)展空間。
4.1嵌入式移動數(shù)據(jù)庫在物流領(lǐng)域有著廣闊的應(yīng)用前景
物流的信息化在未來的物流發(fā)展中將發(fā)揮日益重要的作用,因為及時準(zhǔn)確的信息有利于協(xié)調(diào)生產(chǎn)、銷售、運輸、存儲等業(yè)務(wù)的展開,有利于降低庫存,節(jié)約在途資金等。在運輸方面,利用移動計算機與GPS/GIS車輛信息系統(tǒng)相連,使得整個運輸車隊的運行受到中央調(diào)度系統(tǒng)的控制。在存儲環(huán)節(jié),帶有嵌入式移動數(shù)據(jù)庫的手持計算機輸入的信息通過無線通信網(wǎng)絡(luò)寫入中央數(shù)據(jù)庫,大大提高了工作效率和信息的時效性,有利于物流優(yōu)化控制。在配送環(huán)節(jié),輸入手持計算機的數(shù)據(jù)通過無線網(wǎng)絡(luò)傳入中央數(shù)據(jù)庫。因此,在投遞的同時,用戶即可查詢物品投遞的情況。
4.2嵌入式移動數(shù)據(jù)庫為移動銀行鋪平了道路
在我國,移動用戶是最具消費潛力的群體,因此針對移動用戶開發(fā)的移動銀行業(yè)務(wù)將具有很大的市場潛力,而且能夠推動移動電子商務(wù)的發(fā)展。移動銀行可以使客戶在異地對自己的帳務(wù)進行實時查詢、交易,方便、省時,降低成本,同時安全可靠,機動靈活。客戶可以在任何時間,任何地點進行交易,節(jié)約了去銀行的時間。出差或旅游在外仍可享受銀行服務(wù)。
4.3嵌入式移動數(shù)據(jù)庫非常有助于提高實地調(diào)查/工作的效率
煤氣、水電等公用事業(yè)檢查員查驗數(shù)據(jù)就是一個很好的應(yīng)用實例,目前一般的檢查員仍然是將檢驗的數(shù)據(jù)記錄在紙上。如果利用移動計算機記錄和傳輸數(shù)據(jù),遇到糾紛時還可以實時地查詢歷史記錄,這將使得我國的公用事業(yè)單位的收費工作大大地改善。
除了上述主要應(yīng)用之外,移動數(shù)據(jù)庫技術(shù)還在零售業(yè)、制造業(yè)、金融業(yè)、醫(yī)療衛(wèi)生等領(lǐng)域展現(xiàn)了廣闊的應(yīng)用前景。隨著移動計算、移動數(shù)據(jù)庫和無線數(shù)據(jù)通信等相關(guān)技術(shù)迅猛發(fā)展,移動數(shù)據(jù)庫將成為信息社會的重要支柱。
5.總結(jié)
本文給出嵌入式移動數(shù)據(jù)庫的定義,描述了嵌入式移動數(shù)據(jù)庫的體系結(jié)構(gòu)并簡單分析它的特點,然后詳細分析了嵌入式移動數(shù)據(jù)庫的關(guān)鍵技術(shù),最后展望了嵌入式移動數(shù)據(jù)應(yīng)用前景。嵌入式移動數(shù)據(jù)的相關(guān)技術(shù)研究不斷取得進步,這為嵌入式移動數(shù)據(jù)的成熟應(yīng)用打下了堅實的基礎(chǔ)。
參考文獻
1李東,曹忠升,馮玉才,等.移動數(shù)據(jù)庫技術(shù)研究綜述[J].計算機應(yīng)用研究,2000(10):4~7
2MadriaSK,MohaniaM,etal.Mobiledataandtransactionmanagement.InformationScience141(2002)279~309
關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)關(guān)聯(lián)規(guī)則
1引言
目前,在需要處理大數(shù)據(jù)量的科研領(lǐng)域中,數(shù)據(jù)挖掘受到越來越多的關(guān)注。我們可以利用數(shù)據(jù)挖掘技術(shù)從海量數(shù)據(jù)中發(fā)現(xiàn)有用信息,幫助商家了解客戶以往的需求趨勢,并預(yù)測未來,從而給商家?guī)砭薮蟮睦麧櫋T跀?shù)據(jù)挖掘領(lǐng)域,采用關(guān)聯(lián)規(guī)則在大型事務(wù)數(shù)據(jù)庫中進行數(shù)據(jù)挖掘是一個重要的研究內(nèi)容。關(guān)聯(lián)規(guī)則是美國IBMAlmadenResearchCenter的RabeshAgrawal等人于1993年首先提出的KDD研究中的一個重要課題。關(guān)聯(lián)規(guī)則挖掘的一般對象是事務(wù)數(shù)據(jù)庫,這種數(shù)據(jù)庫的主要應(yīng)用在零售業(yè),比如超級市場的銷售管理。關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫中不同商品(項)(Item,指事務(wù)中的內(nèi)容,比如,面包、牛奶等都是項目)之間是否存在某種關(guān)聯(lián)關(guān)系。通過這些規(guī)則找出顧客購買行為模式,如購買了某一商品對購買其他商品的影響。發(fā)現(xiàn)這樣的規(guī)則可以應(yīng)用于商品貨架設(shè)計、貨存安排以及根據(jù)購買模式對用戶進行分類。
2關(guān)聯(lián)規(guī)則描述
目前關(guān)聯(lián)規(guī)則挖掘主要考慮支持度和置信度兩個閾值。設(shè)X是項集,T是數(shù)據(jù)庫DB中的任意一個記錄。X的支持度是指支持X的記錄數(shù)與全體記錄數(shù)的比,Support(X)=|{T|TX,T∈DB}|/|DB|。蘊涵關(guān)系X==>Y在數(shù)據(jù)庫DB中的置信度是指同時支持X和Y的記錄數(shù)與支持X的記錄數(shù)之比,即:Confidence(X==>Y)=|{T|TXY,T∈DB}|/|{T|TX,T∈DB}|支持度可理解為在DB中隨機抽取一個記錄,該記錄同時支持X和Y的概率。置信度可理解為在支持X的記錄全體中隨機取一個記錄,該記錄支持Y的概率。
3發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的操作步驟
目前,由于條碼技術(shù)的發(fā)展,顧客在超市中購買商品的信息可以很方便的被存放在數(shù)據(jù)庫中,針對數(shù)據(jù)庫中大量的數(shù)據(jù),我們?nèi)绾伟l(fā)現(xiàn)它們之間存在的關(guān)聯(lián)是本文主要討論的問題。關(guān)聯(lián)規(guī)則的挖掘問題就是在超市事務(wù)數(shù)據(jù)庫DB中找出具有用戶給定的最小支持度和最小置信度的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的挖掘?qū)κ袌稣{(diào)節(jié)和爭取顧客方面的應(yīng)用是極有價值的。因此,有必要采用快速算法從超市事務(wù)數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則。由超市事務(wù)數(shù)據(jù)庫發(fā)現(xiàn)關(guān)聯(lián)規(guī)則挖掘可以分以下兩步完成:
1)找出超市事務(wù)數(shù)據(jù)庫DB中所有大于等于用戶指定最小支持度的項目集,具有最小支持度的項目集稱為頻繁項集。
2)利用頻繁項集生成所期望的關(guān)聯(lián)規(guī)則,即這些規(guī)則必須滿足最小支持度min_supp和最小置信度min_conf。
事實上,第一步的任務(wù)是迅速高效地找出超市事務(wù)數(shù)據(jù)庫DB中全部頻繁項集,數(shù)據(jù)挖掘所面臨的最大的挑戰(zhàn)是計算效率問題,解決這一問題的途徑是產(chǎn)生高效的數(shù)據(jù)挖掘算法,但從超市事務(wù)數(shù)據(jù)庫中產(chǎn)生頻繁項集即費時又占用空間,所以說第一步是關(guān)聯(lián)規(guī)則挖掘的核心問題,是衡量關(guān)聯(lián)規(guī)則挖掘算法的標(biāo)準(zhǔn)。當(dāng)找到所有的頻繁項集后,相應(yīng)的關(guān)聯(lián)規(guī)則將很容易生成,目前大多數(shù)的關(guān)聯(lián)規(guī)則挖掘算法研究是針對第一步而提出的,本文重點討論第一個問題。
4由超市事務(wù)數(shù)據(jù)庫發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的總體設(shè)計
在現(xiàn)有的不少關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法中,最著名的仍然是R.Agrawal本人在他們自己的AIS算法基礎(chǔ)上于1994年提出的Apriori算法,Apriori算法的基本思想是:利用“頻繁項集的所有非空子集都必須也是頻繁的”這一定理對事務(wù)數(shù)據(jù)庫進行多遍掃描。
眾所周知,對數(shù)據(jù)庫的掃描伴隨繁重的磁盤I/O任務(wù),Apriori算法中,掃描次數(shù)較多,這樣就大大限制了挖掘算法的速度。因此,在實際的應(yīng)用中,減少對事務(wù)數(shù)據(jù)庫的掃描次數(shù),有效地減少數(shù)據(jù)的吞吐,將會有效提高算法的效率。為了高效率的由超市事務(wù)數(shù)據(jù)庫中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,本系統(tǒng)在Apriori算法的基礎(chǔ)上采用基于劃分的算法。該算法只對事務(wù)數(shù)據(jù)庫DB掃描兩次,大大減少了I/O操作,從而提高了算法的效率。
通過劃分方法進行數(shù)據(jù)挖掘的過程如下圖所示:
本系統(tǒng)的總體設(shè)計包含三部分:
(1)在服務(wù)器端第一次掃描超市事務(wù)數(shù)據(jù)庫中的表,按照超市事務(wù)數(shù)據(jù)庫中不同項集的數(shù)量,以及兼顧客戶端計算機硬件配置,對其進行數(shù)據(jù)分塊,分塊的大小選擇要使得每個分塊可以被放入主存。
(2)在各個客戶端計算機上,利用并行技術(shù)分別訪問服務(wù)器上的數(shù)據(jù)分塊,求出各數(shù)據(jù)分塊所對應(yīng)的局部頻繁項集,并將所求局部頻繁項集存入服務(wù)器的一個指定表中。
(3)在服務(wù)器端,匯總各個分塊數(shù)據(jù)生成的局部頻繁項集,第二次掃描超市事務(wù)數(shù)據(jù)庫中的總表,最終生成全局頻繁項集。
系統(tǒng)的總體設(shè)計可以如下圖2應(yīng)用程序總體設(shè)計所示。
一旦由超市事務(wù)數(shù)據(jù)庫DB中的事務(wù)找出頻繁項集,由它們產(chǎn)生強關(guān)聯(lián)規(guī)則是直截了當(dāng)?shù)摹K^的強關(guān)聯(lián)規(guī)則是指滿足最小支持度和最小置信度的規(guī)則。
數(shù)據(jù)庫營銷指的是企業(yè)通過收集和積累消費者的大量信息,經(jīng)過處理后預(yù)測消費者有多大可能去購買某種產(chǎn)品,以及利用這些信息給產(chǎn)品以精確定位,有針對性地制作營銷信息,以達到說服消費者去購買產(chǎn)品的目的。
因為旅游規(guī)劃的本質(zhì)是為區(qū)域旅游的發(fā)展指明方向,提供戰(zhàn)略指導(dǎo),為近期的規(guī)劃開發(fā)提出具體的、實際性的指導(dǎo),滿足市場需求的同時,取得利潤的最大化。因此,本文試圖以數(shù)據(jù)庫營銷的核心貫穿整個旅游規(guī)劃的過程,從三個方面:規(guī)劃的客源市場調(diào)查、具體市場營銷方式、規(guī)劃完成后的跟蹤來闡述數(shù)據(jù)庫營銷的重要性,有別于以前的就營銷而論營銷的做法,以求給以后的旅游規(guī)劃提供些許指導(dǎo)與借鑒。
一、問題的提出
目前的旅游規(guī)劃文本當(dāng)中的市場營銷方式大部分仍是以傳統(tǒng)的營銷方式為主,沒有充分考慮客源市場的需求,就營銷論營銷,沒有把營銷的理念貫穿于整個規(guī)劃的過程,缺乏整體的營銷觀念,在客源市場調(diào)查的過程當(dāng)中,對消費者需求的調(diào)查成分偏少,即使有,在后續(xù)的旅游產(chǎn)品設(shè)計中也難以體現(xiàn),降低了客源市場的滿意度。
另外一種情況是在傳統(tǒng)的營銷方式的基礎(chǔ)上,間雜著一些現(xiàn)代營銷方式的手段,如電話營銷、電郵營銷、短信營銷等,都是在探索現(xiàn)代營銷方式,但往往不成體系,在具體的運用過程當(dāng)中,往往是傳統(tǒng)營銷方式的附庸,難以形成實際的效果。
第三種情況是指目前的旅游規(guī)劃文本在指導(dǎo)具體的區(qū)域旅游實踐當(dāng)中的精準(zhǔn)性不夠,難以跟上外界環(huán)境的變化,沒有充分考慮外界環(huán)境的變化,導(dǎo)致規(guī)劃文本束之高閣,沒有用處,資源浪費,規(guī)劃文本的完成并不意味著規(guī)劃過程的完成,規(guī)劃的過程是一個反復(fù)修正的過程,是在具體的實踐中檢驗的過程。
二、問題的分析
針對上述問題,本文試圖從現(xiàn)代營銷的手段之?dāng)?shù)據(jù)庫營銷的角度去分析,以其核心觀念貫穿整個規(guī)劃過程,用以指導(dǎo)具體的規(guī)劃過程。
(一)客源市場調(diào)查中的數(shù)據(jù)庫營銷
每一個旅游規(guī)劃在具體實施之前,都必須要進行客源市場的調(diào)研,了解客源市場的基本情況及消費需求,有必要的話,還依據(jù)不同的指標(biāo),進行客源市場的細分,以求在具體的規(guī)劃過程中能精確定位,投放產(chǎn)品。目前的客源市場調(diào)查最常用的是問卷調(diào)查,輔之以訪談、電話調(diào)查等方式,(在不考慮樣本是否科學(xué)性的基礎(chǔ)上)得到客源市場消費者的主觀、客觀數(shù)據(jù),進行數(shù)據(jù)的分析、加工。
可以看出客源市場的這種調(diào)查方式是一次性的,消費者在規(guī)劃進行過程當(dāng)中的需求變化及客觀環(huán)境的變化并沒有考慮,也就是說規(guī)劃默認為客源市場的需求及消費模式短期內(nèi)是不會變化的,其實不然,環(huán)境在時時刻刻的變化,消費者的心理也在時時的變化,因此,在此基礎(chǔ)上,可以嘗試建立所調(diào)查樣本的數(shù)據(jù)庫,以一定的周期為間隔,采取各種數(shù)據(jù)庫營銷方式進行樣本的調(diào)研,對每一個細分市場的樣本進行歸類分析,指導(dǎo)規(guī)劃的進行。
(二)以數(shù)據(jù)庫為基礎(chǔ)的旅游市場營銷模式
傳統(tǒng)的旅游市場營銷方式以產(chǎn)品、價格、分銷、促銷為模式,以遠遠不能滿足現(xiàn)有的消費者的需求,事實證明,這種傳統(tǒng)的、不考慮市場的營銷方式是不科學(xué)的,在旅游規(guī)劃過程當(dāng)中應(yīng)該予以摒棄。取而代之的應(yīng)該是以消費者為中心的消費者、成本、方便、溝通為模式的“4C”策略,而數(shù)據(jù)庫營銷是這一策略的最直接的體現(xiàn),因此,在旅游規(guī)劃創(chuàng)作過程當(dāng)中,其基本的營銷方式應(yīng)該以定向直郵,電子郵件營銷,網(wǎng)絡(luò)傳真營銷和短消息服務(wù)等在內(nèi)的多種形式的數(shù)據(jù)庫營銷手段為主,深挖其具體內(nèi)涵,延展其多種利用方式。
通過數(shù)據(jù)庫了解旅游者的興趣愛好后,就可以在宣傳冊的封面上貼上他們喜歡的產(chǎn)品圖或直接與他們在互聯(lián)網(wǎng)上進行交流,當(dāng)然交流的內(nèi)容是他們感興趣的話題,這樣有利于加強與旅游者或潛在旅游者的關(guān)系。例如,旅行社利用自己的網(wǎng)站,運用數(shù)據(jù)庫跟蹤旅游者的習(xí)慣和興趣愛好,以此為根據(jù)向旅游者推薦他們感興趣的旅游線路。對旅游者了解得越多,就越能更好地幫助旅游者解決旅游購買過程中的問題,最后與旅游者建立起良好的商業(yè)關(guān)系,提升旅游企業(yè)的競爭力,并最終促進旅游業(yè)的發(fā)展。轉(zhuǎn)(三)規(guī)劃文本完成后的數(shù)據(jù)庫營銷
規(guī)劃文本完成以后在具體指導(dǎo)實踐的過程中應(yīng)該結(jié)合環(huán)境的變化不斷修正。
可以結(jié)合客源市場調(diào)查中所建立的數(shù)據(jù)庫進行再次調(diào)查,不斷反復(fù),切實修正提供給消費者的旅游產(chǎn)品的可行性,以求“適銷對路”,另一方面,服務(wù)行業(yè)的這種數(shù)據(jù)庫營銷有點類似于物質(zhì)生產(chǎn)部門的“售后服務(wù)”,具體來講,指的是在規(guī)劃的實施過程當(dāng)中,對客源市場或是部分游客進行回訪,收集旅游者的信息,建立數(shù)據(jù)庫,分析改進。
通過數(shù)據(jù)庫資料可分析出旅游者的價值取向,然后針對不同旅游者提供不同類型的旅游產(chǎn)品展示、廣告宣傳和銷售方式。一般來說,對旅游者了解越多,就越能提供令其滿意的旅游產(chǎn)品和服務(wù)。
三、問題的解決
規(guī)劃的本身就是一個營銷的過程,關(guān)鍵是采取什么樣的營銷模式以及如何采用的問題,從上述分析,可以看出,營銷的思想貫穿于規(guī)劃的始終,客源市場的調(diào)研并不僅僅是一個直線式的過程,而更多的是一個循環(huán)往復(fù)的過程,規(guī)劃是一個彈性的過程,是一個不斷修正的過程,對于旅游者的營銷是長期的過程,也是一個培養(yǎng)潛在消費者的過程。具體的數(shù)據(jù)庫營銷方式有很多,具體采取哪種方式或是幾種方式的組合,應(yīng)該根據(jù)客源市場的情況來定。
四、數(shù)據(jù)庫營銷在旅游規(guī)劃中應(yīng)該注意的問題
(一)從戰(zhàn)略的高度來看待數(shù)據(jù)庫營銷的作用
旅游規(guī)劃應(yīng)該用戰(zhàn)略的眼光、用資產(chǎn)的眼光來看待營銷數(shù)據(jù)庫,特別是應(yīng)認識旅游者信息的真正價值,將規(guī)劃所涉及到的旅游企業(yè)規(guī)劃從“管理信息”向“利用信息”轉(zhuǎn)化。企業(yè)應(yīng)切實地制定出營銷信息戰(zhàn)略,對信息收集、維護和利用進行詳細的規(guī)劃和評估,從而將數(shù)據(jù)庫營銷提升到旅游企業(yè)戰(zhàn)略的層次上,從戰(zhàn)略的高度來看待數(shù)據(jù)庫營銷的應(yīng)用。
(二)確保信息的真實性、一致性和規(guī)范化
確保數(shù)據(jù)庫營銷中的所有數(shù)據(jù)和活動都可以按照一定的規(guī)則度量,能滿足決策分析的需要。