首頁 > 精品范文 > 統(tǒng)計學變量的定義
時間:2023-07-24 16:15:57
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇統(tǒng)計學變量的定義范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
統(tǒng)計學是一門基于試驗數(shù)據(jù)的搜集、整理,對研究目標的統(tǒng)計性質(zhì)進行分析和推斷的學科,更是一門綜合運用數(shù)學科學、計算機科學、信息學等工具學科、并與自然科學、社會科學相結合的多學科相交叉的邊緣學科。在我國,早期的統(tǒng)計學設置比較狹隘,多作為數(shù)學學科的概率統(tǒng)計和經(jīng)濟學科的經(jīng)濟統(tǒng)計等子學科。直到 1998年,國家教育部設立了統(tǒng)計學專業(yè)[1],2011年頒布的《普通高等學校本科專業(yè)目錄》更把統(tǒng)計學提升為一級學科!由此可見,統(tǒng)計學的專業(yè)地位及其重要性得到了廣泛的認可。
與之相反,關于統(tǒng)計學專業(yè)教學的研究還處于起步階段。相比于其他大類專業(yè)的教學研究,關于統(tǒng)計專業(yè)教學的教學語言設計的研究還未得到深入發(fā)展。
教學語言是一類廣義的語言,是教學者與教學對象的多種感官的交流;同時,也是一種人文文化的載體,是一種民族文化的展示。教學語言的設計,就是通過調(diào)動教學對象的聽覺、視覺、感覺等多方面來實現(xiàn)教學目標。
統(tǒng)計學專業(yè)的教學語言主要包括:口語語言、文字語言、符號語言、圖表語言和肢體語言,本文將從上述五個方面對統(tǒng)計學專業(yè)的教學語言設計展開討論與研究。
一、充分運用口語語言闡述教學內(nèi)容
口語語言,是教學內(nèi)容闡述的主要載體之一,是師生之間思想、情感交流的主要工具。由于統(tǒng)計學是與自然科學、社會科學相結合的多學科相交叉的邊緣學科,統(tǒng)計學專業(yè)教學的口語語言與一般教學的口語語言既有聯(lián)系,又有區(qū)別,主要具有以下特點:
1.對于基礎理論的教學,口語語言要準確、規(guī)范
由于統(tǒng)計學的基礎理論主要是基于各種模型,通過邏輯推導來進行分析和推斷,并以高等數(shù)學形式來描述,因此相關教學的口語語言應以標準的數(shù)學口語語言來準確、規(guī)范地闡述相應的數(shù)學理論,特別要注意相應的模型理論的提出和邏輯關系的表述、推導等,依此來幫助學生準確地理解、把握統(tǒng)計學的基礎理論; 同時,對復雜的邏輯關系及符號含義,要做出準確的表述,幫助學生在有限的課堂教學時間內(nèi)了解、體會相應的含義,并能進行熟練、獨立的運用。
2.對于后續(xù)課程的具體教學內(nèi)容,口語語言要親切、生動
在針對特定的知識點的教學過程中,教師要通過口語設計,把抽象的數(shù)學理論轉換為具體的形象感覺,并結合適當?shù)默F(xiàn)實案例加以說明。特別是抽象的概念,比如隨機過程中“下鞅”、“上鞅”、“鞅”以及“遍歷性”等概念,要努力避免平鋪直敘、照本宣科地進行授課,而是把該概念與日常實例相結合。
該定理是其后重要結論的基礎,具有重要意義,但其證明太過數(shù)學化,因此在課堂教學中,并不進行證明,而采用簡明的語言來進行說明。對第一個不等式,可以強調(diào)為“在每個樣本點上,取所有隨機變量的最小值,做成一個新的隨機變量,它的均值不會大于所有隨機變量先做平均再取最小的那個值”,即“最小值的期望,小于等于期望的最小值”;從而整個定理敘述為“最小值的期望,小于等于期望的最小值,小于等于期望的最大值,小于等于最大值的期望”。
由此可見,在課堂教學過程中,通過語言設計來調(diào)動學生的積極性,再結合語音、語調(diào)、語速等變化來突出重點、強調(diào)難點、控制教學節(jié)奏,可以讓學生更好地理解具體教學內(nèi)容。
二、準確運用文字語言刻畫基本內(nèi)容
文字語言,是教學內(nèi)容可視化的主要載體之一,是學生明確認知教學內(nèi)容的主要途徑。統(tǒng)計學專業(yè)教學的文字語言的“準確性”,應具有如下特點:
1.對于基礎理論的教學,注重文字語言的“數(shù)學性”
由于統(tǒng)計學是以數(shù)學理論為基礎的,因此,文字語言要符合數(shù)學描述的一般要求;同時,也要注重結合教學目的,進行適當?shù)恼{(diào)整來強調(diào)重點。
比如,統(tǒng)計量的定義:“設x1,x2,…,xn為取自某總體的樣本,若樣本函數(shù)T=Tx1,x2,…,xn中不含有任何未知參數(shù),則稱T為統(tǒng)計量”。在該定義中,應當注意三個非常重要的細節(jié):“x1,x2,…,xn”、“任何”和“未知”。如果在教學過程中,不強調(diào)這幾個細節(jié),就可能忽略了小標“n”這個已知參數(shù),從而產(chǎn)生對統(tǒng)計量概念的混淆,影響對統(tǒng)計量“樣本均值”的認識。
2.對于后續(xù)課程的案例教學,強調(diào)文字語言的“概括性”
統(tǒng)計學處理的是實際的、非數(shù)學的對象,特別是一些來自社會經(jīng)濟活動的、真實物理環(huán)境的或現(xiàn)實遺傳學科的具體實例。此時的文字語言,不僅要具有抽象性,拋棄不必要、不相關的、過多的背景描述,還要樸實易懂,最大限度地概括試驗的理論背景、數(shù)據(jù)的研究意義。其意義在于,既利于學生理解研究的問題,明確研究的目標,同時也為學生的思考留出相應的空間。
三、簡明地運用符號語言,壓縮復雜意義
符號,是一些基本概念、基本性質(zhì)、運算法則的縮寫;符號語言,就是利用基本符號,以簡單、明確和形式化的方式來簡化復雜關系及大量文字性描述。在形式上,符號語言可以簡化計算和推理過程,明確其中的邏輯過程,展現(xiàn)其抽象性;在意義上,通過結合具體試驗背景,符號語言精練了相關信息的描述,體現(xiàn)其簡潔性。由此可見,符號語言對相應學科的發(fā)展、傳播和普及都有重要的推動作用。
對統(tǒng)計學專業(yè)而言,其基礎理論部分的符號語言基本與高等數(shù)學的符號語言是相似的,因此,在教學過程中,教師要有意識地訓練學生對符號的靈活運用,并提及相應符號的意義。
對統(tǒng)計專業(yè)低年級學生,教師要通過符號語言的設計,消除學生對符號的陌生感,使學生牢固地掌握各類符號的意義,熟練地運用各類符號描述相對復雜的含義,并將復雜的文字性描述利用符號來進行簡化描述,進而培養(yǎng)學生利用符號語言來壓縮復雜意義的能力。
例如,在概率統(tǒng)計中,隨機變量的期望EX是一個重要概念,通過不同的角度可以得到不同形式的符號描述。在符號語言下,概率空間記為Ω,F(xiàn),P,隨機變量記為X,對應的密度函數(shù)和分布函數(shù)分別記為px和Fx,從而隨機變量的數(shù)學期望EX有如下表述記為
其中,EX是數(shù)學期望(expectation)的符號,第一個等式為實空間R中的數(shù)學期望描述,這是一般概率論中的結論;第二個等式為實空間中的一般隨機變量的數(shù)學期望表達式;第三個等式則為在概率空間Ω,F(xiàn),P中的描述形式,是Riemann-Stieltjes積分,這是在隨機分析范圍下常用的描述方式。因此,在教學過程中,教師應強調(diào)上述關系式的意義及使用范圍。
再如Lindeberg-Levy中心極限定理:設{Xi}∞i=1是相互獨立、同分布的隨機變量序列,且EXi=μ,VarXi=σ2& gt;0都存在;若記Y*n = X1 + X2 + 上述定理中的符號沿襲了高等數(shù)學的符號方式,同時,將σn改寫為nσ2,其目的在于強調(diào)正態(tài)分布關于參數(shù)μ和σ2的依賴關系。強調(diào)這種依賴關系,有利于學生對正態(tài)分布的掌握,進一步明確隨機變量與其特征參數(shù)的關系,也為后續(xù)其他重要分布和統(tǒng)計量的學習奠定基礎。
對統(tǒng)計學專業(yè)高年級的學生,教師要注意引導學生基于基本符號,在特定的實際問題中,創(chuàng)造性地定義一些新符號,并賦予明確的含義,從而把特定問題進行符號化描述,簡化統(tǒng)計分析、推斷過程。這里需要注意的是,所定義的新符號首先要遵循一般的符號原理與意義,不只是符號的數(shù)學意義,還有在特定問題下的符號意義;其次,滿足問題分析的需要,充分利用特有名詞的縮寫、符號的上、下標等。
比如,在回歸分析中,基于多變量的多項式回歸模型中,因變量y關于自變量x1,x2的二元二次回歸模型為:y = β0 + β1 x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1 x2 + ε。在該表達式中,β的小標1、2分別代表與變量x1,x2有關,而重復出現(xiàn)的次數(shù)則表征了相應變量的階數(shù)。因此,建議在教學過程中,對該類下表可以進行改進,比如將β12改記為β1,2,即下標中的“12”改為“1,2”,通過添加“,”進一步明晰變量的交互關系。
四、合理運用圖表語言,明晰基本關系
圖表語言,是利用圖像、表格等直觀的形象來描述復雜的概念、關系以及抽象數(shù)據(jù)所具有的含義。與符號語言的簡潔和抽象相比,圖表語言更具形象、直觀的特性,能記錄數(shù)量變化趨勢、表達變量之間的關系以及展現(xiàn)概念之間的相關關系,因此,在統(tǒng)計學專業(yè)教學中,圖表語言具有非常重要的意義與作用。
1.數(shù)據(jù)圖表,記錄數(shù)量變化趨勢
數(shù)據(jù)圖表,主要是對試驗結果所獲得的數(shù)據(jù)的形象表達,比如某地區(qū)的生產(chǎn)總值、居民消費額、空氣中污染物含量等具體數(shù)據(jù)的excel表格或柱狀圖,以及對抽象數(shù)據(jù)處理之后所形成的頻數(shù)直方圖、頻率直方圖、盒子圖等。依據(jù)不同的目的,選用不同的數(shù)據(jù)圖表來說明進行統(tǒng)計分析的依據(jù),并掌握進行統(tǒng)計推斷的方向。
2.分析圖表,表達變量之間的關系
分析圖表,主要是指基于概率論與統(tǒng)計分析所得到的分析結論的圖表,目的在于展示分析結論,進而解釋變量關系。主要包括:(1)教材所附的典型分布的分布表,如正態(tài)分布表、F分布表、t分布表等;(2)數(shù)據(jù)分析表,如回歸分析中所得到的Model Summery、ANVOA、Coefficients等;(3)結論預測表,如變量擬合圖、時間序列分析表等。
3.關系圖表,展現(xiàn)概念之間的相關關系
關系圖表,主要是指為了那些抽象描述多個概念之間的相關關系,是對各種概念、方法、思想等的總體描述。從大的角度上講,借助于關系圖表,學生對統(tǒng)計學的發(fā)展、不同統(tǒng)計思想與方法間的異同等方面,會形成整體認識,常見于導論一類課程。從小的角度上講,通過建立關系圖表,學生可以進一步區(qū)分具體的概念,深化知識點的理解和運用。
五、巧妙運用肢體語言,深化教學效果
肢體語言,主要是指教師在教學過程中通過動作、姿勢、表情等肢體的動作和變化來傳達教學內(nèi)容、實現(xiàn)教學目的的行為。首先,肢體語言具有形象、生動、操作性強;其次,易于學生的模仿與體會,以形成對抽象概念的形象認識;再次,可以很好地控制教學進程,如加速新課程的引入、教學內(nèi)容的轉換等。同時,可以活躍課堂氣氛,調(diào)動學生的積極性,傳遞教師對學生的關懷。
總之,教學設計是指為實現(xiàn)教學目標,教師依據(jù)學習原理和教學理論,對各個環(huán)節(jié)進行具體計劃,進而形成完整、有效的教學方案的過程。為了充分、有效地利用課堂教學,教師應該運用多種方法和技巧來實現(xiàn)與學生的交流。因此,教學語言的設計就顯得更為重要。通過不斷地研究與實踐,教師的教學語言設計能力將會得以豐富和提高,取得事半功倍的效果。
隨著社會的發(fā)展,大數(shù)據(jù)時代的到來,統(tǒng)計思想與技術日益受到重視,統(tǒng)計人才更是供不應求。為更好地培養(yǎng)社會所需的專業(yè)技術人才,作為統(tǒng)計學專業(yè)的教師,在日常的教學過程中,應該深刻地考慮教學語言的設計,從而更好地實現(xiàn)教學目標,努力做到知識、技術、思想的傳播,也做到人文關懷的傳承,培養(yǎng)出一批具有社會責任感的專業(yè)人才。
關鍵詞:生物統(tǒng)計學;SPSS;考核方式;改革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2015)18-0247-02
生物統(tǒng)計學是數(shù)理統(tǒng)計方法在生物科學領域的應用,它主要是研究數(shù)據(jù)資料的收集、整理、分析和解釋的科學[1]。生物統(tǒng)計學是我院動物科學、動物醫(yī)學、動物藥學、動植物檢疫、水產(chǎn)飼草等專業(yè)的專業(yè)基礎課,由于該課程理論抽象、公式繁多、內(nèi)容枯燥,是學生們普遍認為難學的一門課程[2]。實驗教學是培養(yǎng)學生理論聯(lián)系實際,提高創(chuàng)新意識和實踐能力的重要環(huán)節(jié)。在生物統(tǒng)計學的教學工作中充分認識并落實實驗教學的地位,對于培養(yǎng)學生運用數(shù)理統(tǒng)計方法解決生物學領域問題的能力、增強創(chuàng)新意識、提高人才培養(yǎng)質(zhì)量有著重要的作用[3]。可見實驗教學在生物統(tǒng)計學中占有重要地位,因此我們應該注重實驗教學環(huán)節(jié)并對其適時改革。
一、SPSS在生物統(tǒng)計學上機實驗中的應用
目前,在生物統(tǒng)計學上機實驗課中,可選用的軟件有Excel、SPSS、SAS、Oringin和R軟件等[4-7]。其中SPSS為專業(yè)統(tǒng)計軟件,其統(tǒng)計分析功能較強,是復雜、大型統(tǒng)計分析中的常用工具[8]。SPSS即社會科學統(tǒng)計軟件包是世界著名的統(tǒng)計分析軟件之一,“易學、易用、易普及”是SPSS軟件最大的競爭優(yōu)勢,也是廣大數(shù)據(jù)分析人員對其偏愛有加的主要原因。SPSS主要具有以下優(yōu)點:大量成熟的統(tǒng)計分析方法、完善的數(shù)據(jù)定義操作管理、開放的數(shù)據(jù)接口、靈活的統(tǒng)計表格和統(tǒng)計圖形。因此我們在實驗教學中首選SPSS軟件作為上機用統(tǒng)計軟件。由于SPSS軟件版本多,而且多為英文版,對于初學者來說中文版本更為適合,因此我們專門購買了SPSS17中文多國語言版本。
SPSS軟件運行時有多個窗口,各窗口有各自的作用,但是想快速入門,只需要熟悉兩個基本窗口即可,他們是數(shù)據(jù)編輯窗口(SPSS Data Editor)和結果輸出窗口(SPSS Viewer)。數(shù)據(jù)編輯窗口是SPSS的主要程序窗口(見圖1),其功能主要是定義SPSS數(shù)據(jù)的結構、錄入數(shù)據(jù)和管理數(shù)據(jù)。數(shù)據(jù)的錄入一般分兩種方法:(1)在數(shù)據(jù)編輯窗口里,新建數(shù)據(jù),首先打開數(shù)據(jù)編輯窗口的左下方“變量視圖”,在里面定義需要錄入數(shù)據(jù)的變量名稱以及其他選項,如圖1中的“品種”、“血糖值”就是變量名,然后回到數(shù)據(jù)視圖,可以在定義好的變量下錄入相應的數(shù)據(jù)。(2)在數(shù)據(jù)編輯窗口里,可以直接打開已經(jīng)存在的數(shù)據(jù),如“.cav、.xls、.dbf、.txt”等形式的數(shù)據(jù)資料。SPSS結果輸出窗口是SPSS的另一個主要窗口(見圖2),它的主要功能是顯示管理SPSS統(tǒng)計分析結果、報表及圖形。SPSS結果輸出窗口中顯示的結果等信息可以保存起來,以后需要時候可以再打開查看結果。
二、數(shù)顯互動系統(tǒng)在生物統(tǒng)計學上機實驗中的應用
生物統(tǒng)計學的上機操作實驗環(huán)節(jié)可以提高學生的動手能力,還可以提高其解決實際問題的能力。但是對于從未接觸過SPSS統(tǒng)計軟件的初學者來說,只是口述SPSS統(tǒng)計軟件的各種操作是不夠的,學生不容易接受,而且會手忙腳亂。因此我們使用的是Motic第二代數(shù)碼顯微互動系統(tǒng),該系統(tǒng)由教師主控單元、學生終端單元和鏈接教師和學生間的網(wǎng)絡系統(tǒng)三部分組成。該系統(tǒng)的優(yōu)點在于可進行圖像的實時數(shù)字傳輸,實現(xiàn)師生雙向信息互動和文件傳送[8]。
生物統(tǒng)計學的整個上機實驗過程主要包括以下幾個環(huán)節(jié):(1)老師演示:學生上機操作前老師要以例題的形式進行講解和操作,教師通過數(shù)碼互動系統(tǒng)在主控單元計算機屏幕進行數(shù)據(jù)分析操作,每名學生坐在自己的電腦前就可以從電腦上看到教師分析數(shù)據(jù)時的每一個操作動作,這樣可以使得學生很快就掌握了該次上機的詳細操作步驟。(2)學生操作:學生針對本次實驗內(nèi)容自己上機運用SPSS軟件進行相應的統(tǒng)計分析,在這個環(huán)節(jié)里如果學生遇到不會操作的地方,可以舉手向老師請教,在老師的指導下能夠順利完成實驗內(nèi)容。(3)寫電子版實驗報告:只用SPSS分析完數(shù)據(jù)還不夠,還要會分析最終結論(即統(tǒng)計推斷)。因此學生要把實驗的主要結果(圖、表等)和最終結論填寫到實驗報告中。最終以Word的形式通過Email發(fā)送給老師。
三、生物統(tǒng)計學上機考核方式的改革
考核方式的改革是生物統(tǒng)計學實驗教學改革的重要組成部分。合理的考核評價體系,對于客觀、全面評價學生的學業(yè)水平和引導學生的學習方向上發(fā)揮著重要作用,能夠達到調(diào)動學生積極性,提高學生學習效率的目的[3]。以往的上機考核多以上機實踐總結和考勤作為評分標準,學生在寫上機實踐總結時往往存在抄襲,而且文筆好的學生寫的總結內(nèi)容豐富全面,可能得了高分,這樣對于學生的動手能力和水平難以準確地給予評價。因為我們針對上機考核方式進行了一些改革。在上機考核中增加了電子實驗報告和上機考試這兩部分。電子實驗報告是每次實驗課上當堂完成實驗操作結果那部分,既可以作為檢驗學生對每節(jié)實驗課是否掌握的依據(jù),還可以提高學生的電腦運動能力(Word)。上機考試主要是針對整個上機實驗內(nèi)容進行抽樣考試,我們事先出各種類型的試卷,針對不同的班級隨機抽取一個類型的試卷進行上機考試,因為班級多,而計算機機房的電腦有限,只能采用各個班級輪流上機考試。為了杜絕了不同班級考題一樣及考題外漏等問題,我們分別出了A、B、C等多種類型試卷。最終,上機總分=考勤(10%)+電子實驗報告(20%)+上機考試(70%)。
四、結語
通過以上SPSS軟件的應用、數(shù)顯互動系統(tǒng)的應用以及多元化評定上機考核等方面的改革與實踐,使得學生對生物統(tǒng)計學的學習、理解、操作等情況能夠及時反饋給老師,老師可以根據(jù)情況不斷完善實驗教學方法和手段,從而提高實驗教學效果,同時增強了學生的動手能力和解決實際問題能力。學以致用是生物統(tǒng)計學最重要的特點之一,因此不僅要求學習者掌握知識,更要學會應用知識[9]。尤其是在做本科生或研究生畢業(yè)論文的時候,學生應該能夠獨立完成合理試驗的設計,運用SPSS統(tǒng)計軟件,針對不同數(shù)據(jù)進行分析,完成高質(zhì)量的畢業(yè)論文。
參考文獻:
[1]張勤.生物統(tǒng)計學[M].第2版.中國農(nóng)業(yè)大學出版社,2008.
[2]白俊艷,賈小平,張小輝,等.生物統(tǒng)計學課程改革與實踐[J].畜牧與飼料科學,2013,34(10):57-60.
[3]張強,張建平.生物統(tǒng)計學實驗教學的探索與實踐[J].實驗室科學,2012,15(6):15-18.
[4]梅花,白乙爾圖.SPSS統(tǒng)計軟件在《生物統(tǒng)計學》教學中的實例應用[J].中國畜牧獸醫(yī)文摘,20l2,(7):217.
[5]朱水平.生物統(tǒng)計學實驗教程[M].云南科技出版社,2006.
[6]姜紅霞.origin軟件在生物統(tǒng)計學教學中的應用[J].陜西教育:高教版,2009,(3):82-83.
[7]馬相如.自由軟件R及其在生物統(tǒng)計學教學中的使用[J].科技傳播,2010,(3):81-82.
【摘要】 目的:通過幽門螺桿菌與胃癌癌前病變關系研究的資料,探討單獨二分類Logit模型中有序分類資料中的應用。方法: 選擇293名患有輕度萎縮性胃炎的患者,對病變進展的影響因素分析分別采用累積比數(shù)Logit模型和單獨的二分類Logit模型,并對兩種模型的分析結果進行比較。結果:累積比數(shù)Logit模型分析結果顯示幽門螺桿菌感染對胃癌癌前病變的影響無統(tǒng)計學意義(OR=1.158,95%CI:0.986~2.464),但得分檢驗發(fā)現(xiàn)幽門螺桿菌不滿足累積比數(shù)Logit模型的比例優(yōu)勢假定條件(χ2=24.100,P
【關鍵詞】 胃癌癌前病變; 幽門螺桿菌; 累積比數(shù)Logit模型; 單獨的二分類Logit模型
有序分類資料最常用的分析方法是累積比數(shù)Logit模型[1],對多分類有序反應資料,如果采用一般的二分類Logit模型,而不是累積比數(shù)Logit模型,只能獲得50%~70%的檢驗效能[2],說明在處理有序分類數(shù)據(jù)方面,累積比數(shù)Logit模型要優(yōu)于二分類Logit模型。近幾年累積比數(shù)Logit模型在國內(nèi)應用領域有所增多,但不少忽略了模型的使用條件,盲目套用,以致影響所得結論的可靠性。本研究通過累積比數(shù)Logit模型在實際數(shù)據(jù)分析中的應用,說明了忽視模型應用條件所產(chǎn)生的后果,并介紹了如何選擇恰當?shù)姆治龇椒ā?/p>
1 資料與方法
1.1 資料來源
資料來源于1項茂名市某醫(yī)院的隊列研究數(shù)據(jù),該研究選擇了360名輕度慢性萎縮性胃炎(CAG)患者,根據(jù)他們的幽門螺桿菌(Hp)感染情況分為陰性組和陽性組兩組人群,隨訪3年后重新進行病理學診斷,觀察他們的病變情況。
1.2 胃黏膜病理診斷
用胃內(nèi)窺鏡觀察胃黏膜病變,并在胃體大小彎、胃角、胃竇大小彎、前后壁各取胃黏膜活檢組織1塊。病理切片照全國胃、十二指腸活檢、病理診斷標準進行診斷。每個受檢對象以最嚴重病變?yōu)榈谝辉\斷。
1.2 統(tǒng)計分析方法
累積比數(shù)Logit模型的形式為[3]:Logit(P(Y≤k|X))=ln(P(Y≤k|x)1-P(Y≤k|x))=ak-pi=1βixi ,k=1,2,…,K-1。 (1)反應變量Y為K個等級的有序變量,第k(k=1,2,…,K)類的概率分別為{π1,π2,…,πk},且Kk=1πk=1 。影響因素xT=(x1,x2,…,xP)為解釋變量,xi(i=1,2,…,p)可以是連續(xù)變量、無序或有序分類變量。則該模型實際上是將K個等級人為地分成{1,…,k }和{k+1,…,K}兩類,在這兩類基礎上定義的Logit P表示屬于前k個等級的累積概率(P(Y≤k|x))與后K-k個等級的累積概率(1-P(Y≤k|x))的比數(shù)之對數(shù)。故該模型稱為累積比數(shù)模型,其應用有一個基本的假定條件,即比例優(yōu)勢假定(proportional odds assumption)。這一條件要求自變量的回歸系數(shù)應與分割點k無關,換句話說,無論從哪一點分類,對所有的累積logit,變量xk都有一個相同的βk估計。
單獨的二分類logit模型(separate binary logistic modes)主要是把反應變量按照不同分割點合并為不同的二類,然后分別進行二分類的Logistic回歸分析[4]。本研究中的反應變量為隨訪5年后的病變,分為輕度CAG、重度CAG、腸上皮化生(IM)、不典型增生(DYS)共4類,有3個分割點,故定義為3個二分類Logit:一是將IM、重度CAG和輕度CAG合并,即{DYS}VS{IM,重度CAG,輕度CAG},表示至少進展到DYS;二是將DYS和IM合并,重度CAG和輕度CAG合并,即{DYS,IM}VS{重度CAG,輕度CAG},表示至少進展到IM;三是將DYS、IM和重度CAG合并,即{DYS,IM,重度CAG}VS{輕度CAG},表示至少進展到重度CAG。然后以上述分類分別作3次二分類的logistic回歸分析。整個分析過程均由SAS 8.2(SAS Institute, Cary,N.C.)來完成[5]。
2 結果
經(jīng)3年隨訪后,共67人因各種原因失訪,293人具有可供分析的完整資料。其中,118人病變?nèi)詾檩p度CAG,91人進展為重度CAG,49人進展為IM,35人進展為DYS。具體進展情況見表1。
累積比數(shù)Logit模型分析結果表明(表2),除性別因素外,其他因素對胃癌癌前病變的影響均無統(tǒng)計學意義。但從得分檢驗(score test)結果來看(表3),Hp不滿足比例優(yōu)勢假定條件(χ2=24.100,P
為了核實結果的正確性,并充分利用該資料有序的特點,故采用單獨的二分類Logit模型進一步分析(表4),可以看出,年齡、性別、吸煙、飲酒這四個變量在不同分割點的OR值相差不大,而Hp的OR值則差別很大。把DYS、IM和重度CAG合并為一類(即“至少進展為重度CAG”)時,Hp的影響有統(tǒng)計學意義(OR=2.334,95%CI:1.402~3.885)。而對“至少進展到DYS”和“至少進展到IM”的影響則無統(tǒng)計學意義。表4 單獨二分類Logit模型分析結果
3 討論
本次研究結果顯示,年齡、性別、吸煙、飲酒對胃癌癌前病變的進展無影響。在校正上述因素的影響后,Hp感染主要作用于胃癌癌前病變的早期階段,Hp陽性者至少進展到重度CAG的可能性是Hp陰性者的2.334倍(OR=2.334,95%CI:1.402~3.885),而對進展到更高級的病變?nèi)鏘M、DYS,則Hp陽性與陰性并無差別。這與有學者提出的Hp主要作用于胃癌癌前病變的早期階段的結論是一致的[6,7]。
累積比數(shù)Logit模型是分析有序分類資料最常用的方法,但其應用需要滿足一定的條件,其中一個基本條件就是比例優(yōu)勢假定條件,即自變量的回歸系數(shù)應與分割點k無關。對于一個自變量xk而言,不同累積比數(shù)發(fā)生比的回歸線相互平行,只是截距參數(shù)有所差別。以往有人認為,累積比數(shù)Logit模型對這一條件并不敏感,但在實際中,這一條件不滿足往往容易導致錯誤的結論,本研究即證明了這一點。Ralf也曾對這一問題進行了探討[8],并指出,如果不滿足比例優(yōu)勢假定條件,最好采用單獨的二分類Logit模型進行分析,否則做出的結論往往給人以誤導甚至是毫無意義的。本研究發(fā)現(xiàn)資料不滿足比例優(yōu)勢假定條件,因此采用了簡單且易于理解的單獨的二分類Logit模型進一步分析。結果表明,盡管Hp對進展到更高級的病變(IM、DYS)無影響,但對至少進展到重度CAG的影響有統(tǒng)計學意義,即Hp主要作用于胃癌癌前病變的早期階段。如果忽略比例優(yōu)勢假定條件的檢驗,接受累積比數(shù)Logit模型的分析結果,便會得出相反的結論。
當有序分類資料不滿足比例優(yōu)勢假定條件時,還有其它一些方法可供選擇[9],如stereotype模型、偏比例優(yōu)勢模型(partial proportional odds models)等[10]。這些方法都是基于累積Logits計算的,因而可與單獨的二分類Logit模型直接比較,但其計算過程繁瑣,且結果的解釋不如單獨的二分類Logit模型易于理解。多項Logit模型(polytomous logits models)是基于廣義Logits計算的,其計算過程和結果解釋均與單獨的二分類Logit模型不同,因而二者不可直接比較,一般也不作為比例優(yōu)勢假定條件不滿足時的首選方法。
總之,對于有序分類資料的分析,應先看其是否滿足模型的使用條件,如不滿足,最好換用其它更為合適的方法。本次研究一開始采用累積比數(shù)Logit模型分析,結果顯示Hp對胃癌癌前病變的影響無統(tǒng)計學意義,這實際上是由于Hp不滿足比例優(yōu)勢假定條件所致。在利用單獨的二分類Logit模型作進一步詳細分析后,則可以發(fā)現(xiàn),Hp陽性者至少進展到重度CAG的危險顯著高于Hp陰性者。
【參考文獻】
1 McCullagh P.Regression Models for Ordinal Data (with Discussion). J.R.Stat Soc,1980,42:109.
2 BG Amstrong,M Sloan.Ordinal Regression Models for Epidemiologic Data.Am J of Epidemiology,1989,129:191~204.
3 Ludwig Fahrmeir,Gerhard Tutz.Multivariate Statistical Modeling Based on Generalized Linear Models.Beijing:World Publishing Cooperation,1998,75~79.
4 Ralf Bender,Ulrich Grouven.Using Binary Logistic Regression Models for Ordinal Data with Non-proportional Odds.Journal of Clinical Epidemiol,1998,51:809~816.
5 Ralf Bender,Axel Bender.Calculating Ordinal Regression Models in SAS and SPlus.Biometrical Journal,2000,42:677~699.
6 Kunio Takeuchi, Yoshihiro Ohno, Yasushi Tsuzuki, etc. Helicobacter pylori Infection and Early Gastric Cancer.J Clin Gastroenterol, 2003,36:321~324.
7 夏志偉,林三仁.幽門螺桿菌與胃癌.幽門螺桿菌感染的基礎與臨床(修訂版).北京:中國科學技術出版社, 2002, 172~178.
8 Ralf Bender,Ulrich Grouven.Ordinal Logistic Regression in Medical research.Journal of the Royal College of Physicians of London,1997,31:546~551.
經(jīng)管類專業(yè)一般都包含經(jīng)濟學、國民經(jīng)濟與貿(mào)易、工商管理、市場營銷、會計學、金融學等經(jīng)濟類為主的專業(yè)。獨立學院的培養(yǎng)目標是應用型本科人才,相對于一般本科院校的經(jīng)管類專業(yè),獨立學院的經(jīng)管類專業(yè)沒有過多的理論研究,而是培養(yǎng)以市場就業(yè)技能為主的專業(yè),通俗的說就是能夠在學生畢業(yè)后順利走向市場的專業(yè),所以,作為經(jīng)管類專業(yè)比較重要的公共基礎課―《概率論與數(shù)理統(tǒng)計》,也應以培養(yǎng)學生的應用技能為主,但是在教學中發(fā)現(xiàn),情況不容樂觀。本文就以東方科技學院為例,來談談經(jīng)管類專業(yè)的概率論與數(shù)理統(tǒng)計課程的教學改革。
二、概率論與數(shù)理統(tǒng)計教學的現(xiàn)狀
概率論與數(shù)理統(tǒng)計課程是一門承前啟后的課程,不同于高中所學的簡單概率,只需要排列組合的初等方法就能計算,大學中的概率論與數(shù)理統(tǒng)計課程是以微積分為基礎,需要重新定義概念與運算規(guī)則,而且,經(jīng)管類專業(yè)課程《統(tǒng)計學》又以《概率論與數(shù)理統(tǒng)計》為基礎的,所以,概率論與數(shù)理統(tǒng)計課程的學習與微積分的學習好壞有關,又決定了后續(xù)課程《統(tǒng)計學》的學習效果。在教學中發(fā)現(xiàn),這樣重要的一門課程在學習效果上并不好,每年東方科技學院的期末考試不及格率僅次于高等數(shù)學的不及格率。很多學生也是怨聲載道,大吐苦水,不知道該如何學好這門課程,明明都盡力去學了就是學不會。作為每年都讓這門課程的一線教師,經(jīng)過多年的教學實踐發(fā)現(xiàn)主要存在以下幾個問題:
1、概念理解不到位。概率論數(shù)理統(tǒng)計的課程分兩部分:概率論以及數(shù)理統(tǒng)計。概率論是以微積分為基礎,通過分布函數(shù)來定義概率,一般包含概率的定義與性質(zhì)、分布函數(shù)、二元分布函數(shù)、數(shù)學期望與方差、大數(shù)定律與中心極限定理;數(shù)理統(tǒng)計一般包含:數(shù)理統(tǒng)計的基本概念、參數(shù)估計、假設檢驗、方差分析、回歸分析。從內(nèi)容上來看有點多,一般也不會全部講解,受到課時偏少的影響,教師在概念解釋上就講的偏少,主要還是以解題為主,但是概念沒有解釋清楚的后果就是學生根本無法理解隨機變量、分布函數(shù)、統(tǒng)計分布的內(nèi)涵是什么。盡管在課堂上一再強調(diào)隨機變量與高等數(shù)學的變量不一樣,隨機變量僅僅表示事件,不同的數(shù)字變量可以表示為相同的事件,分布函數(shù)是以隨機變量進行定義的,其含義就是隨機變量所定義事件的可能性-概率。但很多學生還是以高等數(shù)學的變量與函數(shù)來理解隨機變量與分布函數(shù),特別是隨機變量函數(shù)的分布時候,就更無法理解,教師講的口干舌燥,學生聽的一臉茫然,那求知若渴卻又無法理解的眼神讓教師無可奈何,不得不再次重復講解。
2、微積分基礎不牢固。概率論與數(shù)理統(tǒng)計是以分布函數(shù)為主線串聯(lián)的,但是分布函數(shù)的問題就牽涉到高等數(shù)學的微積分知識,特別是二元分布函數(shù)需要用到二元微積分,這對很多學生是苦不堪言,原因就在于前修課程微積分沒有學好。由于高等數(shù)學的知識量大,課時又相對較少,獨立學院學生的數(shù)學基礎本身就很薄弱,教師在講微積分知識時就盡量簡單化,二重積分的知識就變簡單很多,這就導致W生學習概率論的時候,再次面對二重積分就有天然的畏懼感,不熟悉的分布函數(shù)概念以及難懂的二重積分的計算,使得很多學生就放棄概率論的學習。對數(shù)理統(tǒng)計也是如此,數(shù)理統(tǒng)計的知識是以總體樣本為基礎,通過抽樣來估計總體參數(shù)并對總體參數(shù)進行檢驗的過程,而且,統(tǒng)計的規(guī)律就是隨著樣本的增大,總體就服從正態(tài)分布,就是通過一定的方法來估計正態(tài)總體的兩個參數(shù)并進行檢驗。這樣的知識點按理來說不難,但是學生的表現(xiàn)來看,不盡如人意。這反映出學生對新事物的接受能力不適應,經(jīng)過高考對知識點反復強調(diào)講解的習慣,學生對大學課程沒有反復練習的行為不適應,而且其他課程也多,又處于沒有人監(jiān)管的狀態(tài),主觀上就放棄了對難點的探索精神。因為數(shù)學的學習不同于其它課程,除課堂教學外,還需要有一定的時間做預習預備與復習鞏固的。
3、不注重實踐操作。概率論與數(shù)理統(tǒng)計的學習只是講解一些基本的概率統(tǒng)計原理,理論上不需要過多詳細講解,而應該把重點放在學生的實踐操作能力上。特別是數(shù)理統(tǒng)計方面的知識點如參數(shù)估計、假設檢驗、回歸分析等這些知識,讓學生指導基本的原理即可,學會在實際中會用到這些知識才是重中之重,理論與實踐的結合,才會更直觀的讓學生明白理論的意義所在。經(jīng)管類學生所需的統(tǒng)計知識在以后要用到的地方挺多的,工作上一些簡單的excel表格就是有求和求平均,如果考上經(jīng)管類研究生,那么學術上還需要學習《計量經(jīng)濟學》,得會用統(tǒng)計學的知識進行實證分析,統(tǒng)計軟件如SPSS做模型分析,并對結果進行經(jīng)濟解釋,進而來撰寫相關的學術論文。因此,針對經(jīng)管類學生的特殊性,教師應該在實際操作上下一番功夫。
三、概率論與數(shù)理統(tǒng)計課程教學的改進措施
針對概率論與數(shù)理統(tǒng)計課程一些教學的問題,提出一些改進措施。
1、重視概念的解釋。教師在主觀意識上應該認識到解釋概念的重要性。受到應試教育的影響,教師在教學上輕概念重解題的思維一直沒有改變,認為數(shù)學就是能夠讓學生解出題目來就是好效果,殊不知,這樣的教學只能培養(yǎng)一批會機械計算的學生工人,根本無法培養(yǎng)學生的綜合素質(zhì)。況且,解釋概念比解題重要的多,概念解釋清楚了,學生就容易理解做題的含義,反而能促進解題的進展,磨刀不誤砍柴工。學生應該注意甄別新舊知識的區(qū)別,建構主義認為,前面的知識學習會對后面知識的學習帶來影響。很多學生在大學前已經(jīng)習慣了數(shù)學當中的數(shù)字計算,數(shù)字變量的概念,對概率論當中的隨機變量以及分布函數(shù)還是以原有思維進行思考,這樣,就很難走出誤區(qū)。教師即時在課堂上反復強調(diào)數(shù)字變量以及隨機變量的不同,但如果學生的主觀沒有意識到,就很難達到效果。所以,對于新舊概念的區(qū)別,教師要詳細解釋,學生也應該主動認識。
2、加強微積分的練習。如果不會微積分,那么概率論與數(shù)理統(tǒng)計的學習也就無從談起。微積分的學習是在高等數(shù)學中很重要的一個知識點,那么師生就應該在高等數(shù)學中把這個知識學好。如果還是未能學好,就應該采取開設選修課的方式,給予微積分基礎不好的學生來補習,當然這個在實際操作當中有一定的難度,選修課是學生自愿選擇的,那些微積分本來就不好的就不會去選修該課程,教師可以規(guī)定高等數(shù)學不及格的學生必須強制的選修微積分,至于會不會引起學生的反感而導致學生的逆反厭學情緒,這個得需要做一定的調(diào)查才行;此外可行的就是成立學習小組,讓那些成績優(yōu)秀的學生來幫助后進學生,采取幫扶的方式來提高微積分的成績。還有就是教師可以建立qq群、微信群等網(wǎng)絡平臺,通過網(wǎng)絡答疑解惑的方式來解決對數(shù)學學習有難度的學生。
3、注重統(tǒng)計軟件操作。數(shù)理統(tǒng)計方面的知識在后續(xù)課程如《統(tǒng)計學》、《計量經(jīng)濟學》用的很多,這些課程的目的是培養(yǎng)學生掌握基本統(tǒng)計軟件的用法。因此,在講解數(shù)理統(tǒng)計的時候,教師就可以穿插一些基本軟件方面的知識,把理論用到實際操作上,就能讓學生更加明白理論的含義,當然,這里要注意的是,由于課時不夠,正式課堂上可能無法講解太多。教師應該采取課后作業(yè)的形式進行,布置一些跟盡管專業(yè)有關的習題,如分析教育水平對收入的影響這類簡單可行的統(tǒng)計練習,并把做題的批改當成平時成績的一部分,以監(jiān)督學生完成課后習題。
四、結束語
經(jīng)管專業(yè)的特殊性,使得概率論與數(shù)理統(tǒng)計課程的學習顯得較為重要,對后續(xù)課程有很大的影響,教師與學生應該充分意識到概率論當中一些概念的重要性,加強微積分的練習,在統(tǒng)計方面盡可能的講解軟件使用的知識,來提高概率論與數(shù)理統(tǒng)計的教學效果。
參考文獻:
[1]李小平. 概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社, 2013.
[關鍵詞]零售企業(yè) 跨國營銷 風險管理 理論綜述
一、引言
對今天的零售企業(yè)來說,國際化是一個重要趨勢(Simpson,Thorpe,1995)[1]。上世紀90年代以來,零售企業(yè)特別是大型零售企業(yè)也和其它行業(yè)一樣,正在大力向國外發(fā)展,零售企業(yè)的跨國營銷已成為當今世界的一大潮流。然而,服務型企業(yè)在國際擴張中面臨的風險遠遠大于制造業(yè)面臨的風險(Carman & Langeard,1998)[2]。著名的日本零售企業(yè)八佰伴正是因為沒有正視風險管理,盲目投資,最終在亞洲金融風暴的沖擊下徹底崩潰,黯然淡出其輝煌了30余年的商業(yè)舞臺[3]。顯然,零售企業(yè)在國際化進程中由于其跨國經(jīng)營的性質(zhì),其營銷活動面臨著比國內(nèi)企業(yè)更多、更復雜、破壞力也更強的國際風險,零售企業(yè)跨國營銷風險管理理論研究逐漸引起國內(nèi)外學者的關注。
二、風險與風險管理的定義
(一)風險的定義
風險的基本含義是損失的不確定性。經(jīng)濟,企業(yè)觀察 經(jīng)濟學家把風險定義為損失機會,這表明風險是一種面臨損失的可能性狀況,也表明風險是在一定狀況下的概率度;統(tǒng)計學家把風險定義為實際結果與預期結果的離差度,使用統(tǒng)計學中的標準差來衡量風險;保險學者把風險定義為一個事件的實際結果偏離預期結果的客觀概率。
本研究采用決策理論家的定義,他們把風險定義為損失的不確定性,這種不確定性又可分為客觀的不確定性和主觀的不確定性。客觀的不確定性是實際結果與預期結果的離差,它可以使用統(tǒng)計學工具加以度量;主觀的不確定性是個人對客觀風險的評估,它同人的知識、經(jīng)驗、精神和心理狀態(tài)有關。
(二)風險管理的定義
美國學者Christin(1997)認為風險管理是企業(yè)或組織為控制偶然損失的風險,,以保全所得能力和資產(chǎn)所做的一切努力;另外兩位美國學者Willins,Lichard.Hans(1996)認為,風險管理是通過對風險的鑒定、衡量和控制,以最低的成本使風險所造成的損失控制在最低限度的管理方法。我國的陳佳貫(2000)認為,風險管理是企業(yè)通過對潛在意外或損失的識別、衡量和分析,并在此基礎上進行有效的控制,用最為經(jīng)濟合理的方法處理風險,以實現(xiàn)最大安全保障的科學管理方法??梢?,風險管理是一個系統(tǒng)過程,包括風險的識別、衡量和控制等環(huán)節(jié);風險管理的目標在于控制和減少損失,提高有關單位或個人的經(jīng)濟利益或社會效果;風險管理是一種管理方法。
三、跨國營銷風險管理的理論研究
隨著跨國企業(yè)不斷向全球化拓展以及國際競爭的不斷加劇,跨國企業(yè)將面臨更復雜的國際風險。Gloshal(1987)就曾論述到,對于跨國企業(yè)的管理者而言,風險控制是三個戰(zhàn)略目標之一[4]。
1987年,Beamish和Banks提出存在兩種類型的東道國風險:情境風險和交易風險。1991年,W.Chan Kim和Peter Hwang提出影響國際市場進入模式選擇的兩個變量是環(huán)境變量和交易變量。
1992年,Miller提出了一個由三部分變量構成的、完整的國際風險模式。這三部分是:一般環(huán)境的不確定性;行業(yè)的不確定性;特定企業(yè)的不確定性[5]。Miller的這篇文章在學術界引起了極大的反響,他第一次對公司進入國際市場面臨的不確定性進行了系統(tǒng)而全面的分類,并提出一體化框架,為后來的研究提供了很好的指引,讓更多學者投入到國際風險的研究之中。
1995年,荷蘭學者Kelth D.Brouthers從實證的角度對Miller提出的一體化框架進行了檢驗,并在此基礎上對一體化模型進行了補充。Bruthers將戰(zhàn)略風險劃分為兩大類,即管理控制風險和市場復雜性風險:管理控制風險,由管理經(jīng)驗、文化差異和產(chǎn)業(yè)結構三個變量構成;市場復雜性風險,包括影響企業(yè)進入市場的能力、分銷產(chǎn)品/服務的能力和企業(yè)的獲利能力[6]。在我國,許暉等學者又對此模型加以擴展,借鑒Root(1994)對國際市場進入模式?jīng)Q策影響因素的研究[7],構建一體化國際風險感知模型。許暉等人認為國際風險的感知主要由三部分構成,其中控制風險變量與以下三點相關:管理層對風險控制的意愿;管理層對目標市場的認知程度;替代的控制機制的可獲取性[8]。
四、零售企業(yè)跨國營銷風險管理的理論研究
商業(yè)(包括零售)領域內(nèi)稍具規(guī)模的對外直接投資開始于20世紀70年代,到20世紀90年代以后,以零售企業(yè)為主的跨國營銷活動進入,國際化戰(zhàn)略成為零售商的一個重大公司戰(zhàn)略(Steve Burt, John Dawson , Leigh Sparks,2004)[9],在大多數(shù)零售商中應用。綜觀國內(nèi)外理論研究,學者們主要從以下三方面對零售企業(yè)跨國營銷風險管理進行研究。
(一)零售企業(yè)海外市場選擇中的風險評估
【關鍵詞】 證候研究;變量聚類
近年來,有不少學者利用系統(tǒng)變量聚類方法對西醫(yī)病種中中醫(yī)癥狀的分布情況進行研究。例如,麻氏等[1]通過對739例膽病病案進行分析,得到9個類,并把它們分別詮釋為肝膽濕熱證、肝膽郁熱證、肝膽蘊熱證、肝膽氣郁證、血瘀證、脾失健運證、陽虛寒濕證、陰虛內(nèi)熱證和熱毒亡陽證。筆者剖析系統(tǒng)變量聚類結果的統(tǒng)計學含義,并基于此討論把它們詮釋為證候的合理性。 我們的結論是,變量聚類的結果不能詮釋為證候。
1 變量聚類結果的統(tǒng)計學含義
在麻氏等[2]分析的膽病數(shù)據(jù)中,癥狀變量全部是二值的。分析所得的變量類之一如下。
類1:發(fā)熱寒戰(zhàn)、右上腹壓痛拒按、黃疸、惡心嘔吐、右上腹疼痛、大便秘結、小便色黃、苔黃、苔膩、脈滑、脈弦、口苦。
本節(jié)以這個類為例,剖析系統(tǒng)變量聚類結果的含義。要準確把握這個類的含義,需要考慮3個因素,即“變量”與“事件”這兩個概念的區(qū)別、變量間相似系數(shù)的定義以及變量類間相似系數(shù)的定義。下面逐一討論這3個因素。
1.1 變量與事件
變量是刻畫事物某方面特征的指標,它的每一個取值對應一個事件。先拿概率論中常用的拋擲硬幣試驗為例來解釋這兩概念。拋擲硬幣試驗可以從多個方面來看:使用的硬幣是否質(zhì)地均勻、拋擲方式如何、拋擲結果是什么等等?!皰仈S結果”這個指標刻畫試驗一個方面的特征,因此它是一個變量。這個變量有兩個可能的取值,即“正面朝上”和“反面朝上”。于是有兩個事件,即“拋擲結果正面朝上”和“拋擲結果反面朝上”。
接下來看一個中醫(yī)的例子?!坝袩o口苦”是反映患者身體一個方面特征的指標,因此它是一個變量,稱為癥狀變量。它有兩個可能的取值,即“有”和“無”。于是有兩個癥狀事件, 即 “(患者)有口苦”和“(患者)無口苦”。如果要考慮不同輕重程度,相應的變量是“口苦程度”。 一般情況下,程度變量有4個可能的取值,即“無”、“輕”、“中”和“重”。于是有4個癥狀事件,即“無口苦”、“有輕度口苦”、“有中度口苦”和“有重度口苦”。為了統(tǒng)一二值和多值情況下癥狀變量的稱謂,可以用“口苦情況” 來替代“有無口苦”和“口苦程度”。
“有口苦”這個詞通常被簡化為“口苦”。同時,“口苦情況”也被簡化為“口苦”。這樣,“口苦”時而指“口苦情況”這個變量,時而又指“有口苦”這個事件。在下一節(jié)讀者將會看到,這種歧義性造成了對變量聚類結果之含義的誤解。
顧名思義,變量聚類的對象是變量而不是事件,其結果是變量的類而不是事件的類。所以,類1的成員是“口苦情況”等癥狀變量,而不是“有口苦”等癥狀事件。為了避免誤解,我們把類1的定義改寫如下。
類1:發(fā)熱寒戰(zhàn)情況、右上腹壓痛拒按情況、黃疸情況、右上腹疼痛情況、惡心嘔吐情況、大便秘結情況、小便色黃情況、苔黃情況、苔膩情況、脈滑情況、脈弦情況、口苦情況。
1.2 變量類相似系數(shù)
“口苦情況”等12個癥狀變量為什么會被聚成一類呢?它們被聚成一類這件事的含義是什么?一個粗略的回答是,這意味著“口苦情況”等12個癥狀變量之間的相似度高。如果要準確回答這個問題,則需要考慮如何基于變量之間的相似系數(shù)定義類之間的相似系數(shù)。
常用的方法有最大相似系數(shù)法、最小相似系數(shù)法和平均相似系數(shù)法。在計算兩個類a和b間的相似系數(shù)時,考慮a中變量與b中變量間的相似系數(shù)。最大相似系數(shù)法取其最大者,最小相似系數(shù)法取其最小者,而平均相似系數(shù)法取平均數(shù)[2]。
如果類1是用最大相似系數(shù)法獲得的,那么對類中任意一個變量v,類中有另外一個變量u使得v和u間的相似系數(shù)不低于某個閾值。如果類1是用最小相似系數(shù)法獲得的,那么類中任意兩個變量間的相似系數(shù)不低于某個閾值。如果類1是用平均相似系數(shù)法獲得的,那么類中變量間的相似系數(shù)的平均值不低于某個閾值[2]。
上面提到閾值是怎樣決定的呢?在獲得類1的過程中,需要合并多對變量類,而每對類之間都有一個相似系數(shù)。這些相似系數(shù)的最小者就是上面說的閾值。一般說,最大相似系數(shù)法的閾值最大,平均相似系數(shù)法的閾值次之,最小相似系數(shù)法的閾值最小。
1.3 變量相似系數(shù)
變量間相似系數(shù)的高低的直觀含義是什么?這個問題的答案依賴所選用的相似系數(shù)是什么。相似系數(shù)有各種各樣的類型[2]。作為例子,這里只討論jaccard相似度和相關系數(shù)。
jaccard相似度只適用于二值變量。下面用一個例子來說明它的定義和直觀含義。用d記脈弦和口苦同時出現(xiàn)的樣本數(shù),b記脈弦出現(xiàn)而口苦不出現(xiàn)的樣本數(shù),c記脈弦不出現(xiàn)而口苦出現(xiàn)的樣本數(shù)?!懊}弦情況”和“口苦情況”這兩個變量的jaccard相似度定義為d/(b+c+d)。jaccard相似度的取值在0~1之間,可以視為是癥狀出現(xiàn)的“同步率”。它的值越高,脈弦和口苦出現(xiàn)時的“同步率”就越高,即脈弦和口苦的出現(xiàn)更接近如下情況:要么兩者都不出現(xiàn),要么兩者都出現(xiàn)。
相關系數(shù)是統(tǒng)計學中用來度量數(shù)字變量間關聯(lián)程度的一個指標。如果把癥狀的出現(xiàn)表示為1,不出現(xiàn)表示為0,那么就可以定義“脈弦情況”和“口苦情況”間的相關系數(shù)。相關系數(shù)的取值在0~1之間。當兩個變量的可能取值相同時,它們之間的相關系數(shù)也可視為是一種“同步率”。“脈弦情況”和“口苦情況”間的相關系數(shù)越高,脈弦和口苦同時出現(xiàn)或同時不出現(xiàn)的次數(shù)也就越多,反之亦然。
1.4 類1的含義
在分析數(shù)據(jù)時,麻氏等[1]用的是sas軟件。由于他們未提及軟件設置,所使用的變量相似系數(shù)應該是sas默認的jaccard相似度,而所使用的變量類相似系數(shù)應該是sas默認的平均相似系數(shù)。所以,類1是一個由口苦情況等12個癥狀變量組成的集合,其含義是這12變量兩兩之間的jaccard相似度平均不低于某個閾值,即口苦等12個癥狀兩兩同步出現(xiàn)的頻率平均不低于某個閾值。
2 證候的含義
證候是一個具爭議性的概念。但是,在詮釋變量聚類結果時人們所使用的證候其意義基本是統(tǒng)一的、清楚的。例如,在把類1詮釋為肝膽濕熱證時,“肝膽濕熱證”對應由口苦等12個癥狀(事件)組成的癥狀群,其意義如下:①如果這些癥狀全部(或其大多數(shù))在某患者身上同時出現(xiàn),那么該患者有肝膽濕熱證;②如果這些癥狀中許多不在一患者身上出現(xiàn),那么該患者無肝膽濕熱證。
3 變量聚類結果的詮釋
現(xiàn)在我們以類1為例來討論變量聚類的詮釋問題。在文獻[1]中,類1被詮釋為肝膽濕熱證。這是由于類1被認為是由“有口苦”等12個癥狀事件組成的集合,進而其意義被理解為口苦等12個癥狀同時出現(xiàn)。在把類1詮釋為肝膽濕熱之后,進一步得出結論:肝膽濕熱證是肝膽病中的中醫(yī)證候之一。這就是說,肝膽濕熱證存在于研究涉及的739個樣本中,即有一部分樣本同時包含口苦等12個癥狀或其大多數(shù)。為方便討論,我們將這一段文字涉及的幾件事按邏輯順序整理如下:①把類1認為是由“有口苦”等12個癥狀事件組成的集合;②把類1的意義理解為口苦等12個癥狀同時出現(xiàn),從而把它詮釋為肝膽濕熱證。③在②的基礎上,得出肝膽病中有肝膽濕熱證的結論,即有一部分樣本同時包含“口苦”等12個癥狀或其大多數(shù)。
根據(jù)第2節(jié)的結論,類1是癥狀變量的集合而不是癥狀事件的集合。所以,上述第1步是不正確的。再根據(jù)第2節(jié)的結論,類1的意義不是口苦等12個癥狀同時出現(xiàn)。實際上,句子“口苦等12個癥狀同時出現(xiàn)”本身是一個病句。顯然,口苦等12癥狀不可能在每一個樣本中都同時出現(xiàn)。那么它們究竟在哪些樣本中出現(xiàn)呢?句子沒有指明,因此意義不清。所以,第2步也是錯誤的。最后,第3步從“口苦等12個癥狀同時出現(xiàn)”這個含義不清的命題推出“有一部分樣本同時包含口苦等12個癥狀或其大多數(shù)”。這是不合邏輯的。
上述三步都有問題。那么有沒有可能不通過它們,而直接從類1的含義出發(fā)得出“有一部分樣本同時包含口苦等12個癥狀或其大多數(shù)”這個結論呢?回答是否定。類1的含義只是說口苦等12個癥狀兩兩以一定頻率在樣本中同時出現(xiàn)。這并不意味12個癥狀同時出現(xiàn)在某些樣本中。在邏輯上,從兩兩雙邊關系是無法推出多邊關系的。打一個比方:青年a與一對好朋友b和c談三角戀愛,a和b常常一起出現(xiàn),a和c常常一起出現(xiàn),b和c常常一起出現(xiàn),但這些并不意味著他們?nèi)藭瑫r出現(xiàn)。
上面的討論以文獻[1]為例。但是,所指出的問題是其它用變量聚類研究證候分布工作共有的。問題的根源在于研究目的與研究方法不匹配。這些工作是要通過分析一組關于西醫(yī)某病種的樣本,揭示該病種中中醫(yī)證候的分布規(guī)律,這其實是揭示該組樣本中中醫(yī)證候的分布情況。簡而言之,這就是要揭示樣本某方面的特征和性質(zhì)。變量聚類方法只考慮變量間的關系,完全不分析樣本的特征和性質(zhì)。既然如此,它又怎么能揭示樣本中中醫(yī)證候的分布規(guī)律呢?
4 結束語
變量聚類所得到的不是癥狀事件的類,而是癥狀變量的類,其含義不是一些癥狀同時出現(xiàn)于一些患者,從而不能詮釋為證候。變量聚類不分析樣本的特征和性質(zhì),從而不可能揭示證候在樣本中的分布規(guī)律。
【參考文獻】
關鍵詞 國有石油企業(yè) 員工敬業(yè)度 人口統(tǒng)計學變量 差異分析
一、員工敬業(yè)度的概念
目前對敬業(yè)度(Engagement)的概念都沒有一個統(tǒng)計的界定,主要有兩個領域對其進行研究:管理公司和學術界。管理公司主要以實際出發(fā)對其進行實證研究,學術界則是從學術角度提出相關的理論。
第一,在管理公司領域,蓋洛普公司的蓋洛普博士將敬業(yè)度定義為:企業(yè)首先要為員工創(chuàng)造良好的環(huán)境使其優(yōu)勢能得到有效發(fā)揮,在此基礎上,企業(yè)還應讓員工在組織中有一種歸屬感,讓其感受到自己就是組織的一員,具有主人翁的責任感。蓋洛普公司將員工主要分為敬業(yè)、守業(yè)和怠工員工三類,這主要是根據(jù)員工在情感上認同工作和組織的程度,以及由此而帶來的員工對工作和組織的投入度;翰威特公司認為敬業(yè)度是用來衡量員工期望留在公司的程度,以及對工作盡心的程度,據(jù)此翰威特公司提出了積極評價、渴望留任和竭盡所能三維度的敬業(yè)度。韜睿公司將敬業(yè)度定義為員工意愿和努力幫助組織取得成功的程度,據(jù)此公司將員工敬業(yè)度分為理性敬業(yè)度和感性敬業(yè)度兩個維度,即建立在工作給自己帶來利益前提下的敬業(yè)行為和建立在對工作認同和情感歸屬上的敬業(yè)行為。
第二,在學術研究中,國內(nèi)外學者中, Kahn將敬業(yè)度定義為:企業(yè)員工自發(fā)地控制自己,以將自己與工作角色結合在一起,也就是將自己置于一種“角色內(nèi)狀態(tài)”,并且他還將敬業(yè)度分為三個維度:行為敬業(yè)度、認知敬業(yè)度和情感敬業(yè)度;Maslach等學者則從工作倦怠的對立角度出發(fā)將敬業(yè)度定義為對工作積極的一面,他認為敬業(yè)度和工作倦怠分別為一個三維連續(xù)體的兩極,敬業(yè)度的精力、投入和職業(yè)效能感三個維度分別對應著工作倦怠的情緒枯竭、犬儒主義和效能感低落三個維度。相對于工作倦怠程度高的員工所具有的無能感和耗竭感,敬業(yè)度高的員工通常精力充沛,不同于在工作和組織中處于疏離狀態(tài)的員工,他們在工作中具有較高的自我效能感,能在組織中建立良好的人際關系,并能有效進入工作狀態(tài); Schaufeli等人與Maslach有相同的觀點,認為敬業(yè)度是工作倦怠的對立面,而他們認為敬業(yè)度包含活力敬業(yè)度、奉獻敬業(yè)度和投入敬業(yè)度三個維度。
綜上,本文所使用的敬業(yè)度概念為:企業(yè)中員工在工作角色中自我表達和自我投入的程度,以及員工在行為、認知和情感三個維度上對工作、組織的認同程度。
二、國有石油企業(yè)員工敬業(yè)度在人口統(tǒng)計學變量上的差異分析
(一)不同性別的國有石油企業(yè)員工敬業(yè)度的差異分析
對不同性別的國有石油企業(yè)員工的工作敬業(yè)度和組織敬業(yè)度兩個維度以及整體員工敬業(yè)度的得分平均數(shù)進行F檢驗和t檢驗,所得結果如表1所示。
(二)不同婚姻狀況的國有石油企業(yè)員工敬I度的差異分析
對不同婚姻狀況的國有石油企業(yè)員工的工作敬業(yè)度和組織敬業(yè)度兩個維度以及整體員工敬業(yè)度的得分平均數(shù)進行F檢驗和t檢驗,所得結果如表2所示。
(三)不同年齡的國有石油企業(yè)員工敬業(yè)度的差異分析
本文將國有石油企業(yè)的員工劃分為四個年齡段,采用單因素方差分析方法分析不同年齡段的國有石油企業(yè)員工在敬業(yè)度各子緯度上的得分。如表3所示。
(四)不同學歷的國有石油企業(yè)員工敬業(yè)度的差異分析
采用單因素方差分析方法分析不同年齡段的國有石油企業(yè)員工在敬業(yè)度各子緯度上的得分,如表4所示。
(五)不同工齡的國有石油企業(yè)員工敬業(yè)度的差異分析
不同工齡的國有石油企業(yè)員工敬業(yè)度的差異分析(如表5)。
三、國有石油企業(yè)員工敬業(yè)度在人口統(tǒng)計學變量上的差異
在以上人口統(tǒng)計學變量中,只有員工婚姻狀況對國有石油企業(yè)員工的敬業(yè)度有較大影響,而石油企業(yè)員工敬業(yè)度在不同性別、不同年齡段、不同學歷、不同工齡上均無顯著差異。這與已有的研究結論有相同之處,但并不完全一致,其原因是受研究對象,國有石油企業(yè)這個群體的特殊性的影響。
不同婚姻狀況的國有石油企業(yè)員工的工作敬業(yè)度無明顯差異,但在組織敬業(yè)度這一維度上以及整體員工敬業(yè)度上的差異卻很顯著;石油企業(yè)的已婚員工不論是工作敬業(yè)度、組織敬業(yè)度還是整體敬業(yè)度都高于未婚員工,究其原因,已婚員工其家庭生活相對穩(wěn)定,親戚朋友等人際圈子范圍也相對固定,對家庭承擔責任也更大,他們對于工作穩(wěn)定性的要求更高,同時已婚員工較未婚員工年齡大,各方面相對成熟,更有自己明確的目標和認識,工作積累和經(jīng)驗都相對較好,對企業(yè)更有歸屬和認同感。
(李季單位為蘭州工業(yè)學院經(jīng)濟管理學院;高海燕單位為中石油西北化工銷售公司)
[作者簡介:李季(1983―),男,遼寧開原人,博士,工程師,研究方向:企業(yè)管理及人力資源管理。]
參考文獻
[1] Heaney C A,Israel B A,House J S . Chronic job insecurity among automobile workers:effectson job satisfaction and health[J]. Social Scienee & Medicine,1994.
[2] Davy J A,Kinicki A J,Scheck C L . A test of job seccurity,s direct and mediated effects on withdrawal cognitions[J]. Journal of organizational Behavior,1997.
[3] Greenhalgh L,Rosenblatt Z . Job security:toward conceptual clarity[J]. Academy of Management Review,1984,9(3).