時間:2023-08-10 16:50:29
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇統計學變量的分類范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
【摘要】 目的 探討累積比數logit模型在有序分類資料中的正確應用。方法 利用在陜西某地開展的一項隊列研究數據,分別采用累積比數logit模型和偏比例優勢模型進行分析,對二者的結果進行比較。結果 在資料不符合比例優勢假定的情況下,直接采用累積比數logit模型不一定合適。結論 累積比數logit模型的應用有一定的條件限制,當不符合其應用條件時,最好采用其他相應方法。
【關鍵詞】 累積比數logit模型; 比例優勢假定; 偏比例優勢模型
Abstract: Objective To investigate the correct application of cumulative odds logit model on the ordinal data. Methods The cumulative odds logit model and partial proportional odds model were used for the data from a cohort study in Shaanxi Province, and the results were compared. Results The cumulative odds logit model might not be appropriate when the proportional odds assumption was violated. Conclusion The application of cumulative odds logit model is dependent on certain conditions. It is advisable to adopt other methods when the condition of cumulative odds logit model were violated.
Key words: cumulative odds logit model; proportional odds assumption; partial proportional odds model
累積比數logit模型是二分類logit模型的擴展[1-2],主要用于處理反應變量為有序分類變量的資料。該模型對資料要求不嚴,解釋變量既可以是連續型變量,也可以是無序分類變量或有序分類變量。Amstrong等[3]經模擬實驗發現,對于多分類有序反應資料,如果采用一般的二分類logit模型而不是累積比數logit模型,則只能獲得50%~70%的檢驗效能。說明在處理有序分類數據方面,累積比數logit模型要優于二分類logit模型。但目前對該模型的使用條件、擬合優度等內容極少有探討。最近幾年已有不少文章對二分類logit模型的正確應用進行了探討[4-8],而對累積比數logit模型的研究卻不多見。本文通過實例對累積比數logit模型的使用條件和擬合優度評價進行了探討,為其正確應用提供借鑒。
1 材料和方法
1. 1 資料來源 資料來自于陜西某地開展的胃黏膜病變與幽門螺桿菌關系的隊列研究。為探討幽門螺桿菌與胃黏膜病變進展的關系,對400例淺表性胃炎患者檢測幽門螺桿菌感染狀態,將其分為感染陽性和陰性2組,同時調查了2組患者的吸煙、飲酒情況,并對所有患者進行隨訪。
1.2 胃黏膜病理診斷 用胃內鏡觀察胃黏膜病變,并在胃體大小彎、胃角、胃竇大小彎、前后壁各取胃黏膜活檢組織1塊。病理切片按照全國胃、十二指腸活檢、病理診斷標準進行診斷。每個受檢對象以最嚴重病變為第一診斷。病變嚴重程度由輕到重依次為淺表性胃炎(superficial gastritis, SG)、慢性萎縮性胃炎(chronic atrophic gastritis, CAG)、腸上皮化生(intestinal metaplasia, IM)和異型增生(dysplasia, DYS)。
1.3 統計學處理 本研究中的反應變量為病變的不同嚴重程度,為有序分類資料。分析方法分別采用累積比數logit模型和偏比例優勢模型進行擬合。數據分析采用SAS 8.1統計軟件。P
2 結 果
2.1 累積比數logit模型分析 病例隨訪5年后,共失訪26例,剩余的374例中,135例仍為正常或SG,139例進展成為CAG,59例進展為IM,41例進展為DYS。多因素分析結果顯示,校正性別、年齡、吸煙、飲酒等因素后,幽門螺桿菌對胃黏膜進展的影響無統計學意義(χ2=2.7439,P=0.0976)。見表1。
對該資料的比例優勢假定條件進行檢驗,結果發現該資料不滿足比例優勢假定條件(χ2=38.85,P=0.0004),說明該資料采用累積比數logit模型分析可能并不合適。對模型的擬合優度進行分析,結果顯示,Deviance值和Pearson χ2值對應的P值均小于0.05,說明模型擬合欠佳。表1 累積比數logit模型的參數估計
2.2 偏比例優勢模型分析 偏比例優勢模型也是基于累積logit的一種方法,但是它放寬了比例優勢假定條件[9-11]。采用偏比例優勢模型分析結果顯示(表2),幽門螺桿菌對胃黏膜進展的影響有統計學意義(P=0.0113),這一結果與目前臨床和流行病學研究結果是一致的。而且從參數估計的標準誤來看,表2中的標準誤均小于表1中的標準誤。表2 偏比例優勢模型的參數估計
3 討 論
本次研究分別采用累積比數logit模型和偏比例優勢模型對同一組數據進行分析,結果發現,在數據違反比例優勢假定條件的情況下,2種模型擬合結果差別較大。累積比數logit模型結果顯示幽門螺桿菌對胃黏膜病變的影響無統計學意義,而偏比例優勢模型則表明幽門螺桿菌的影響有統計學意義。從統計學角度和實際角度綜合考慮,偏比例優勢模型的誤差更小,且結果更為符合實際,提示本研究數據采用累積比數logit模型不合理。
實際中應用累積比數logit模型時,主要注意的使用條件就是比例優勢假定條件,即自變量的回歸系數應與分割點k無關[12]。換句話說,無論從哪一點分類,對所有的累積logit,變量χk都有一個相同的βk估計。對于一個自變量χk而言,不同累積比數發生比的回歸線相互平行,只是截距參數有所差別。以前有研究認為,累積比數logit模型對這一條件并不敏感,但本次研究發現,當這一基本假設條件不滿足時,結果的檢驗效率會降低,容易產生假陰性錯誤。
對于累積比數logit模型的擬合效果,可通過Pearson χ2和Deviance值來判斷。Pearson χ2通過比較模型預測的和觀測的事件發生和不發生的頻數檢驗模型成立的假設,其自由度為自變量不同水平的組合數目與參數數目之差,χ2統計量小就意味著預測值與觀測值之間沒有顯著性差別,可認為模型較好地擬合了數據。Deviance通常稱為偏差,它是通過似然函數來測量所設模型與飽和模型之間的差異程度。當Deviance值較小時,可認為所設模型與飽和模型之間的差異小,即所設模型擬合較好。這2個指標值在多數情況下是一致的,如果存在不一致,一般認為,當用最大似然值擬合logit模型時,Deviance值比Pearson χ2值更適用于測量擬合優度[13]。需注意的是,當模型中含有連續變量時,Pearson χ2和Deviance指標將不再近似于χ2分布,從而也不再適用于擬合優度評價。Bender等[14]建議,如果累積比數logit模型含有連續變量時,最好采用單獨的二分類logit模型利用Homser-Lemeshow指標進行評價。Pulksteins等[15]則提出了一種修正Pearson χ2和Deviance值,用于含連續變量的累積比數logit模型的擬合優度評價等。
總之,累積比數logit模型的應用不僅僅是參數求解,而是包含了一系列過程,如變量正確賦值、變量的初步描述、圖示檢查、變量選擇、參數求解、擬合優度評價、結果的合理解釋等。它需要對專業和統計學知識的全面了解,也需要一個實事求是的態度。只有準確掌握應用條件,恰當地對模型進行評價,并結合專業知識進行合理的解釋,才能得出可靠的結論。
參考文獻
[1] Bender R,Gruven U.Ordinal logistic regression in medical research[J].J R Coll Physic Lond,1997,31(5):546-551.
[2] McCullagh P.Regression models for ordinal data [J].J R Stat Soc(B),1980,42(2):109-142.
[3] Amstrong BG,Sloan M.Ordinal Regression models for epidemiologic data[J].Am J Epidemiol,1989,129(1):191-204.
[4] 馮國雙,陳景武,周春蓮.logistic回歸應用中容易忽視的幾個問題[J].中華流行病學雜志,2004:25(6):544-545
[5] 趙宇東,劉嶸,劉延齡,等.多元logistic回歸的共線性分析[J].中國衛生統計,2001,17(5):259-261.
[6] 羅登發,余松林.條件logistic回歸模型的殘差分析和影響診斷[J].中國衛生統計,1997:14(1):13-15.
[7] 魏朝暉.logistic回歸診斷[J].中國衛生統計,2001, 18(2):112-113.
[8] 趙清波,徐勇勇,夏結來.logistic回歸中高杠桿點的檢測[J].中國衛生統計,1997,14(2):17-20.
[9] Bender R,Benner A.Calculating ordinal regression models in SAS and S-Plus[J]. Biom J,2000,42(6):677-699.
[10] Peterson B, Harrell F.Partial proportional ordinal model for ordinal response variables[J].Appl Statist,1990,39(2):205-217.
[11] Lall R,Campbell MJ,Walters SJ,et al.A review of ordinal regression models applied to health-related quality of life assessments[J].Stat Methods Med Res,2002,11(1):49-67.
[12] Fahrmeir L, Tutz G.Multivariate statistical modeling based on generalized linear models [M].2nd ed. Berlin:Springer-Verlag,1998:75-79.
[13] 王濟川, 郭志剛.Logistic回歸模型——方法與應用[M].北京:高等教育出版社,2001:58-65.
【關鍵詞】高齡老年人;生命質量評價;總體健康狀況自評
【中圖分類號】R195 【文獻標識碼】A 【文章編號】1004-7484(2012)13-0449-02
1947 年世界衛生組織給健康下的定義為: “健康不僅僅是沒有疾病和病痛, 而且還包括身體、心理和社會方面的完好狀態[1] ”。1990 年WHO提出了“健康老齡化”,1993 年第15 屆國際老年學會提出了“科學為健康老齡化服務”[2]的人口老齡化應對目標。國內外對老年人生命質量進行了大量研究,取得了較多的研究成果。本研究以SF-36量表為測量工具,在山東省選擇70歲及以上老年人進行生命質量狀況的調查,以了解其生命質量的總體狀況及影響因素,為提高老年人生活質量,促進健康老齡化的制度安排提供參考。
1 對象與方法
1.1 研究對象 本次調查的對象是山東省居家養老和機構養老的70歲及以上老年人。采用分層方法把山東省的老年人劃分為沿海、中部、西部3種地區類型,每個類型隨機抽取3個地級市,在被抽取的地級市中以市(縣)為單位進行隨機抽樣。
1.2 調查方法 調查問卷包括一般情況表(養老方式、性別、年齡、受教育程度、婚姻狀況、過去從事的職業、目前的收入來源、生活狀況等)和健康狀況調查問卷(SF-36),分為居家養老卷與機構養老卷,調查者是通過專門培訓的研究生及本科生采用統一導語入戶對老年人進行調查,能獨立填寫問卷的由其獨立填寫,對于沒有閱讀能力或不能填寫問卷的老年人,由調查人員朗讀問卷內容,請其作答,由調查人員代為填寫問卷。共發放問卷590份,回收有效問卷558份,回收率94.6%。
1.3 統計學方法 應用Epidata3.1數據庫雙機錄入,SPSS16.0軟件包進行數據處理,對一般人口學特征等進行統計描述;單因素分析應用?2檢驗,多因素分析應用有序分類變量的Logistic回歸分析。
2 結果與分析
2.1 人口社會學特征的描述分析
居家養老老人324人,機構養老老人234人,共558人,其中男288人(51.6%),女270人(48.4%)。年齡70~79歲393人(70.4%),80歲及以上的高齡老人165人(29.6%)。婚姻狀況:有配偶234人(41.9%),喪偶306人(54.8%),離異4人(0.8%),未婚14人(2.5%)。文化程度:未受過教育269人(48.2%),小學174人(31.2),初中48人(8.6%),高中、中專及技校36人(6.5%),大專及以上31人(5.5%)。居家養老老人和機構養老老人年齡、性別,受教育程度分布差異無統計學意義,過去從事的職業、婚姻狀況、生活狀況差異有統計學意義(P
2.2總體健康狀況自評及相關因素差異性分析
本研究將老年人的總體健康狀況分為5個等級,分別是“1=差、2=一般、3=好、4=很好、5=非常好”。總體健康狀況自評的居家養老老人與機構養老老人差異無統計學意義(P>0.05)。“性別”在老年人總體健康狀況之間的差異性無統計學意義(p>0.05),可以認為老年人總體健康狀況在性別分布上無差異。“年齡”、“受教育程度”、“婚姻狀況”與老年人總體健康狀況之間的差異性有統計學意義(P
2.3總體健康狀況自評影響因素的Logistic回歸結果及分析
單因素分析僅對總體健康狀況自評的差異性進行檢驗,而沒有對影響因素進行歸因分析,因此需要進一步做多因素分析。以總體健康狀況自評為因變量,運用SPSS16.0統計軟件中的有序分類變量回歸方法進行分析,納入模型中的自變量有年齡、性別、受教育程度、目前婚姻狀況、職業、養老方式以及生活狀況7個自變量。模型檢驗及回歸結果如下。
2.3.1 模型檢驗
表2為對模型中是否所有自變量偏回歸系數全為0進行似然比檢驗,結果P
2.3.2 方程中的有效變量及參數檢驗
在納入模型的7個變量中有年齡、養老方式及生活狀況3個自變量對總體健康狀況自評的影響具有統計學意義(P
3 討論
3.1 年齡與總體健康狀況評價的程度呈負相關關系。“年齡”因素在老年人對生命質量總體滿意度評價的回歸分析中具有統計學意義。可以認為老人的年齡越大,對生命質量的總體滿意度越低,本結論與景睿、劉曉東等[3]的研究結果一致。原因在于,年齡越高,身體機能越低,日常活動能力下降。同時對死亡的恐懼加大,故自我健康的評價較低。可見,年齡是健康狀況的風險因素,不僅表現在日常活動能力,而且投射出心理狀況的變化。
3.2 經濟條件對總體健康狀況評價具有積極作用。“生活狀況與當地一般家庭的比較”對70歲及以上老人總體滿意度影響因素的回歸分析中,生活狀況“很富裕”“比較富裕”“一般”的老年人,對生命質量的總體滿意度更高。原因可能出于以下幾個方面:一是生活狀況水平高,老年人就可能有更大的選擇空間和余地,不為經濟所累,過自己想要的生活,生活比較自由[4]。二是生活狀況較好的老年人有更好的條件享受醫療保健,更多地參加社交活動,在心理上能夠獲得更多的滿足感,因此對生命質量的總體滿意度會較高。
3.3 居家養老老人的健康自評好于機構養老老人。 “養老方式” 因素在老人對生命質量總體滿意度評價的的回歸分析中,居家養老模式下的老人對自我生命質量評價的總體滿意度高于機構養老老人。首先,老年人觀念相對保守,接受新事物的能力較弱。居家養老是我國傳統的養老方式,在這種環境中老年人往往具有更高的歸宿感。其次,老年人年齡大,易產生孤獨感與陌生感。居家養老模式能使老年人更容易獲得子女以及鄰里生活照料、精神慰藉的家庭和社會支持,從而減少孤獨感與陌生感[5],因此對生命質量的總體滿意度高。
3.4 受教育程度與總體健康狀況自評之間的差異性有待于進一步研究。在描述性分析的差異性檢驗中,受教育程度在總體健康狀況自評的差異有統計學意義。受教育程度較高的老年人對生命質量的總體滿意度高于教育程度較低的老年人。然而在“受教育程度”對總體滿意度自評的影響因素的回歸結果顯示無統計學意義(見表3),可能的原因在于混雜因素的影響,此問題有待于進一步研究。
參考文獻
[1] Velarde-Jurado E et al.Salud Publica Mex,2002,44:349-361.
[2] 李秀燕, 郭繼志. 老年人生命質量評價的現狀及展望[J]. 國外醫學?社會醫學分冊, 2003,20(4):154-158.
[3] 景睿,劉曉冬等.山東省農村老年人生命質量評價及影響因素分析[J].中國農村衛生事業管理,2008-8 ,8(28)
[4] 林江,楊繼峰,劉強. 健康狀態認知理論的概述[R]. 廣西中醫學院院報 2010,13(1):74-75
[5] 王生鋒,齊玉梅.中等城市社區人群生命質量評價及影響因素調查[J].山西醫藥雜志,2008-10,10(37).
作者簡介:
(1973.03-)碩士研究生,濰坊醫學院講師,研究方向:老年社會學
關鍵詞 地統計學;生態學;尺度;時空特征;應用
中圖分類號 S153 文獻標識碼 A 文章編號 1007-5739(2014)13-0245-01
Application of Geostatistics in Ecology
LI Xiu-mei 1 ZHOU Shi-xue 2 LUO Sheng-jun 2 LI Chang-zhou 2 LIU Li-ping 2 *
(1 Forestry Ecology Department,Hubei Ecology Vocational College,Wuhan Hubei 430200; 2 Macheng Forestry Bureau)
Abstract Natural phenomena has spatial variability and autocorrelation characteristics.As the theory and methods in researching space distribution,goestatistics became an effective method for quantitative analysis of spatial characteristics,and gradually introduced to ecology.Based on the basic theory and method,the paper introduced the application of geostatistics in ecology.
Key words geostatistics;ecology;scale;temporal and spatial characteristics;application
地統計學起源于20世紀60年代,是以區域化變量為理論基礎,以半變異函數和插值分析為主要工具的一種地質統計學方法;是通過分析空間數據探索空間過程的信息分析技術[1]。與傳統生態學方法相比,地統計學變異函數中的變程(a)包含了距離和方向2種含義,即量化的空間尺度信息,比依靠經驗直接確定空間取樣尺度更合理;比通過尺度推繹方式間接獲得目標現象的特征更精確;修正了傳統景觀格局研究方法中小尺度生態學現象在區域內均質性的不合理假設。
由于該理論充分考慮了樣點的位置、方向和彼此間距離等空間結構信息,為實現參數的離散化與空間化提供了一種有效工具,可以定量化區域變量的空間特征,進而對未知樣點進行無偏最優估值,以直接反映自然現象的隨機性和結構性,廣泛用于地理學、環境科學、土壤學等諸多研究領域[2-3]。揭示了經典統計方法難以發現的規律,有利于融合格局、尺度、過程關系,完善生態學理論與方法。
1 地統計學的基本理論與方法
1.1 區域化變量理論
地統計學處理的對象為區域化變量,區域化變量的兩大特點是隨機性和結構性。基于此,地統計學引入隨機函數及其概率分布模型為理論基礎,對區域化變量加以研究[4]。
1.2 變異函數
變異函數是地統計學方法的基礎,根據已知樣本點來確定變量在空間上的變化規律,推算未知點的屬性。其優點在于根據已知樣本點計算某未知點的屬性值時,考慮了不同距離、不同方向空間點位間的相關性,使估計值更精確。
1.3 空間插值
與傳統的插值方法不同,地統計學考慮樣點的方向、位置和彼此間的距離,可以研究既有一定隨機性又有一定結構性的各種變量的空間分布規律[5]。克里格(Kriging)插值是一種最優、無偏的估值方法,在生態學中的應用最廣泛,可以給出每一估計樣點的不確定性(即產生誤差的幾率和大小),并利用多種附屬信息填補采樣不足的缺陷。這種在誤差允許范圍內的空間差值既節省工作量,又彌補因資料不足帶來的困難[6]。
1.4 空間模擬
空間模擬方法是當今地統計領域中由已知推斷未知的最活躍的一種方法。由于Kriging方法具有平滑作用,不適宜用于獲取變量極值的空間分布,例如通過重金屬含量的極值來尋找湖泊水體污染源;而空間模擬方法即能模擬變量的空間變化趨勢又能保留變量的極值;此外,空間模擬通過多種實現(realization)系統的表現,進行各種情況下的模擬,具有較好的統計效用[1]。
2 地統計學在生態學中的應用
地統計學檢驗、模擬和估計空間特征的作用,對認識不同尺度生態學功能與過程具有重要意義[7]。20世紀80年代初,引起生態學者關注,廣泛應用于描述生態因子的空間自相關性、繪制生態因子分布圖以及設計抽樣方案,分析自然因子普遍存在的空間相關程度、距離和方向等。利用其對可信程度和誤差的評價,解決了定量地測度空間尺度和更精確地繪制自然因子的空間分布[8]。生態現象所涉及的任何屬性,如植被類型、生物量、土壤化學元素含量、污染物濃度等,均可以作為地統計模型的變量。
地統計學方法可以用于研究離散現象的空間特征(群落、種群的格局分布),在處理具有空間連續性特征的變量(土壤性質)更占優勢。20世紀80年代初,區域化變量理論和地統計方法成為量化土壤物理化參數空間變異的有效方法[9]。尤其是地統計學方法中半方差圖和Kriging插值法適合于土壤特性的空間預測[8]。目前廣泛用于土壤養分[10]、水分[11]等的分布、污染物擴散、土壤肥力質量評價[12]、土壤分類制圖、試驗設計和采樣方法探討等[13]。
地統計學在生態學的應用主要集中在生態系統尺度以下,彌補了景觀生態學在處理物種、種群和群落空間信息的不足。區域化隨機變量耦合了地形(海拔、坡度、坡向)、土壤、水分等環境因子,是分析種群、群落的空間異質性與環境因子關系的有力工具[14];既是對生態系統尺度空間異質性和格局問題的研究,也從生態系統的組成成分入手,同樣是對生態系統功能過程的細化[7]。
3 結語
地統計學無論是空間異質性分析法還是空間模擬差值法,通常都是對因子的靜態研究,對處理時間變化問題存在缺陷。有學者嘗試建立基于地統計學原理的時間動態模型[15]。鑒于地統計學方法側重于空間分析,而傳統統計學方法注重于時序分析,二者相結合,將時間因子融入空間變異中是今后需要解決的問題[6]。非線性多維時間序列分析預測模型(GS-SVR)就是半變異函數基礎上,結合SVR和新的定階方法發展的一種新的多維時間序列最優階數判斷法[16]。
地統計學與其他格局分析方法相結合,將有助于解決現象的時空發展過程與機理問題。近期“3S”技術與地統計學相結合,通過地理數據確定樣點之間的距離,通過屬性數據計算出變量之間的差異,二者結合得到地統計學所需要的步長和半方差函數關系,強化了大尺度空間信息的分析[10,17]。但目前地統計學應用于景觀尺度的研究較少,并且尚未形成較成熟的定量化研究方法。
4 參考文獻
[1] 王勁峰,武繼磊,孫英君,等.空間信息分析技術[J].地理研究,2005,24(3):464-472.
[2] 唐濤,蔡慶華,潘文斌.地統計學在淡水生態學中的應用[J].湖泊科學,2000,12(3):280-288.
[3] 張坤,洪偉,吳承禎,等.基于地統計學和GIS的福建省降雨侵蝕力空間格局[J].山地學報,2009,27(5):538-540.
[4] 孫英君,王勁峰,柏延臣.地統計學方法進展研究[J].地球科學進展,2004,19(2):268-274.
[5] 王景雷,孫景生,張寄陽,等.基于GIS和地統計學的作物需水量等值線圖[J].農業工程學報,2004,20(5):51-54.
[6] 王正軍,李典謨,商晗武,等.地質統計學理論與方法及其在昆蟲生態學中的應用[J].昆蟲知識,2002,39(6):405-411.
[7] 王政,王慶成,李哈濱.紅松老齡林主要樹種的空間異質性特征與比較的定量研究[J].植物生態學報,2000,24(6):718-723.
[8] 葛劍平,郭海燕,仲莉娜.地統計學在生態學中的應用(Ⅰ)―基本理論和方法[J].東北林業大學學報,1995,23(2):88-94.
[9] 廖桂堂,李廷軒,王永東,等.基于GIS和地統計學的低山茶園土壤肥力質量評價[J].生態學報,2007,27(5):1978-1986.
[10] 祝錦霞,許紅衛,王珂,等.基于GIS和地統計學的低丘紅壤地區三種土壤性質空間變異性研究[J].土壤,2008,40(6):960-965.
[11] 張繼光,陳洪松,蘇以榮.喀斯特山區洼地表層土壤水分的時空變異[J].生態學報,2008,28(12):6334-6343.
[12] 王曉春,韓士杰,鄒春靜,等.長白山岳樺種群格局的地統計學分析[J].應用生態學報,2002(7):781-784.
[13] 李艷,史舟,徐建明,等.地統計學在土壤科學中的應用及展望[J].水土保持學報,2003,17(1):178-183.
[14] 尚占環,姚愛興,龍瑞軍.干旱地區山地荒漠草原陰坡植物群落空間異質性[J].生態學報,2005,25(2):312-318.
[15] 夏敏,趙小敏,張佳寶,等.基于GIS和地統計學的土壤養分時空變異分析[J].江西農業大學學報,2007,29(2):312-317.
關鍵詞:冠心病心絞痛 蒙醫證型 診斷標準 臨床研究
心血管疾病已成為影響人類健康的頭號殺手,其中絕大多數是由冠狀動脈粥樣硬化所致。隨著人們生活水平的迅速提高,本病近年來呈增長趨勢。冠心病心絞痛屬于蒙醫學“心刺痛”范疇,目前對冠心病心絞痛蒙醫證型的診斷尚未完全一致。本研究收集410例包含蒙醫信息的冠心病心絞痛患者的臨床資料進行統計學分析,并結合專家意見,初步建立了冠心病心絞痛蒙醫證型的診斷標準。
一、臨床資料
1、病例入選標準
冠心病心絞痛入選標準依據這幾年中西醫結合冠心病心絞痛會議制定的診斷標準。
2、病例來源
本研究對象為2009年10月-2011年6月期間在本所蒙醫心病科、中醫心病科及CCU住院診治的部分患者。
二、研究方法
1、制定病例觀察表
通過回顧文獻,確定本研究的病例入選標準和觀察指標(包括西醫和蒙醫內容),并據此制定統一的病例觀察表。病例觀察表包括與冠心病心絞痛患者蒙醫診斷相關信息的指標。
2、總體方法
按照西醫冠心病心絞痛診斷標準確定入選病例并進行臨床觀察,填寫病例觀察表,請蒙西醫結合專家對每份觀察表信息進行辨證并做出相應的證型診斷;根據證型分組,進行統計學分析,篩選對證型診斷有意義的指標;再請蒙西醫結合專家對指標進行討論,最后制定冠心病心絞痛蒙醫證型的診斷標準。
3、觀察項目及方法
按照入選標準入選冠心病心絞痛病例,應用統一的病例觀察表前瞻性地收集臨床資料。主要觀察指標包括:性別、年齡、住院轉歸、冠心病心絞痛發病誘因、既往健康狀況、發生冠心病心絞痛的持續時間及發作次數、住院天數,入組72 h內每12 h及心絞痛發作時的心電圖、心肌酶[肌酸激酶同工酶(CK-MB)、肌紅蛋白(Mb)、肌鈣蛋白(cTnT)]、血常規、血生化及血脂[總膽固醇(TC)、三酰甘油(TG)、高密度脂蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C)]。記錄72 h內各指標的值。蒙醫指標包括癥狀、舌象、脈象、體態、根源及因素、疼痛、累及部位等。研究終點為患者在住院期間死亡或放棄治療。
4、統計學分析
所有觀察資料應用SPSS13.0統計軟件進行統計分析。對計量資料進行兩獨立樣本t檢驗,結果以x±s表示;對分類變量資料采用卡方檢驗。
5、質控措施
采取參研人員培訓;研究過程中抽查一定數量(觀察病例總例數的10%)病例觀察表與原始住院病歷進行核對,復印一定數量(觀察病例總例數的5%)的原始病歷予以存檔等方法控制研究質量。
6、數據分析方法
進行統計分析后,找出各證型中對證型診斷有意義的指標。請蒙西醫結合專家進行討論,確定診斷指標。
三、結果
冠心病心絞痛蒙醫證型分布經專家對部分包含蒙醫信息的冠心病心絞痛患者資料進行分析。
1、粘邪型的指標篩選
分析比較粘邪型和非粘邪型的計量資料及兩證型間的分類變量資料,結果見表1、表2。表1 粘邪型與非粘邪型血脂比較(略) 表2 粘邪型與非粘邪型分類變量資料統計結果(略)注:癥狀:1=無,2=有;持續時間:1≥5 min,2≥10 min,3≥15 min,4≥30 min;郝衣希拉體態:1=無,2=有;疼痛程度:1=輕度,2=中度,3=重度; CK-MB、Mb、cTnT:1=正常,2=升高。
2、楚斯型的指標篩選
分析比較楚斯型和非楚斯型的計量資料及兩證型間的分類變量指標,結果見表3、表4。表3 楚斯型與非楚斯型血脂比較(略)表4 楚斯型與非楚斯型分類變量資料統計結果(略)注:癥狀:1=無,2=有;持續時間:1≥5 min,2≥10 min,3≥15 min,4≥30 min;CK-MB、Mb、cTnT:1=正常,2=升高;單純T波改變:1=正常, 2=單純T波改變。
3、胃痧型的指標篩選
分析比較胃痧型組和非胃痧型組的計量資料及兩證型間的分類變量資料,結果見表5、表6。表5 胃痧型與非胃痧型分類變量資料統計結果(略)注:癥狀:1=無,2=有;CK-MB、Mb、cTnT:1=正常,2=升高;心電圖下壁ST-T改變:1=無,2=有;體態:1=巴達干赫依,2=非巴達干赫依表6 胃痧型與非胃痧型血脂比較(略)。
關鍵詞:獨立性檢驗;假設檢驗;臨界值
中圖分類號:G632 文獻標識碼:A 文章編號:1002-7661(2012)12-178-02
本文將就以下幾個問題展開闡述:
一、獨立性檢驗的形成
獨立性檢驗的基本過程是根據客觀實踐情況和經驗,提出原假設,選好統計量,進行抽樣、試驗、計算、檢驗,進行判斷.也就是說,整個過程貫穿著通過實踐提出假設理論,再通過實踐進行檢驗.假設的過程其實就是類似與數學證明中的反證法,其基本步驟如下:
假設: :兩分類變量沒有關系,用A、B表示兩個分類變量,若 成立 事件A與事件B獨立 .這單純是從概率的角度衡量兩個分類變量的是否有關.我們需要更進一步對相關程度進行檢驗,就是在假設 下,如果出現一個與 相矛盾的小概率事件,就可以推斷 不成立,且該推斷犯錯誤的概率不超過這個小概率.
二、獨立性檢驗的基本思想
在新課程標準數學2-3第三章第二節對獨立性檢驗進行了明確的闡述,課本首先通過對分類變量進行定義,分類變量也稱屬性變量或定性變量,它們的不同取值僅表示個體所屬的類別,其取值是離散的.如性別變量,只能取男、女兩個值,商品的等級變量只取一級、二級……,是否吸煙,,國籍等等都是分類變量.分類變量的均值和方差沒有實際意義,所以不做研究.接著定義列聯表:一般為兩個或兩個以上分類變量的匯總統計表.在我們的教材中僅限于兩個分類變量的列聯表,并且每個分類變量只取兩個值,這樣的列聯表稱為2×2列聯表,如下:
總計
c
總計
在假設 成立的條件下,A表示 ,B表示 ,可以通過求分類變量 占總數與分類變量 占的總數的概率(用頻率估計概率), 恰好為事件AB發生的頻數; 和 恰好分別為事件A和B發生的頻數.由于我們可以利用頻率估計概率,所以在 成立的條件下應該有:
, ,可得:
.
即: .
因此, 越小,說明常上網與不及格之間的關系越弱,否則,關系越強.從這個角度這能說明兩個變量間關系的強弱,而不能判斷它們具體有多大程度上有關,在此基礎上為了使不同樣本的數據有一個統一而又合理的評判標準,統計學家們經過研究后構造了一個隨機變量(卡方) = ,并且統計學家們通過實踐還得到了如下的卡方臨界值表:
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10
k0 0.455 0.708 1.323 2.072 2.706
P(K2≥k0) 0.05 0.025 0.010 0.005 0.001
k0 3.841 5.024 6.635 7.879 10.828
在表格中的數字與上述式子能夠說明一個什么問題呢?上面的表格中的第一行是作為檢驗的犯錯的上界(上界也是我們要找的
那個小概率),下面的 是取值的臨界值,接下來我們就從一個具體實例中做以分析:
例 1為了考察高中生的性別與是否喜歡數學課程之間的關系,在我校學生中隨機抽取300名學生,得到如下列聯表:
喜歡數學課程 不喜歡數學課程 總計
男 37 85 122
女 35 143 178
總計 72 228 300
由表中數據計算 的觀測值.能夠以95%的把握認為高中生的性別與是否喜歡數學課程之間有關系嗎?
解:可以有95%以上的把握認為“性別與喜歡數學課程之間有關系”.
= 4.514
因此應該斷定“性別與喜歡數學課程之間有關系”成立,并且這種判斷結果出錯的可能性約為5%,所以,約有95%的把握認為“性別與喜歡數學課程之間有關系”。
這種利用隨機變量 來確定是否能以一定的把握認為“兩個分類變量之間有關系”的方法,稱為兩個分類變量的獨立性檢驗。
在上述題目做判斷兩分類變量是否有關時出現了“斷定”一詞,“斷定”一詞在獨立性檢驗中的含義是指檢驗判斷,“斷定為A,B有關系”就是檢驗判斷為A,B有關系,也就是拒絕A,B無關系,即拒絕原假設 (接受假設 的對立面)。“約有95%的把握”中“把握”一詞在獨立性檢驗中的含義是指不犯錯誤的可信度,“有95%的把握”就是有95%可信度(可能性)。換而言之,應該是在原假設 成立的條件下,檢驗判斷接受原假設 犯錯誤的概率不超過5%,而不犯錯誤的概率超過95%。換句話說,就是在原假設 成立的條件下,不犯錯誤接受對立假設 錯誤的概率超過95%。對與求出的 的觀測值 越大說明可信度越高,犯錯誤的概率就越小
三、獨立性檢驗的做題步驟
通過以上的分析我們可以知道對于獨立性檢驗問題如何去分析,接下來我們就要從實際操作中研究怎么去處理這部分問題。首先我們知道從2×2列聯表的角度來說,我們對列聯表的中概率的分析可以在直觀上看出它們的概率關系,而這種直觀判斷不足之處在于不能給出推斷“兩個分類變量有關系”犯錯概率,但是獨立性檢驗就可以彌補這個不足.即首先直觀上判斷兩分類變量是否有關系,然后獨立性檢驗主要從是否有關和有多大的把握認為它們有關這兩個方面來考查,這樣以來就可以比較清晰的看出變量關系以及相關程度。那么這時候就需要借助隨機變量 來求值,進而判斷,即要推斷“X與Y有關系”,可以通過頻率估計概率進行直觀判斷,再按下面的步驟進行:
1.根據實際需要確定容許推斷“兩個分類變量有關系”犯錯概率的上界 ,然后查表確定臨界值 ;
2.根據2×2列聯表與公式計算 的觀測值K;
3.如果 ,就可以推斷“兩個分類變量有關系”,這種推斷犯錯誤的概率不超過 ;否則就犯錯誤的概率不超過 的前提下不能推斷“兩個分類變量有關系”,最后做出判斷。
例2在500人身上試驗某種血清預防感冒的作用,把他們一年中的感冒記錄與另外500名未用血清的人的感冒記錄作比較,結果如表所示。問:該種血清能否起到預防感冒的作用?
未感冒 感冒 總計
使用血清 258 242 500
未使用血清 216 284 500
總計 474 526 1000
分析:在使用該種血清的人中,有 的人患過感冒;在沒有使用該種血清的人中,有 的人患過感冒,使用過血清的人與沒有使用過血清的人的患病率相差較大。從直觀上來看,使用過血清的人與沒有使用過血清的人的患感冒的可能性存在差異。
解:提出假設 :感冒與是否使用該種血清沒有關系。由列聯表中的數據,求得:
當 成立時, 的概率約為0.01,
我們有99%的把握認為:該種血清能起到預防感冒的作用。
關鍵詞:計量統計模型;向量自回歸模型;經濟增長;脈沖響應函數;方差分析
中圖分類號:F224 文獻識別碼:A 文章編號:1001-828X(2016)033-0000-01
隨著計量統計學與經濟學知識的相互融合,各種計量統計模型在經濟增長問題中的應用越來越廣泛,這里主要通過向量自回歸模型來探討計量統計模型在其中的應用。
一、VAR模型在經濟增長問題中的應用
首先抽取統計數據,確定相關變量,然后建立向量自回歸VAR[1]模型,并用Johansen協整檢驗、脈沖響應函數與方差分解[2]等方法對多個自變量的相關性進行了實證研究。VAR模型是進行多個自變量的分析時最易操作的計量統計模型,經常用于預測相關時間序列,并分析隨機擾動項對變量的影響,進而說明各種因素對變量造成的影響。此外運用VAR 模型的優勢在于可合理地描述變量間的互動關系,而無需事先對變量的外生性和內生性進行辨別。本文以高等教育的投入和教育規模與經濟增長之間的關系為例進行說明。
1.自變量選擇、數據處理
通常以地區生產總值(GDP)來代表經濟增長,而收集到的數據是絕對數據,因此會受通貨膨脹等因素的影響。將數據換算成某年的不變價格,然后以某年為基期來計算,用以剔除通貨膨脹等因素的影響。為了消除異方差,從而更好的分析某省教育投入(EDU)、教育規模(SCA)、地區生產總值(GDP)之間的關系,對EDU、SCA、GDP取自然對數,分別用InEDU、LnSCA和InGDP[3]表示。
2.平穩性檢驗
在估計VAR 回歸模型之前,因為現實中的經濟時間序列一般均為非平穩的,采用傳統的計量統計學知識去建立模型,較容易產生虛假回歸[3]的現象。因此我們需要對各個變量進行ADF檢驗,若各個變量存在單整階數,而且階數相等時,這樣才可以有效地確定多個變量間的相互關系。
3.VAR模型建立
運用通過平穩性檢驗的變量建立VAR模型。傳統的計量統計方法不足以說明變量之間的動態關系,同時內生變量在方程兩端均有出現,將會使判斷和估計變得特別復雜。為了解決這些問題,Christopher Sims[1]于1980年提出了VAR模型,并運用到經濟學中,使經濟系統動態性分析加速發展,進而解釋各種自變量對經濟增長形成的影響。
VAR(p)模型的數學表達式[1]是:
Yt=a+p1Yt-1+p2Yt-2+…+ppYt-p+Ut
其中,Yt是包含多個內生變量的列向量,這里內生變量就是指教育投入、教育規模和經濟增長,p是滯后階數,t是樣本個數。pj是n行n列的系數矩陣。Ut是隨機擾動項,j=1,2,…,n。
4.VAR模型的穩定性檢驗
對上述建立的VAR模型進行穩定性檢驗,如果模型中AR特征多項式的全部根的倒數值都在單位圓內[4],說明VAR模型是穩定的,則可以說這個VAR模型是有效可靠的,能夠進行接下來的脈沖響應和方差分解分析。
5.Johansen協整檢驗
Juselius與Johansen [1]共同提出了以VAR模型為基礎的檢驗回歸系數的方法。進行多個變量協整檢驗采用這種方法更為合適。此方法是為了說明各變量之間是否存在長期穩定的均衡關系。運用Johansen檢驗法對各變量進行協整檢驗,建立標準化的協整方程,通過系數看出各變量間的均衡關系。
6.Granger因果關系檢驗
由Johansen協整檢驗可得,某自變量與經濟增長存在長期的協整關系,但這種關系是否是一種因果關系,需要進行Granger因果關系檢驗。Granger因果關系檢驗[1]是檢驗一個變量的滯后變量是否能夠引入到其他變量中。若某個變量受到其他變量的滯后影響,則稱它們具有Granger因果關系[5]。
7.脈沖響應函數與方差分解
為了更加明確多個自變量與經濟增長之間的動態關系,在分析VAR模型時,實際上是考慮一個脈沖項發生變化進而對整個系統的影響程度,這就是脈沖響應函數分析法。方差分解幫助我們了解每一個結構沖擊對內生變量變化的貢獻度[6],用以分析不同結構沖擊的重要程度。
二、小結
本文以計量統計學中典型的VAR模型為例,說明了計量統計模型應用在經濟增長問題中的具體步驟。在計量統計學中,還有很多的統計方法適用于經濟問題,比如主成分分析法、層次分析法等等,大家都可以此為例進行展開學習與應用。運用計量統計學分析各因素如何影響經濟增長,為制定經濟政策的參與者提供好的建議,提升計量統計學的現實意義。
參考文獻:
[1]王少平.計量經濟學[M]高等教育出版社,2011:1-992.
[2]張曉峒.Eviews使用指南與案例[M].北京:機械工業出版社.2007:84-87,121-122
[3]鄧媛,李瑞光.VAR模型實證分析云南省教育投入與經濟增長的關系[J].2009(2):1-6.
[4]馬鵬媛,米紅.高等教育規模與經濟增長關系演變的實證研究[J].2012(2):1-5.
[5]蔡文伯,程璐.新疆教育增L與高等教育規模VAR模型[J].2012(12):1-3.
中圖分類號:B844.2 文獻標識碼:A 文章編號:1000-6729(2008)008-0628-02
焦慮是青少年最常見的心理問題之一,其發病率甚至高于成人[1],但對青少年群體不同亞組的焦慮分布研究少見。本文以高中學生為樣本,調查其焦慮水平與一些人口學資料之間的關系。
1 對象與方法
1.1 對象
采用分層隨機整群抽樣方法,調查長沙和岳陽各一所中學(城市)、瀏陽一所中學(農村)的高一至高三年級學生。發放問卷1612份,收回有效問卷1561份,其中長沙中學558人,岳陽中學41人,瀏陽中學592人;男生755人,女 生779 人,缺失27人;獨生子女 726 人,非獨生子女 791 人,缺失44人;父親受教育程度:文盲60人,小學359人,初中371人,高中516人,大學或以上139人,缺失116人;母親受教育程度:文盲89人,小學410人,初中424人,高中458人,大學或以上66人,缺失114人;家庭月收入:< 1000 元249 人, 1000-1500元386 人,1500-2000元294 人,2000-3000元245 人,3000-4000元119 人,4000-5000元46 人,> 5000元42 人,缺失180人。
1.2 工具
兒童多維焦慮量表中文版(The Multidimensional Anxiety Scale for Children-Chinese Version,MASC-C)[2]為自評量表。共包括39個條目,分為4個因子:軀體癥狀、躲避傷害、社交焦慮、分離焦慮/恐怖。要求受試者說明最近一周內焦慮癥狀或感覺出現的頻度,采用0-3級評分。
1.3統計方法
進行獨立樣本t檢驗、單因素協方差分析、Logistic 回歸分析。
2 結 果
2.1 不同人口學特征學生兒童多維焦慮量表中文版的評分比較
農村組的焦慮癥狀總分、軀體癥狀及躲避傷害因子分均高于城市組(47.1±15.9/44.7±16.5、11.0±6.5/9.5±6.7、15.3±3.9/14.8±4.3,t=2.819、4.091、2.243,P=0.005、0.000、0.025)。女性組的焦慮癥狀總分、軀體癥狀、躲避傷害、社交焦慮及分離焦慮因子分均高于男性組(49.9±16.1/41.5±15.4、11.3±6.9/8.8±6.2、15.5±4.1/14.4±4.2、15.0±5.2/13.4±5.5、8.1±4.4/4.9±3.8,t=10.470、7.315、5.257、5.727、15.272,均P
父親受教育水平較低的高中生的焦慮癥狀總分及4個因子分均較高,母親受教育水平較低的高中生的焦慮癥狀總分及軀體癥狀、社交焦慮、分離焦慮因子分均較高(見表1);按家庭月收入分組的各組被試在焦慮癥狀總分及各因子分上的差異均未達到統計學顯著水平。單因素協方差分析結果顯示:控制其他人口學變量后,不同父親教育程度組別之間的焦慮癥狀總分及各因子分差異均未達到統計學顯著水平,不同母親教育程度組別之間在社交焦慮因子分上仍存在顯著差異(F=2.942,P=0.019)。
2.2 焦慮影響因素的多分類有序變量Logistic回歸分析
將被試的MAS-C焦慮癥狀總分為因變量,按百分等級分為3組:57分為3組(百分等級75以上)。將居住地、性別、同胞狀況、父母受教育水平引入多分類有序反應變量Logistic 逐步回歸模型,最終僅性別進入Logistic 回歸方程(OR 值為0.436,P
3 討 論
本研究結果顯示女性是青少年產生焦慮癥狀的危險因素,與Twenge JM、王芳芳等的研究一致[3-4]。居住地為農村、非獨生子女以及父母受教育程度低的高中生,其焦慮水平較高,但進行協方差分析后上述差異就消失了。提示居住地、同胞狀況及社會經濟狀況等變量并不是獨立對焦慮水平起作用的,可能相互間存在作用的重疊。
參考文獻
[1] 劉賢臣,孫良民,唐茂芹,等. 2462名青少年焦慮自評量表測查結果分析. 中國心理衛生雜志,1997,11(2): 75-77.
[2] 鄒濤, 姚樹橋, 朱熊兆,等. MASC 中文版信效度的分析及與西方樣本的比較. 中國臨床心理學雜志,2007, 15(5): 452-455.
[3] Twenge JM, Nolen-Hoeksema S.Age, gender, race, socioecono-mic status, and birth cohort diffe-rences on the Children's Depression Inventory: A meta-analysis. J Abnorm Psychol,2002, 111 (4): 578-588.