前言:本站為你精心整理了社會(huì)科學(xué)實(shí)證統(tǒng)計(jì)方法應(yīng)用范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
統(tǒng)計(jì)學(xué)的應(yīng)用隨著微型計(jì)算機(jī)的普及越來(lái)越廣泛,在社會(huì)科學(xué)實(shí)證研究中幾乎是無(wú)處不在。有了一定規(guī)模的數(shù)據(jù)和一個(gè)統(tǒng)計(jì)分析軟件,就可以很方便地進(jìn)行各種估算和分析。然而由于統(tǒng)計(jì)分析方法本身并不像加減乘除那樣簡(jiǎn)單,而一些統(tǒng)計(jì)分析軟件已經(jīng)發(fā)展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作并得到結(jié)果,可能出現(xiàn)對(duì)統(tǒng)計(jì)分析方法誤用或?yàn)E用的現(xiàn)象。本文僅對(duì)一些統(tǒng)計(jì)分析中比較常見(jiàn)的問(wèn)題進(jìn)行討論,以引起各方面的重視。
1描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)是社會(huì)科學(xué)實(shí)證研究中最常用的方法。準(zhǔn)確、全面、正確的描述是所有實(shí)證分析的基礎(chǔ),如果對(duì)某個(gè)事件或某種現(xiàn)象的描述不清楚或存在偏差,那么其后的所有分析都將是值得懷疑的。一項(xiàng)研究能夠?qū)⑺芯康默F(xiàn)象或?qū)ο竺枋銮宄?,就是一個(gè)極大的貢獻(xiàn);而描述的偏差可能會(huì)引起公眾或?qū)W術(shù)界對(duì)某些社會(huì)現(xiàn)象的誤解,甚至誤導(dǎo)政府決策。但是因?yàn)槊枋鲂越y(tǒng)計(jì)所用方法簡(jiǎn)單易得,往往沒(méi)有得到足夠的重視。
均值的局限普遍用于描述樣本集中趨勢(shì)的測(cè)量之一是均值。它對(duì)于近似正態(tài)的對(duì)稱分布樣本來(lái)說(shuō)是比較好的測(cè)量,對(duì)于不對(duì)稱分布則不然,尤其會(huì)受到極端值的影響。兩個(gè)分布完全不同的樣本可能會(huì)有相同的均值,因此均值在某種程度上抹殺了樣本內(nèi)部的差異,而往往這種內(nèi)部差異正是需要我們進(jìn)行深入研究的、或應(yīng)當(dāng)引起人們注意的。為了彌補(bǔ)均值的這個(gè)缺陷,一般在報(bào)告均值的同時(shí)也報(bào)告方差,或用直方圖/散點(diǎn)圖的形式描述分布,以提請(qǐng)讀者注意群體內(nèi)部的差異。
不同群體的可比性在描述性統(tǒng)計(jì)中,往往涉及到對(duì)不同時(shí)期或不同人群的總體描述,以反映社會(huì)變化或地區(qū)差異。在社會(huì)科學(xué)中、尤其是人口研究中,不少事件的發(fā)生都是與年齡密切相關(guān)的,如我國(guó)婦女大部分在35歲以前完成了生育,從而導(dǎo)致35歲以上育齡婦女中極高的避孕現(xiàn)用率。在這種情況下,兩個(gè)樣本之間存在避孕現(xiàn)用率的差異可能只是年齡結(jié)構(gòu)的差異,而不是年齡別避孕現(xiàn)用率的差異。又如在報(bào)告流動(dòng)人口犯罪問(wèn)題時(shí),給人的印象往往是流動(dòng)人口犯罪率高于常住人口,但忽視了流動(dòng)人口的年齡和性別構(gòu)成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對(duì)兩個(gè)不同群體的比較往往會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。
絕對(duì)數(shù)的使用由于中國(guó)人口數(shù)量巨大,調(diào)查研究也比較容易得到大容量的樣本,所以對(duì)任何小概率事件用絕對(duì)數(shù)報(bào)告都會(huì)出現(xiàn)驚人的巨大數(shù)字,單純對(duì)絕對(duì)數(shù)的強(qiáng)調(diào)往往會(huì)產(chǎn)生戲劇性的效果。比較合理的方式一般是在報(bào)告某事件絕對(duì)數(shù)的同時(shí),給出該事件的發(fā)生率或占研究人群的比例。
小樣本的代表性在一次抽樣的小樣本中求得的率或比例會(huì)非常不穩(wěn)定,與另一次抽樣的結(jié)果可能會(huì)有較大差距。因此當(dāng)研究?jī)H限于從小樣本獲得的資料時(shí),應(yīng)當(dāng)在報(bào)告比例的同時(shí)也報(bào)告樣本量。
2雙變量統(tǒng)計(jì)分析
在社會(huì)科學(xué)研究中,首先分析的往往是兩個(gè)變量之間的關(guān)系,如用相關(guān)或列聯(lián)表等方法。一般在確定兩個(gè)變量之間確實(shí)有某種關(guān)系,如在經(jīng)過(guò)統(tǒng)計(jì)檢驗(yàn)后證實(shí)兩變量有顯著相關(guān)關(guān)系,進(jìn)行更進(jìn)一步的分析才有意義。因此,雙變量統(tǒng)計(jì)分析在實(shí)證分析中占有重要地位。但是,由于在應(yīng)用中對(duì)有些問(wèn)題的忽視,雙變量統(tǒng)計(jì)分析也很容易出現(xiàn)偏差或錯(cuò)誤。
卡方檢驗(yàn)的局限在利用列聯(lián)表對(duì)兩個(gè)定序/定類(lèi)變量進(jìn)行相關(guān)分析時(shí),需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)來(lái)判斷兩個(gè)變量的相關(guān)是否有統(tǒng)計(jì)上的顯著意義。不少研究結(jié)果都用卡方檢驗(yàn)的顯著性報(bào)告相關(guān)狀況。但值得注意的是,卡方統(tǒng)計(jì)量的計(jì)算本身是有局限性的,樣本越大,卡方值就會(huì)相應(yīng)增大,因此大樣本的卡方檢驗(yàn)很容易得到顯著結(jié)果。所以一般在報(bào)告卡方檢驗(yàn)結(jié)果以說(shuō)明兩變量是否顯著相關(guān)時(shí),還應(yīng)當(dāng)同時(shí)報(bào)告相關(guān)強(qiáng)度,即相應(yīng)的相關(guān)系數(shù),如Gamma,Lambda等。
統(tǒng)計(jì)意義上的顯著與差別的實(shí)際意義在檢驗(yàn)兩個(gè)定距變量的均值差別是否具有統(tǒng)計(jì)上的顯著性時(shí),也存在相似的問(wèn)題。由于樣本量越大,樣本均值分布的方差就越小,因此常用的t檢驗(yàn)結(jié)果就越可能顯著,任何細(xì)微的差別都可能有統(tǒng)計(jì)上的顯著性。但有時(shí)具有統(tǒng)計(jì)意義顯著性的差異,在實(shí)際生活中可能意義并不大,如同在兩個(gè)草堆之間找出一根草的差距,對(duì)判斷兩個(gè)草堆的大小沒(méi)有實(shí)際意義。因此,對(duì)任何檢驗(yàn)結(jié)果都應(yīng)當(dāng)有符合實(shí)際的解釋和說(shuō)明。
虛假相關(guān)問(wèn)題雙變量分析中的虛假相關(guān)問(wèn)題,幾乎在所有關(guān)于社會(huì)科學(xué)研究方法的教科書(shū)中都會(huì)涉及到,在統(tǒng)計(jì)分析方法的教學(xué)中也被視為經(jīng)典問(wèn)題。但是多少年來(lái),人們?nèi)匀辉诓粩嗟刂貜?fù)著這個(gè)“經(jīng)典的錯(cuò)誤”,即認(rèn)為可見(jiàn)的或統(tǒng)計(jì)檢驗(yàn)結(jié)果顯著的相關(guān)就是真正的相關(guān);更為大膽的做法是把這種相關(guān)關(guān)系推向因果關(guān)系。我們知道,對(duì)于有的變量來(lái)說(shuō),即使是經(jīng)過(guò)檢驗(yàn)判定兩者具有統(tǒng)計(jì)上顯著的相關(guān)關(guān)系,也不一定存在實(shí)際意義上的關(guān)系,因?yàn)榭赡苡形纯紤]到的變量或不可測(cè)量的變量在同時(shí)對(duì)兩個(gè)研究變量起作用,有時(shí)甚至可能完全是偶然的巧合。例如,火災(zāi)的大小是以火災(zāi)損失來(lái)衡量的,而參加滅火的消防員人數(shù)是與火災(zāi)大小有關(guān)的,火災(zāi)越大,出動(dòng)的消防員就越多,但凡是具有常識(shí)的人都不會(huì)根據(jù)出動(dòng)消防員人數(shù)和火災(zāi)損失兩個(gè)變量之間的高度相關(guān),斷定出動(dòng)消防員越多火災(zāi)損失就越大,因?yàn)榛馂?zāi)的規(guī)模是決定因素(但很難直接衡量)。在有關(guān)人口科學(xué)研究中也有報(bào)告虛假相關(guān)的現(xiàn)象,如人口增長(zhǎng)率的降低導(dǎo)致了經(jīng)濟(jì)增長(zhǎng)的提法就是一例。因此,在分析相關(guān)關(guān)系時(shí),應(yīng)當(dāng)根據(jù)理論、知識(shí)、經(jīng)驗(yàn)、甚至常識(shí)來(lái)判斷這種分析是否有意義、是否存在其他變量的作用(稱為外在變量),避免得出有悖于常理的分析結(jié)果。有些虛假相關(guān)是可以通過(guò)統(tǒng)計(jì)分析方法判別的,如在控制了另外一些變量后觀察兩個(gè)變量的偏相關(guān),或在雙變量分析的基礎(chǔ)上,進(jìn)一步用多變量分析深入研究。
3多變量分析
回歸分析是多變量分析中應(yīng)用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應(yīng)用。在眾多應(yīng)用中,比較明顯的問(wèn)題是使用方法是否得當(dāng)和對(duì)結(jié)果的報(bào)告和解釋是否規(guī)范、合理(見(jiàn)2002年第2期《人口研究》劉金塘文)。此外還有一些應(yīng)當(dāng)引起注意的問(wèn)題。
分析框架的重要性在社會(huì)科學(xué)研究中,各變量之間往往存在錯(cuò)綜復(fù)雜的關(guān)系,如果在進(jìn)行回歸分析之前沒(méi)有一個(gè)清晰合理的分析框架,那么回歸的結(jié)果有可能會(huì)引起質(zhì)疑。一般應(yīng)在報(bào)告回歸分析結(jié)果之前,介紹該分析的框架,如各變量的定義、各自變量與因變量的假設(shè)關(guān)系及其理由等,對(duì)建立的回歸模型做出合理性論證。有一些變量可能是作為控制變量納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對(duì)假設(shè)因果關(guān)系的模型,應(yīng)當(dāng)至少能夠說(shuō)明:(1)該因果關(guān)系在理論上是正確的、在實(shí)踐中是合理的;(2)從事件發(fā)生的時(shí)間上來(lái)說(shuō),應(yīng)當(dāng)是原因發(fā)生在先、結(jié)果發(fā)生在后。如有些回歸分析中,未加說(shuō)明即把所有與因變量顯著相關(guān)的變量都囊括在自變量中,甚至有些自變量與因變量有明顯的互為因果關(guān)系,顯得分析邏輯混亂;還有的論文在簡(jiǎn)單介紹研究背景和數(shù)據(jù)來(lái)源之后,急于建立因果關(guān)系并推出回歸分析結(jié)果,然后再根據(jù)各變量在回歸模型中的顯著性一一說(shuō)明,這相當(dāng)于事后解釋?zhuān)贿@些做法都是錯(cuò)誤的。
在具備“奔4”微機(jī)和較易操作的軟件的今天,轉(zhuǎn)瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準(zhǔn)備工作,包括文獻(xiàn)檢索和理論框架構(gòu)建,才能確保統(tǒng)計(jì)分析的科學(xué)性。
分析方法應(yīng)用的條件每種多變量方法都有各自的前提條件或假設(shè),如果這些條件不具備或者假設(shè)不成立,該方法的應(yīng)用就成問(wèn)題。如Pearson相關(guān)是考察線性相關(guān)關(guān)系,多元方差分析只能辨別線性相關(guān)因變量的多元差異,線性回歸分析假設(shè)自變量與因變量之間為線性關(guān)系,因子分析方法也是建立在各變量具有一定的線性相關(guān)基礎(chǔ)之上的;另外,在邏輯斯蒂回歸中,每個(gè)分類(lèi)都應(yīng)保證有足夠的頻數(shù),如果頻數(shù)太少就會(huì)影響參數(shù)估計(jì)的穩(wěn)定性;等等。盡管一般不在報(bào)告分析結(jié)果時(shí)說(shuō)明各種假設(shè)是否成立或條件是否滿足,但是在進(jìn)行分析時(shí)應(yīng)當(dāng)自覺(jué)地進(jìn)行考察。如果不能滿足條件或假設(shè)不能成立,就對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換或調(diào)整后再分析,或者改變分析方法。
多變量分析結(jié)果的展示和解釋多變量分析的結(jié)果一般是通過(guò)列表來(lái)展示的?,F(xiàn)在一種并不少見(jiàn)的做法是直接把統(tǒng)計(jì)軟件的輸出直接復(fù)制到論文中,我們往往會(huì)在文章中看到包括回歸參數(shù)估計(jì)、參數(shù)標(biāo)準(zhǔn)差、檢驗(yàn)統(tǒng)計(jì)值、檢驗(yàn)顯著性、偏相關(guān)系數(shù)等等n行m列的大表,使人有目不暇接的感覺(jué)。實(shí)際上參數(shù)標(biāo)準(zhǔn)差和檢驗(yàn)統(tǒng)計(jì)值是提供給分析者的信息,沒(méi)有必要列在結(jié)果中;如果不是有特別需要的話,偏相關(guān)系數(shù)也不是關(guān)注重點(diǎn);最主要的應(yīng)當(dāng)是回歸參數(shù)估計(jì)及其顯著性。
在列出分析結(jié)果之后,應(yīng)當(dāng)對(duì)結(jié)果的實(shí)際意義進(jìn)行解釋和討論,而不是復(fù)述分析結(jié)果的數(shù)學(xué)意義。此外,在多元統(tǒng)計(jì)分析中一個(gè)常見(jiàn)的問(wèn)題是分析者對(duì)變量作用不具有預(yù)期統(tǒng)計(jì)顯著性的失望,因此繞開(kāi)不顯著的變量,甚至對(duì)數(shù)據(jù)或模型進(jìn)行各種調(diào)整以獲得顯著結(jié)果。其實(shí),統(tǒng)計(jì)分析結(jié)果不顯著往往也是有實(shí)際意義的。例如在分析我國(guó)高齡老人的地區(qū)分布時(shí)發(fā)現(xiàn),高齡老人比例與當(dāng)?shù)蒯t(yī)療衛(wèi)生指標(biāo)沒(méi)有顯著關(guān)系,這說(shuō)明我國(guó)醫(yī)療系統(tǒng)還沒(méi)有具備延長(zhǎng)老人壽命的功能;另一方面也說(shuō)明這些高齡老人的存活不是主要靠醫(yī)藥維持的。所以,在解釋分析結(jié)果時(shí),只要是在分析框架中涉及并參與分析的變量,無(wú)論作用顯著與否,都應(yīng)當(dāng)給予充分的討論;對(duì)于那些由于知識(shí)或信息的限制難以下結(jié)論的結(jié)果,可以作為問(wèn)題提出,以便進(jìn)行更有針對(duì)性的進(jìn)一步研究。
此外,任何方法都有其局限性,分析結(jié)果也不會(huì)十分完美。因此在討論結(jié)果的同時(shí),也應(yīng)當(dāng)就此向讀者說(shuō)明。例如當(dāng)一個(gè)多元線性回歸分析的確定系數(shù)較低時(shí),需要指出該模型有限的解釋能力,探討可能存在但沒(méi)有納入分析的更重要的影響因素。
不必求最新、只求最合適有些研究生在撰寫(xiě)學(xué)位論文時(shí),常常因?yàn)樽约簺](méi)有應(yīng)用最新的統(tǒng)計(jì)分析方法而感到忐忑不安;在評(píng)論某項(xiàng)研究的創(chuàng)新性時(shí),有時(shí)也出現(xiàn)把學(xué)術(shù)創(chuàng)新和應(yīng)用新方法混為一談的現(xiàn)象,例如認(rèn)為應(yīng)用描述性統(tǒng)計(jì)方法的研究水平低于應(yīng)用解釋性或預(yù)測(cè)性方法的研究。新方法是層出不窮的。但是,出現(xiàn)了新方法并不意味著傳統(tǒng)方法就不再適用,而是各有千秋。統(tǒng)計(jì)分析方法是工具,哪件合適就用哪件,能用錘子解決的問(wèn)題不必開(kāi)沖床。有時(shí)越是復(fù)雜的方法,假設(shè)條件也會(huì)相應(yīng)較多,應(yīng)用的局限性更大。因此,盲目追求方法的新穎并不是高水平研究的保證,真正需要注意的是使用最合適的方法。而對(duì)所用方法的真正了解,是正確運(yùn)用統(tǒng)計(jì)分析方法的前提。
社會(huì)變遷論文 社會(huì)藝術(shù) 社會(huì)保障 社會(huì)文化 社會(huì)安全論文 社會(huì)治安 社會(huì)學(xué) 社會(huì)研究 社會(huì)轉(zhuǎn)型 社會(huì)主義建設(shè) 紀(jì)律教育問(wèn)題 新時(shí)代教育價(jià)值觀