星期二, 12月 26, 2006

化妝品的故事---推估統計與虛無假設

時近期末,我知道大家非常忙碌,所以有一段時間沒有post部落格讓大家回應了。不過,這樣的用意,是讓大家能夠「趁機」補齊之前遺漏的回應與作業。請大家千萬不要忘記囉!

上一次的課堂裡提到:研究者在「實驗法」裡所運用的「推論統計」,主要是「比較」實驗組在經過某項「實驗處理」之後(treatment) ---是不是有所「差別」(difference)。換句話說,我們想知道研究者對實驗組實施了某項「實驗處理」後,原組在「後測」與「前測」之間到底有何具體成效與進步;而就算「差別/進步」產生了,到底夠不夠顯著。

例如說,某位心理學研究者採用了一種新的CBT諮商治療法 (這就是所謂的「實驗處理」)來治療案主。而他想知道:到底這個新的方式與傳統的諮商方式「比較」,能不能對案主產生「更佳」的療效 (這就是所謂的:「差別/進步」)。

在統計學上,為了要檢驗這個「差別/進步」(difference):我們都會先設一個「虛無假設」。

這個意思就是說,統計學家先假設:經過「實驗處理」之後----實驗組的前測(X1) 與後測(X2)成績完全沒有差別。再用這個「沒有差別」(虛無)的假設 (X2- X1 = 0),來跟實際的「前測後測」的差異作比較 (X2 -X1 = P) 。如果經過計算,我們發現前後測的差異 (P - 0) 達到了「統計上的顯著差異」,而不僅僅是有「些微差別」而已,那麼我們就推論:我們的「實驗」有效 (effective)。反之,如果沒有達到一定的顯著差異,那麼這個實驗就被認定為無效。

上述的基本概念,是所有推論統計的核心。

換句話說。在任何推論統計當中,
我們總是去「比較」實驗後與實驗前的「差別」是不是超越了某個誤差值的門檻(這就是所謂的信心水準),而達到了所謂「統計顯著水準」(Statistical Significance)。

讓我再舉個例子好了。

假設妳用了一種化妝品,而妳想要知道這個化妝品到底「有沒有效」。推論統計上的作法是:第一,妳一定要「比較」妳自己「使用前」與「使用後」化妝品的差別是否夠「顯著」。假設妳用了這個化妝品「之前」(前測)與「之後」(後測)產生了「天壤之別」的效果(這就是所謂「統計顯著水準」。用了這個化妝品之前「不堪入目」(哈哈);用了之後,竟然「美若天仙」)----妳才能確定這個化妝品是「有效」的。然而,如果只有產生「一點點一滴滴」的差別----我們就不能判定這個化妝品是有效的。

第二。妳還要「確定」妳是不是真的用了這個化妝品才美若天仙----還是妳天生麗質,「本來」就美若天仙,跟是不是使用化妝品全然無關。

這是非常複雜的概念,我們下一次見面就會詳盡解釋。而這裡想要讓各位同學「天馬行空」地想想看-----在我們實施統計或者實驗程序的時候,「誤差」產生的來源會是什麼,又要如何避免?

星期四, 12月 14, 2006

量化研究(統計的兩種型態)---敘述與推論

上次跟各位同學「預告」過:從這個禮拜開始,我們要進入比較「枯燥」的研究法課程:那就是「量化研究」的基本概念與論文寫作的技術性問題....等等。

很多人把「量化研究」與「統計」混為一談。事實上,「量化」研究是一種相對於「質性」研究的概念。所謂「統計」,是從事量化研究的一種方式;可是,卻不見得是「唯一」的一種方式。舉例來說,最近很流行的「知識探勘」(data mining)就是一個跳脫傳統統計典範的研究的模式。(若是有空,會再與各位介紹這個新興的量化研究方式。)

所有的量化研究都有兩個主要的目的:「預測」(prediction)與「解釋」(generalization)現象。而任何一個好的量化研究,都要能夠符合這兩個評斷標準。或許各位還記得我們在黑板上曾經畫過的圖:一個能「涵蓋與解釋最多現象」的量化研究(越大的圈圈),就是最好的研究。

依據這個想法,我們可以把統計分為兩種:(1) 敘述性統計(descriptive statistics),與(2)推論性統計(referential statistics)。我們常用的統計概念,例如:平均數、中數...等等,都屬於「敘述性」統計這個範疇之內。而各位或許聽過的某些統計專有名詞,例如:T檢定,變異數分析...等等,都是屬於推論性統計。

而(1)與(2)之間最大的差別,在於剛剛我們所提到的「預測」與「解釋」的力量(power)。一般上,(1)的「解釋」與「預測」的力量(power)遠遠沒辦法與(2)相比。所以,當我們在寫作論文或者研究計畫時,都是以(2)的「推論性統計」當作量化研究的基本統計法。在課堂上,我也會慢慢的將這些概念跟各位介紹。

請各位將課本76頁至90頁先行預習。
並且先熟習這些概念:自變項、依變項、量尺、信度與效度等等...。

星期四, 12月 07, 2006

兩種「推估」的殊死戰

延續上述對於「個案」的探討---這裡還要繼續介紹一個新的統計觀念:「推估」。(Estimation)

一般上,「推估」分為兩種類型。一種為根據「特殊個案」的狀況所做出的診斷性/臨床性/專家推估(Clinical Estimation),一種則為針對「普通個案/母群體」所做出的統計性推估。(Statistical Estimation)。

這樣舉例來說吧。讓我們想像兩個狀況,(A)與(B)。

(A) 一個受過專業訓練的臨床/諮商心理師對某一個「個案A」作心理衡鑑。然後心理師藉由訪談、心理測驗......等等的工具瞭解「個案A」的家族史,教育背景.....等等,然後做「推估」。最後,他認為這個「個案A」罹患憂鬱症的可能性(likelihood)為百分之58。上述就是所謂:某個專業人員針對「單一個案」(個案A) 的「診斷性/臨床性/專家」推估。這樣的狀況常常在一般的心理醫療機構見得到。

(B) 另一個狀況是:有一個心理學家設計了一套心理衡鑑軟體。這套軟體首先蒐集了數以萬筆的憂鬱症病患的原始背景資料(database),並且轉化成某一個「推估」的公式,可以準確地用數學式推估任何一個人(當然,包括了個案A)罹患憂鬱症的可能性。所以,只要我們在電腦裡輸入任何一個「個案」的訪談資料、心理測驗成績與教育背景...等等的變數(variables),這套軟體就會自動告訴你這個「個案」罹患憂鬱症的可能性有多少。

所以,經由電腦的軟體估算,假設我們得出:「個案A」罹患憂鬱症的可能姓是百分之64。上述的狀況,就是所謂的:「統計性推估」。統計推估強調不涉入任何人為的主觀判斷因素,純粹讓證據/數字說話(Let numbers speak out)。

當然。既然要作「推估」,就是要盡量達到「準確」的目的。(否則為什麼我們要「推估」呢?) 很可惜地,心理學界在這兩種推估上有非常嚴重且激烈的學術論戰與分歧。大家爭論的是:上述哪一種推估,(A)或者(B),較為穩定與可靠,具備較高的「可信度」(推估結果的一致性與穩定性)。更進一步來說,這根本就是「質化」與「量化」研究的外顯的學術殊死戰!

想在這裡請教各位。基本上妳相信「專家」的所做的「專家推估」(A狀況)比較準確 ,還是電腦依據大量數據資料庫與數學式,在不受任何人為干擾的狀況(B狀況)下,所得出的推估預測較為準確? 又為了什麼?

大家不妨「推估」看看。預知詳情與解答,下回課堂分曉。: )

Jimmy

星期一, 12月 04, 2006

個案研究的兩種範疇


請各位先連結至此PPT大致瞭解「個案研究」的概念為何。

上次跟各位提到了:所有的「個案」都可以歸納成兩個種類。 第一類型為:「普通個案」(general case),第二類型則為:「特殊個案」(specific case)。

顧名思義,「普通個案」就是研究者挑選最具有「代表性」(representatvie)的某個案,並據此個案的研究結果,推估解釋(generalization)其餘相類似個案的過程。

例如:妳或者對「新台灣之子」這個議題有興趣。所以,妳在工作的環境裡找尋這樣的「個案」加以深入研究,並希望妳自己的研究成果能夠擴大解釋到所有「新台灣之子」的現象。 也就是說妳所選擇的「個案」是母群的「代表」,只要瞭解這個「普通」個案的狀況,那麼妳就能夠大致上了解所有類似個案的情況。

相反的,所謂「特殊個案」是研究者特別選擇出某個「與眾不同」的個案,並針對這個議題做更深入、更批判性的探討。其目的,是要深入挖掘某個議題,並且藉由尋找反例來「補充/說明/推翻」某個表面上看似完整的理論與現象。

例如:人人可能都會說:「學音樂的小孩不會變壞」。可是,妳卻發現妳的班上有一個很特殊的學生,他雖然學了音樂,品德、常規與學業表現卻都不如預期。這時,就是研究者採取「特殊個案研究」的方式來深入探討「學音樂的孩子不會變壞」這個陳述的時候。研究者要問的是:是不是這個「理論」(或者某些約定俗成的常識),有任何不夠完整之處?

在這裡請各位思考這個問題。

在妳周遭的環境中,能不能舉例:在「一般個案」與「特殊個案」的範疇中,各有什麼研究議題/主題符合上述的分類?

星期日, 12月 03, 2006

記得(憂傷的「俗民誌」)















拍了這張照片,在陰雨的午後。
面對生命的的驟然消逝....在傷痛中,我竟沒有太多的話可以說。

那麼,走的,好走吧。

縱然沒有人知道,留下來的我們,還能夠留多久...

可是,既然留著了,讓我們繼續。
讓我們每天,都要好好的活著。

因為,只有好好的活著;
那走了的,才會被我們永永遠遠的....

記得。

P.S.
只是隨記所感(是我們研究方法論裡面的....「俗民誌」?)。謝謝關心。