星期二, 12月 26, 2006

化妝品的故事---推估統計與虛無假設

時近期末,我知道大家非常忙碌,所以有一段時間沒有post部落格讓大家回應了。不過,這樣的用意,是讓大家能夠「趁機」補齊之前遺漏的回應與作業。請大家千萬不要忘記囉!

上一次的課堂裡提到:研究者在「實驗法」裡所運用的「推論統計」,主要是「比較」實驗組在經過某項「實驗處理」之後(treatment) ---是不是有所「差別」(difference)。換句話說,我們想知道研究者對實驗組實施了某項「實驗處理」後,原組在「後測」與「前測」之間到底有何具體成效與進步;而就算「差別/進步」產生了,到底夠不夠顯著。

例如說,某位心理學研究者採用了一種新的CBT諮商治療法 (這就是所謂的「實驗處理」)來治療案主。而他想知道:到底這個新的方式與傳統的諮商方式「比較」,能不能對案主產生「更佳」的療效 (這就是所謂的:「差別/進步」)。

在統計學上,為了要檢驗這個「差別/進步」(difference):我們都會先設一個「虛無假設」。

這個意思就是說,統計學家先假設:經過「實驗處理」之後----實驗組的前測(X1) 與後測(X2)成績完全沒有差別。再用這個「沒有差別」(虛無)的假設 (X2- X1 = 0),來跟實際的「前測後測」的差異作比較 (X2 -X1 = P) 。如果經過計算,我們發現前後測的差異 (P - 0) 達到了「統計上的顯著差異」,而不僅僅是有「些微差別」而已,那麼我們就推論:我們的「實驗」有效 (effective)。反之,如果沒有達到一定的顯著差異,那麼這個實驗就被認定為無效。

上述的基本概念,是所有推論統計的核心。

換句話說。在任何推論統計當中,
我們總是去「比較」實驗後與實驗前的「差別」是不是超越了某個誤差值的門檻(這就是所謂的信心水準),而達到了所謂「統計顯著水準」(Statistical Significance)。

讓我再舉個例子好了。

假設妳用了一種化妝品,而妳想要知道這個化妝品到底「有沒有效」。推論統計上的作法是:第一,妳一定要「比較」妳自己「使用前」與「使用後」化妝品的差別是否夠「顯著」。假設妳用了這個化妝品「之前」(前測)與「之後」(後測)產生了「天壤之別」的效果(這就是所謂「統計顯著水準」。用了這個化妝品之前「不堪入目」(哈哈);用了之後,竟然「美若天仙」)----妳才能確定這個化妝品是「有效」的。然而,如果只有產生「一點點一滴滴」的差別----我們就不能判定這個化妝品是有效的。

第二。妳還要「確定」妳是不是真的用了這個化妝品才美若天仙----還是妳天生麗質,「本來」就美若天仙,跟是不是使用化妝品全然無關。

這是非常複雜的概念,我們下一次見面就會詳盡解釋。而這裡想要讓各位同學「天馬行空」地想想看-----在我們實施統計或者實驗程序的時候,「誤差」產生的來源會是什麼,又要如何避免?

31 則留言:

叮叮的家 提到...

誤差 = 測量值 - 真值

談實驗數據往往會先談到 誤差的定義。於是出現了上面的式子。
誤差 就是 所測得的數值 與 被測量物理量 真正數值之間的差別。
好像很有道理,又好像在講廢話!

先想一想,為什麼我們要從事測量?(才能有測量值!)
如果 我已經知道 想測量的物理量的真值,我為什麼還要去測它?
難道就為了要 知道測量的誤差嗎?

就是因為不知道 物理量的真值才要測量。

那! 誤差的定義 又有什麼用呢?

實驗數據的處理與分析 便是想運用統計的方法,
讓我們從多次的測量數據中,估算出 最接近 真值 的數據。
也就是我們所想要的測量結果。並藉由 誤差的分析,讓我們瞭解

我們所做的估算,可信度有多高!並探討實驗誤差的可能來源。

拿一杯開(茶)水或咖啡,以下可有好一陣子讓妳(你)想一想的!



--------------------------------------------------------------------------------

誤差的種類:(依照來源)
一般而言,可以分為 系統誤差(systematic error)與 隨機誤差(random error)。
1. 『系統誤差』:

所謂測量,乃是大家事先公定有一測量 單位(標準),例如 公尺。
然後依據製造出含刻度的測量工具(例如 尺),

將測量工具 和待測物相互比較,而判得 測量值。

如果測量工具本身所顯示的刻度,因為

校正時疏忽,造成不正確。
或因為 環境的因素(例如溫度 壓力等),使得數值產生變化。

或因 人為不正確(或不熟練)操作或 觀測方法錯誤。

都是可能產生 系統誤差的來源。
對於某些非 直接測量的物理量,依據某 原理或方法設計出來的實驗。

也有可能因為 實驗時 無法充分滿足 原理所假設的狀況,

或根本設計原理有失誤,而造成系統誤差。(這也是很多人常忽略的)

通常 『系統誤差』會使得所有測量值 都過高或過低的偏差,

偏差量大致相同,不含機率分佈的因素。
2. 『隨機誤差』:
實驗的基本方法,往往是希望能 控制變因,
以找出 物理量受 個別變因的影響。
因此 總是希望 控制所有影響的變因,一次只讓一種變因變化。
實驗的設計便是盡量能達到上述的目的。

而且為了實驗簡便,往往也忽略對實驗影響較微小的因素。(也比較實際)

但實際操作時,不見得盡如人意。

這些不易控制(有時候無法控制)的小變因,

便會使測量值產生隨機分佈的誤差。
也就是說 有些測量值會過高,有些則會稍低。


--------------------------------------------------------------------------------

降低 『系統誤差』的方法,當然只有靠 正確分析誤差來源:
儀器造成的 → 設法改良儀器。
環境造成的 → 設法控制實驗環境。

操作不良的→ 只好 加強訓練自己了喔!

理論上 或許可能將儀器誤差完全消除,
但是 前兩項的改善,並不需要做到 最完美的情形! ???

奇怪! 不是儀器越精良,環境越穩定 實驗結果越好嗎?
因為 這些改善的要求,牽涉到 對測量值 所要求的『精密度』
與實際環境與經費等的考量 。
而且改善時 應該以所有誤差來源 所造成測量誤差的比例,
能以約略相同的比例 減少才有效。
例如:把所有經費大部份都買最精密(也最昂貴)的儀器,
環境因素卻因為能力不夠改善(或已經改善至最好境界),
但仍然造成較大比例誤差,則精密的儀器不過是 花冤枉錢 吧了!

碳的 電阻係數(resistivity) 的溫度係數 = -0.0005 (於 20oC )

也就是說 碳的 電阻值 當溫度升高 1 Co時,電阻值會減少 萬分之五。

若是使用 6位有效位數的電表(數萬元)來測量實驗過程中的電阻值,

但實驗過程中並未注意(或控制)溫度變化,而使得 碳電阻器的溫度

有好幾度的變化,則 效果和只用 3-4位有效位數的電表(數千元)一樣。

降低『隨機誤差』的方法,則是我們以下所要探討的:
藉由 統計的方法,提供我們如何(藉由增加測量次數)
最有效率的改善『隨機誤差』。


--------------------------------------------------------------------------------

準確度與精密度:

精密度:當多次重複測量時,不同測量值彼此間偏差量的大小。如果多次測量時,
彼此間結果皆很接近,則稱為精密度較高。
準確度:準確度的定義是 測量值與 真值(或公認值)的偏差程度。
公認值通常指 使用已知較準確且精密度高的實驗儀器,
在優良訓練的實驗人員重複操作下,所得出精密度相當高的 實驗結果。

但實驗時 不見得有所謂公認值存在。

問題: 你認為 精密度與準確度之間有直接的關係嗎?
精密度高的結果,準確度一定高嗎?
準確度高的結果(平均值),精密度一定高嗎?


--------------------------------------------------------------------------------

測量本身必然造成誤差。(抬槓篇)
當去測量 待測物時,需要去觀測它,也就因此改變了待測物。

例如:用溫度計去測量物體溫度,則溫度計溫度因而改變至與待測物相同,
溫度計所變化的溫度是 兩者能量交流的結果。
也因此待測物 測後溫度已經不同於 測量前了。

問題:難道 用尺去測量長度也會影響待測物長度嗎?
當然這種影響很小(但還是存在 --抬槓嘛!)
當你要用尺去測量物體時,會要求兩者之間無相對運動,

(相對運動也可以,但一樣會牽涉到時間與其他的問題)

則必然要對他們施力,於是造成 通常很微弱的形變。

再不行,我還有最後法寶 --- 測不準原理。

當然 測量的方法,也有所謂的 非破壞性測量。
也就是說不主動去干擾 待測物,而只是測量 待測物所 產生的訊號。
例如:利用物體的黑體輻射測量其溫度,
但物體會輻射也就表示 其物理量(溫度)在變動。

欣凌 提到...
網誌管理員已經移除這則留言。
欣凌 提到...

誤差 就是 所測得的數值 與 被測量物理量 真正數值之間的差別。
老師不好意思因為我要回台北所以不能去上課了要是老師要看證明我在拿車票給你看我是丙班同學5號

薀淇 提到...

例如: 天氣預報的誤差主要有兩個來源﹕
各國的天氣預報都不一定準確。
1. 從數值產生﹕我們無法直接求大氣運動之方程解,而任何數值方法都只是一種近似解,與真實天氣會有誤差。
2. 測誤差﹕任何的觀測都會有誤差,更何況在廣大的海洋、森林或冰雪覆蓋的偏僻地區,至今仍沒有氣象觀測站,因此絕大部分的初始資料誤差是由觀測所產生的。
既然天氣預報的誤差無法避免,前面又提到,數值天氣預報過程所產生的誤差會隨時間增加而增大,試想空中一隻飛舞的蝴蝶,當蝴蝶拍動翅膀時,造成周圍氣流擾動,將使天氣狀況產生些微的偏差。根據洛倫子理論,這個小的擾動將隨時間增加而擴大,最後可能造成劇烈的天氣變化。 因此巴西雨林的蝴蝶輕揮翅膀,數個月以後(誤差擴大需要時間)可能引發紐約大風雪,這在理論上是可能發生的,此即一般所稱的蝴蝶效應。
截至目前為止,數值天氣預報最長只能預測到一個星期左右而已,超過7天的數值天氣預報,其準確性還非常不可靠。

瑞吟 提到...

如果資料來源沒有信效度的話,就容易產生
"誤差"

Unknown 提到...

誤差是所有統計最無可避免的一環,通常來自受量測對象的刻意隱瞞或測量工具的不夠精確。
所有的研究者都會把誤差的消滅或降低列為最重要的一個考量,但是實際上,我們只能逼近,卻無法完全達到。
如何設計出一份能解除受測者的防禦心理,願意坦承一切諮詢事項的問卷,或研發出一套幾乎不會有任何遺漏錯誤的統計工具,將是我們在做研究時,可以達到最大信度的理想與期待。

muchi 提到...

在日常生活中會碰到很多資料或數字,你可以比大小、比多寡、或是比兩者的關聯性,都要靠統計。那統計數據的收集方法,包括直接數據來源、間接數據來源和第三類數據來源,因此統計學與數據有著密切的聯繫。
統計學所處理的就是從樣本中觀察及加計無所不在的誤差,並把這不確定性納入統計模型,做更佳的預測與解釋。比如說以一個描述學生成就的路徑分析模型而言,有兩個變項可能分別是父母的教育程度和收入,接下來會影響到學生對自己的期望,進而才影響到學業成就。而期望與成就都有誤差項,顯示還有其他因素會影響到這兩個變項,只是在這個模型中,沒有考慮到的因素就歸為誤差。

☆chi☆ 提到...

誤差就是所測得的數值與被測量物理量 真正數值之間的差別

peterlien 提到...

以化妝品為例:
1.使用的次數
2.使用的時間點
3.使用的季節
4.使用的量多少,是否正確
5.膚質問題,使用前是否有做檢測和紀錄
如何避免:
1.使用方法一定要明確,一定要嚴格執行
2.使用前先將皮膚做一次徹底的檢查並做紀錄
誤差應該是指實驗前和實驗後的數量的差異,差異越大代表假設是正確的,不知我說的是否正確?

amimi 提到...

化粧品的東西其實並沒有一個絕對性的答案,常常因為使用這的麩質或過敏的關係兒有不同的成效,所做出來的結果不就跟我們那組做的心理測驗有異曲同工之妙嗎?
這只是我一點點的小看法,請老師不要見諒喔!

郭淑惠 提到...

化妝品是美化女生的秘密武器,有人天生麗質美若天仙,實在無法判定是化妝品的作用,有人必須依靠化奘品來美化門面,化妝品在使用前後有了差別,在實驗時前後測的差異達到了「統計上的顯著差異」,就推論化妝品有效
,但做實驗時必須有母群作研究樣本,包括樣本的膚質、年齡、使用時間及方式,這些因素會影響實驗的結果,產生取樣上誤差。
做研究時,樣本資料未必全能符合母群的真實情形,增加樣本數可以減少取樣誤差,為了避免取樣偏差,人為的因素或不適當的取樣也是非常重要的原因。

Fanny0923 提到...

誤差 = 測量值 - 真值
談實驗數據往往會先談到 誤差的定義。於是出現了上面的式子。誤差就是所測得的數值與被測量物理量真正數值之間的差別。 好像很有道理,又好像在講廢話! 先想一想,為什麼我們要從事測量(才能有測量值!)如果我已經知道想測量的物理量的真值,我為什麼還要去測它? 難道就為了要 知道測量的誤差嗎? 就是因為不知道 物理量的真值才要測量。 那!誤差的定義又有什麼用呢? 實驗數據的處理與分析 便是想運用統計的方法,讓我們從多次的測量數據中,估算出 最接近 真值 的數據。 也就是我們所想要的測量結果。並藉由 誤差的分析,讓我們瞭解 我們所做的估算,可信度有多高!並探討實驗誤差的可能來源。
誤差的種類:(依照來源)
一般而言,可以分為系統誤差(systematic error)與 隨機誤差(random error)。
1.『系統誤差』:所謂測量,乃是大家事先公定有一測量 單位(標準),例如 公尺。 然後依據製造出含刻度的測量工(例如尺, 將測量工具 和待測物相互比較,而判得 測量值。 如果測量工具本身所顯示的刻度,因為 校正時疏忽,造成不正確。或因為環境的因素(例如溫度壓力等),使得數值產生變化。 或因人為不正確(或不熟練)操作或 觀測方法錯誤。都是可能產生 系統誤差的來源。 對於某些非 直接測量的物理量,依據某 原理或方法設計出來的實驗。 也有可能因為 實驗時 無法充分滿足 原理所假設的狀況, 或根本設計原理有失誤,而造成系統誤差。(這也是很多人常忽略的) 通常 『系統誤差』會使得所有測量值 都過高或過低的偏差, 偏差量大致相同,不含機率分佈的因素。
2.『隨機誤差』:實驗的基本方法,往往是希望能 控制變因, 以找出 物理量受個別變因的影響。因此總是希望控制所有影響的變因,一只讓一種變因變化。實驗的設計便是盡量能達到上述的目的。而且為了實驗簡便,往往也忽略對實驗影響較微小的因素。(也比較實際)但實際操作時,不見得盡如人意。 這些不易控制(有時候無法控制)的小變因, 便會使測量值產生隨機分佈的誤差。 也就是說 有些測量值會過高,有些則會稍低。

降低 『系統誤差』的方法,當然只有靠 正確分析誤差來源:
1.儀器造成的 → 設法改良儀器。
2.環境造成的 → 設法控制實驗環境。
3.操作不良的→ 只好 加強訓練自己了喔!
理論上 或許可能將儀器誤差完全消除, 但是 前兩項的改善,並不需要做到 最完美的情形! ??? 奇怪!不是儀器越精良,環境越穩定 實驗結果越好嗎?因為這些改善的要求,牽涉到對測量值 所要求的『精密度』 與實際環境與經費等的考量 。而且改善時 應該以所有誤差來源 所造成測量誤差的比例, 能以約略相同的比例 減少才有效。例如:把所有經費大部份都買最精密(也最昂貴)的儀器, 環境因素卻因為能力不夠改善(或已經改善至最好境界), 但仍然造成較大比例誤差,則精密的儀器不過是 花冤枉錢吧了!
降低『隨機誤差』的方法,則是我們以下所要探討的: 藉由統計的方法,提供我們如何(藉由增加測量次數),最有效率的改善『隨機誤差』。

胡玉琴 提到...

推估其實用於很多方面是很方便我們能快速知道答案例:考試上榜律、選舉...或預估颱風、環境空氣品質....但後者又會誤差更大,巷環境品質也會因城鄉而有所誤差。
虛無假設的立足點通常市假設沒有發生任何特殊事件,也沒有發生任何變化,而且是只有一個樣本且給某一個特定者。
女性愛美使用化妝品,聽到廣告就會心動去購買但實際用過後效果如何沒有實際的證據更會因人而不同,熱門的減肥藥層出不窮但藥效如何?成功減重?答案也是五花八門。就如目前我們在使用的體重計算表因公式不同標準體中也有所不同,因此也備受爭議。
Dear Teacher:
Happy New Year!

幸福氣息 ~ 繞著您
事事順心 ~ 跟著您
財源滾滾 ~ 黏著您
好友貼心 ~ 守著您
家人關心 ~ 伴著您
所有不順 ~ 遠離您
唯我誠心 ~ 祝福您..
Sherry 胡

unayun 提到...

任何科學上的實驗離不開測量,測量就會有數據,數據免不了就有誤差,誤差的原因包括人為因素及隨機因素,前者例如儀器不良,測量技術不佳,後者例如溫度變化,一陣風吹等,他們所產生的誤差分別為系統性誤差與隨機性誤差。
系統性誤差可以改進,隨機性誤差只能順其自然

Sammy 提到...

真的有時看民調的數據與選舉出來的最後結果都有所誤差,跟選出來的結果並不同~所測得的數值 與 被測量物理量 真正數值之間的差別。

three cats 提到...

親愛的老師為了要答覆您的部落格問題,本人以用心的回覆了,只是期待老師您多給學生評論,好讓學生了解是否學生的想法與找到資料有錯誤,請老師多多指教。

茶茶☆═─ 提到...

誤差 = 測量值 - 真值
誤差發生的原因有筆誤口誤等人為誤差、累積誤差、儀器誤差等。
人為誤差要靠檢核資料去發現錯誤,比如說測量草稿要留底、測量員和紀錄員報數值要複頌一次等。
累積誤差則要儘量減少累積次數和平差,各種測量都有其平差方式。
儀器誤差則是要定期校正儀器,也可以兩台儀器互相調校。

佩琳 提到...

一般我們所得到的數據為
測定值=真值+誤差
誤差是由於很多不同的原因所發生的
(1)雖用同一測定器,同一測定者重覆測定同一樣本,也會發生重覆誤差。
(2)如果用不同測定器測定同一樣本時,會發生測定者間的誤差。
(3)如果用不同測定人員測定同一樣本時,會發生測定者間的誤差。
(4)雖然同樣一批物品,因所抽取樣本的不同而發生抽樣誤差。
所以我們所獲得數據中,一定包括各種不同原因所引起的誤差

阿飛 提到...

所測得的數值 與 被測量物理量 真正數值之間的差別。所有統計當中多多少少都會有誤差,誤差越大就表示離正確值越遠,誤差越大就是越接近正確值。

依雯 提到...

進行實驗對照時,為避免形成實驗結果誤差,實驗樣本的必須是一致的,就如老師舉的化妝品例子,例如要測試一罐消除黑眼圈的眼霜是否有效,必須找兩個臉上的黑眼圈都差不多一樣重的人來實驗,兩個人的睡眠作息時間必須一致,而且鼻子要沒有過敏(鼻子過敏嚴重的人本身容易形成黑眼圈),這樣才能獲得沒有誤差的實驗結果,如果測試者其中一人,經常很晚睡,那麼一定會的覺得這罐眼霜是無效的! 不知道這樣說對不對?

馨黛 提到...

之前看老師留言解釋的「誤差」雖然老師打了很多解釋,可是我還是一頭霧水,不過經過這禮拜老師安排的課程之後,我對「誤差」這個名詞總算有了一些正確的概念了。

菊菊 提到...

這學期ㄉ上課感想
自從期中考之後整個人變得很懶散,對於老師所上ㄉ課程內容都沒給予回應,真是非常對不起認真想把一些想法傳授我們ㄉ老師ㄚ,在此跟老師您說一聲sorry。現在我盡可能把一些作業補齊,希望老師不要介意,我並不是不喜歡此課程,而是我本身就不太碰電腦這一類ㄉ東西,所以回到家也很少開電腦。上禮拜在下課之餘剛好有空檔可以跟老師有交談ㄉ機會,我覺得老師對學生真的很客氣,也很會替當學生ㄉ我們著想,每個禮拜所要上ㄉ課程內容會先在部落格公佈,讓我們可以先對接下來ㄉ課程有一些了解,只是老師ㄉ好意都被我們給辜負掉ㄌ。而且有些課程真的很難理解,但是老師會用比較簡單ㄉ方式去做比喻,讓我們能更快去了解,嗯!我喜歡這種方式,這樣上起課來也不會很悶。知道老師也還在修博士論文,在這裡也先預祝老師能盡快修得學位,這樣以後ㄉ學生會更有福氣ㄛ。《像我們一樣》

菊菊 提到...

老師今天上課內容所提到的「虛無假設」和「實驗假設」我很快就懂了,不過以化妝品為例,我覺得一個產品的好與壞或使用前、使用後有無差別,其實會不會也是見仁見智呢?這當中或許是使用了某產品所產生的心理作用,你認為使用了此產品皮膚有很大的改變,但是周遭的朋友或許會覺得還好吧,皮膚還是跟之前一樣阿。我不知道這樣的論點是否正確但這是我的一些想法。

☆chi☆ 提到...

如果資料沒有正確與真實的數值是有誤別就可叫做誤差

nancy 提到...

如果我們去測量一樣實際的物體或東西,那這物體本身會有一個實際的量,但由於受限於測量工具的精密度,因此只能測量到物體的近似值,所以不論測量何種東西或物品,多少都會產生誤差。

fan 提到...

以化妝品為例,其實使用的結果有沒有差別要由很多方面來看,或許A女用了很有效,結果B女用了沒有效果,環境(氣候)也會影響.
所以研究做出來多少都會有誤差,只是多或少的問題

sophia 提到...

誤差就是跟正確答案有出入的意思
就像氣象報告它是用電子儀器測量出來的 但往往都跟當天的天氣有所誤差 使得許多的上班族跟學生都不知該穿什麼才好
老一輩的人都會說 我的風濕痛都還比氣象來的精確 哈哈哈哈哈哈 好像是唷 誰叫氣象報告老是出差錯

黃昭紋 提到...

誤差就是跟正確答案有不一樣的意思,
因為每個人的膚質不一樣,
所以大家用起來的效果不一樣

sophia 提到...

以化妝品的使用來說,其誤差來源可能來自使用者本身,體質是個很大的影響因素,例如:過敏體質,在還沒達到效果就已經被迫中斷使用或者是使用大一半就停止了,當然在效果項就會有所誤差,另外,其使用方法也是一大來源,有人天天差,甚至一天擦個兩三次,有人兩天捕魚三天曬網,其使用效果當然也會有所誤差。
回歸到實驗程序,很可能就是在設計時,未將使用者的個人因素考慮在內,才會導致誤差的情形。另外沒有按照時驗程序或少了其中一個步驟去進行,也可能造成誤差,例如,實驗程序時先檢驗使用者體質,再去評估其適合使用哪一組的化妝品,而在操作時卻是依照個人經驗去評斷,再使用後才去評估使用效果這中間當然也會有所誤差。
所以在做實驗時務必照著事先所定的研究程序進行時,應謹慎來處理,並遵守毎一個步驟,並確實執行,才不會等到實驗結束後,才發現其誤差太大,而且這誤差還是人為因素造成的,實驗又要重新來過一次。

Angel 提到...

哇!老師你的化妝品例子好貼切喔!大致上可體會但看到一些數字似乎有點熟悉又陌生呢!
而誤差值越小其準確度越大,相對地信心水準就高,更能讓他人信服喔!!

Huang 提到...

關於這個我有個深刻的案例:
案主因為父親驟逝於不願對"某些大人"開口,
我們上半年讓原班導師教導,
原班導師說無效,
下半年找心理醫生,醫生診斷出他有選擇性緘默,個案依然只願搖頭和點頭...
過半年找來心裡諮商師,過了半年...
真神奇,他竟然會回答我問題了,
結論是:
心理學的諮商方法真的有效,只是,該怎麼使用?
還有醫生的心理專業權威何在?
還是這個個案真的很特殊?