logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

農業數位化-農業4.0系統文獻評論

農業和營養物大數據

MICA 項目中將數據和資訊轉化為知識

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 
讓學生了解為什麼值得學習統計學
 

中興大學 生物系統工程研究室 陳加忠

 
 

資料來源:

https://www.stat.auckland.ac.nz/~iase/publications/17/3A1_SOWE.pdf

無論學生是作為一門學科學習統計學,如果學生覺得自己在做一些有價值的事情,學生會保留更豐富的回憶。教學中的三個要素在賦予價值感方面很重要:表明統計數據是有趣的、有用的和實質性的。但是,讓統計學被視為一門重要的學科,在適應學生自身好奇心引發的挑戰性問題的意義上,統計學教育文獻中沒有提到過。在這裡展示了服務於這一目標的各種具有挑戰性的問題。給出的答案不必過於詳細:重要的是它們滿足了學生的好奇心。通過這種方式,學生加強了學生對統計學值得努力學習的感覺。

一個強大的想法會向挑戰它的人傳達它的一些力量。” Marcel Proust (1943, p.191)

統計學作為一門重要學科

學生可能會得到這樣的印象,即統計學作為一門學科,是一系列基於復雜概念的深奧分析,用於解決深奧的問題。

即使學生被證明這些問題具有實際重要性,並且其解決方案具有內在有趣的特徵,但學生仍然可能錯過這樣的認識。即學生研究的所有統計技術都是基於明確定義和邏輯上的假設,是系統地建立的,相互關聯,應用廣泛。

簡而言之,學生沒有意識到統計學是一門重要的學科。錯過這個認識的後果是什麼?它可能會阻礙學生欣賞統計技術的卓越價值,從而扼殺學生對膚淺學習以外的任何事物的動力。相比之下,掌握統計學是一門實質學科的學生,將更加堅信它具有專業能力,因此值得仔細研究。

那麼,如何才能使統計數據的實質性變得明顯呢?

本文的論點是,讓學生發現統計學是一門重要學科的有效方法,是觀察其對挑戰性問題的適應能力。

由於有思想的人喜歡鑽研激發學生好奇心的事情。因此理想情況下,可以期望學生自己提出具有挑戰性的問題。如果老師表現出對他/她的教育角色的承諾,並建立了一種鼓勵課堂上自由提問的融洽關係,那麼肯定在更平凡的詢問會出現具有挑戰性的問題。

對於學生提出的每一個具有挑戰性的問題,無論它是否屬於課程大綱的範圍,教師都有主要責任提供完全滿足學生好奇心的答案。這樣的答案不一定要非常詳細。

在這種情況下,什麼是具有挑戰性的問題

具有挑戰性的問題是涉及統計學作為一門重要學科的本質的問題。它們是尋求解決統計理論的問題,或者是對理論技術的基礎、結構、局限性或相互聯繫的更深入洞察,或者是對這些技術在實際作業中的有效和適當應用的更全面指導。

在入門和高級統計課程中,學生都會遇到具有挑戰性的問題。

( i )質疑課堂或教科書論述中的邏輯缺陷或模糊性,

(ii)調查他/她發生並引起他/她興趣的尚未解釋的事情。在更高級別的課程中,通常還會在學生感覺到時提示具有挑戰性的問題。

(iii)關於某一特定技術的微妙之處或局限性,或關於同一目標可能有哪些替代技術可用的說法不夠多,

(iv)在某些應用統計研究中選擇統計分析的理由不充分。

介紹性統計課程中可能出現的問題

以下一系列具有挑戰性的問題,這些問題是從各個級別的課堂上收集的。這些問題廣泛存在於學生的措辭中。它們與統計教育中的主題有關。使用統計學的專業領域,例如生物統計學、計量經濟學和心理量測學,可以引出學生自己的具有挑戰性的問題。

(a) “教科書上說‘P( A) = 0 代表著事件 A 是不可能的。當投擲一枚公平的硬幣時,我們說“P(硬幣正面)= P(硬幣背面)= ½這肯定代表著“P(硬幣落在邊緣)= 0”,但這在泥濘的場地中並非不可能, 是嗎?

(b) “在一個直方圖中,為什麼每個類區間的頻率原則上必須與相應矩形的面積成比例,而不僅僅是與矩形的高度成正比?

(c) 在二項分佈的背景下,如果連續的試驗不是獨立的會發生什麼?如果每次試驗有兩個以上可能的結果會怎樣?

(d) “當常態的範圍是無限的時,怎麼能說人的身高和體重是常態分佈的?

(e) “什麼是隨機性?你怎麼知道樣本是隨機的?

(f) “如果沒有中心極限定理,統計會是什麼樣子?

(g) “對於關於多樣化母群的有效推論,為什麼擁有代表性樣本比隨機樣本更重要?

(h) “有人告訴我,知道點估計的標準誤差總是很有價值的,但在民意調查的報紙報導中,我從未見過提到標準誤差。為什麼不?

( i ) “由於點估計的最優特性無偏性、一致性和 效率,都是根據估計量的抽樣分佈來定義的,在實際中我只有一個樣品時是什麼,它們對我來說是不是很舒服?

(j) “如果我只能有 95% 的把握總體平均值位於信賴區間指定的值範圍內,那麼就我的特定樣本而言,它可能不會。 那麼,為什麼我使用信賴區間比僅使用點估計更好呢?

(k) “如果你想使用 t 檢驗,但你認為數據遠非常態分佈,你會怎麼做?

(l) “如果您正在測試平均值,並且避免 II 類錯誤實際上比 I 類錯誤更重要,那麼您如何確定您的 II 類錯誤風險實際上小於您的I類型錯誤風險?由於您不知道母群的實際價值?

( m ) “在以 Y 為迴歸量的最小二乘迴歸中,為什麼要量測殘差 平行於 Y 軸,而不是其他方向?

(n) “為什麼我們在迴歸估計中使用最小二乘,而不是殘差的其他次方?

這些問題中的每一個都顯示出工作中的好奇心。隨著新材料的引入,一些問題是自發提出的。但大多數問題是在學生有時間反思其他學生所學的內容之後提出的。

問題 (a)(d) ( i ) 表明,一個深思熟慮的學生是多麼容易,甚至毫無防備地突破過分簡化的教科書論述。問題 (b)(m) (n) 強調了在教學中為某些學生,可能看似非常武斷的慣例辯護的重要性。問題 (c) (k) 證明了感興趣的學生可能不滿足於在教學大綱邊處停下來。問題 (e) (f) 是典型的深刻思考者,學生渴望大局的理解。相比之下,問題 (g)(j) (l) 則顯示出對各種密切關注問題的敏銳思考。問題 (h) 強調了統計方法經常被非統計學家濫用的現實問題。許多初學者發現這是一個引人入勝的主題,但在第一門課程中很少受到重視。

儘管詢問的學生最初可能沒有意識到,但其中幾個問題(例如,(a)、(e)和( i ))是相當深刻的。在入門級回答這些問題而不陷入技術性的漩渦絕非易事,當然需要老師的一些深思熟慮。

總的來說,這些問題確定了學生正在尋求比課程大綱可能提供的更廣泛、更深入和/或更豐富的統計學見解。通過適當的回答,教師可以最大限度地利用這些問題提供的機會,以加強學生感覺統計學作為一門學科值得努力學習。

高水準專業課程中可能出現的問題

(o) “如果你得到一組有一些量測誤差的數據,但你不知道它們到底是什麼類型的誤差,用這些數據進行統計分析有什麼意義嗎?我在教科書中看不到任何關於這方面的內容。

(p) “我注意到總體平均值的最佳估計量是樣本平均值;總體中位數的最佳估計量是樣本中位數;總體變異量的最佳估計量是樣本變異量。我可以依靠這種模式來尋找最佳估計器嗎?

(q) “教科書說,對於給定的信賴水準,信賴區間越短越好。我可以看到,常態總體平均值的等尾信賴區間,始終是可能的最短區間,因為常態是對稱的。但是教科書還根據卡方分佈給出了該總體變異量的等尾信賴區間,這是非對稱的。這怎麼能總是產生最短的間隔呢?

(r) “如果有偏估計量可能比無偏估計量更有效,我怎麼知道更喜歡,因為在實際中我無法判斷效率的增益與有偏估計量的偏差量有多大關係?

(s) “在最大近似估計中,近似函數不是一直在增加而從未達到最大值嗎?

(t) “我如何決定在任何統計檢驗中使用什麼顯著性水準?如果我在同一個估計模型中測試多個參數,我是否應該對每個測試使用相同水準的顯著性。即使虛無假設並非都是相同的形式?

(u) “我聽說,如果我在兩個不同的樣本中評估相同的統計數據,那麼只要我使用足夠大的樣本,即使兩個值之間的微小差異也總是具有統計顯著性。真的是這樣嗎?

(v) “如果迴歸中的擬合程度(以R2衡量),在我添加另一個迴歸量時從未降低。那麼即使我添加了完全不相關的變量,我似乎也可以製作出非常合適的模型。這裡是不是有什麼問題?

(w)當您使用時間序列數據時,您如何真實地解釋基於迴歸的 95% 預測區間?讓我擔心的是你怎麼能想到在迴歸估計時間段內重複樣本實現。

(x)現實世界在任何時間段內都只有一組數據值。如果我對同一組數據進行重複迴歸,尋找最佳模型,那麼我就是數據挖掘,這很糟糕。但是假設我首先找到了最佳模型,然後我發現它。但無論哪種方式,它都是相同的模型,不是嗎?

(y) “我了解到相關並不代表著因果關係,但現在我正在閱讀一篇關於‘Granger因果關係的論文,該論文聲稱通過相關過程檢測迴歸關係中的因果關係。這裡不是有矛盾嗎?

(z) “如果估計的簡單迴歸模型的輸出顯示截距和斜率的(上尾)p 值分別為 0.004 0.002,這是不是不代表著斜率參數大於零的可能性是截距參數的兩倍?

正如高年級學生所預料的那樣,這裡的問題比上一節更多地涉及統計學的哲學基礎。這可能是複雜的領域。特別是在回答問題(r)、(t)、(w)、 ( x)和(z)時,老師會做好認真準備。

在剩下的問題中,(q)(s) (u) 表明提問者正在探究教科書解釋的表面之下。問題 (v) (y) 目的在解決悖論。問題 (p) 根據學生偶然發現的直覺合理的原則尋找真相。問題 (o) 揭示了一名學生擔心理論與實際之間可能存在的差距。

與上一節一樣,這些問題中的每一個都以某種方式代表了學生對所教思想的挑戰。如果這些問題得到令人滿意的答案,提問者將不會忽視學科對挑戰的適應力。通過這種方式,可以對統計數據的實質和力量產生令人難忘的印象。

提出具有挑戰性的問題的更多好處

具有挑戰性的問題總是在尋找問題。構思和提出這些問題代表了獨立思考的第一步。那麼,對這些問題的正確回答不僅可以增強學生對統計學值得努力學習的感覺。它們還可以增強學生的信心,即他/她在學習如何獨立學習方面取得了良好的進展,這在統計學中已經眾所周知。對學生來說,開始提出研究性問題,也就是說,開始探索統計學中未知的東西並不是那麼大的一步。