使用說明

我是天橋底下說數的,可能會將所有和數學有關的事情分成九十九段,每日不停輪流的廣播,希望聽眾不會少。

2012/07/09

看新聞‧學數學-小樣本

相差12歲「寶建戀」 4成2網友不看好


(前略......)
有網路媒體也馬上趕上這波姊弟戀的熱潮,舉辦民調,問問網友們對這段戀情未來發展的看法,但是投票才剛進行不到24小時,卻有百分之42的網友不看好寶媽和汪建民
(後略......)

請大家想想,這篇報導的問題在哪呢?


簡單來說,當樣本很小時,統計結果常常會出現一些比較極端的狀況,然後再慢慢回歸正常。

常見的例子是,棒球比賽開季時,總是會出現一些很恐怖的投打數據,像是打擊率超過.500、防禦率0.00、強隊連敗、弱隊連勝......等,可是當賽事持續進行,這些可怕的數據就會一一回歸開賽前所預期的了。當然,某些黑馬球員或黑馬球隊,他們的表現還是會在我們預期之外。

回到這則新聞上。筆者認為最大的問題是,為什麼要強調「投票才剛進行不到24小時」呢?難道記者是很肯定,當時間越來越長,不看好的百分比一定會增加嗎?

如果今天的報導是:「投票才剛進行不到24小時,卻有『4200個』網友不看好寶媽和汪建民」。那就不會有什麼問題了,因為接下來的數據,一定大於等於4200。

原因就是,一個是比例,一個是累計數據。

結論就是,這篇報導沒什麼大問題,但是強調的那句話,實在讓人猜不透原因。

沒有留言:

張貼留言