(前略......)
有網路媒體也馬上趕上這波姊弟戀的熱潮,舉辦民調,問問網友們對這段戀情未來發展的看法,但是投票才剛進行不到24小時,卻有百分之42的網友不看好寶媽和汪建民。
(後略......)
請大家想想,這篇報導的問題在哪呢?
簡單來說,當樣本很小時,統計結果常常會出現一些比較極端的狀況,然後再慢慢回歸正常。
常見的例子是,棒球比賽開季時,總是會出現一些很恐怖的投打數據,像是打擊率超過.500、防禦率0.00、強隊連敗、弱隊連勝......等,可是當賽事持續進行,這些可怕的數據就會一一回歸開賽前所預期的了。當然,某些黑馬球員或黑馬球隊,他們的表現還是會在我們預期之外。
回到這則新聞上。筆者認為最大的問題是,為什麼要強調「投票才剛進行不到24小時」呢?難道記者是很肯定,當時間越來越長,不看好的百分比一定會增加嗎?
如果今天的報導是:「投票才剛進行不到24小時,卻有『4200個』網友不看好寶媽和汪建民」。那就不會有什麼問題了,因為接下來的數據,一定大於等於4200。
原因就是,一個是比例,一個是累計數據。
結論就是,這篇報導沒什麼大問題,但是強調的那句話,實在讓人猜不透原因。
常見的例子是,棒球比賽開季時,總是會出現一些很恐怖的投打數據,像是打擊率超過.500、防禦率0.00、強隊連敗、弱隊連勝......等,可是當賽事持續進行,這些可怕的數據就會一一回歸開賽前所預期的了。當然,某些黑馬球員或黑馬球隊,他們的表現還是會在我們預期之外。
回到這則新聞上。筆者認為最大的問題是,為什麼要強調「投票才剛進行不到24小時」呢?難道記者是很肯定,當時間越來越長,不看好的百分比一定會增加嗎?
如果今天的報導是:「投票才剛進行不到24小時,卻有『4200個』網友不看好寶媽和汪建民」。那就不會有什麼問題了,因為接下來的數據,一定大於等於4200。
原因就是,一個是比例,一個是累計數據。
結論就是,這篇報導沒什麼大問題,但是強調的那句話,實在讓人猜不透原因。
沒有留言:
張貼留言