敘述性統計與
資料摘要技術
透過互動計算器建立 Z-score 公式手感,再以四題練習檢驗集中趨勢、變異數標準差、四分位距異常值判斷等核心考點。
Z-score 互動計算器interactive
Z = (X − μ) / σ
175
165
5
Z-score
2.00
該觀測值高於平均值 2.00 個標準差。
練習題4 題
某班級數學成績平均為 70 分,標準差為 8 分。學生小明考了 86 分,請問他的 Z-score 為多少?
A. 1.5
B. 2.0
C. 2.5
D. 16
Z = (X − μ) / σ = (86 − 70) / 8 = 16 / 8 = 2.0。小明的成績高於平均 2 個標準差。選項 D 是分子分母搞混的常見錯誤(誤把差值直接當答案)。
某社區的家戶所得資料中,多數家庭月收入在 4-6 萬之間,但有少數家庭月收入超過 50 萬。若要描述「一般家庭」的所得水準,最適合使用哪個指標?
A. 平均數(Mean)
B. 中位數(Median)
C. 變異數(Variance)
D. 標準差(Standard Deviation)
資料中存在極端值(少數超高收入家庭)會把平均數拉高,導致平均數無法代表「一般」家庭的實際所得水準。中位數不受極端值影響,更能反映多數人的真實情況,這是右偏分佈資料的典型考點。
關於變異數(Variance)與標準差(Standard Deviation)的敘述,下列何者正確?
A. 變異數與原始資料的單位相同
B. 標準差是變異數的平方根,與原始資料單位相同
C. 標準差越大代表資料越集中
D. 變異數只能用於常態分佈的資料
變異數是原始資料單位的「平方」(例如身高單位 cm,變異數單位是 cm²),而標準差 = √變異數,因此標準差才與原始資料同單位,這是報告解讀時較常用標準差的原因。標準差越大代表資料越分散(不是越集中)。
某資料集的 Q1(第一四分位數)為 20,Q3(第三四分位數)為 50。依據箱型圖判斷異常值的常見規則(IQR 法則),下列哪個數值會被視為異常值?
A. 35
B. 55
C. 100
D. 15
IQR = Q3 − Q1 = 50 − 20 = 30。異常值判斷上界 = Q3 + 1.5×IQR = 50 + 45 = 95;下界 = Q1 − 1.5×IQR = 20 − 45 = −25。100 超過上界 95,屬於異常值;15、35、55 都落在 −25 到 95 之間,屬於正常範圍。