L22 大數據處理
分析與應用
強調數據分析的嚴謹性、統計基礎與大數據架構知識。約含 25% Python 程式碼閱讀題(pandas 等),適合資料分析、商管背景考生。
L221機率統計基礎
L22101 敘述性統計與資料摘要技術 計算題 ▾
集中趨勢平均數、中位數、眾數 — 偏態分佈下各指標的適用性
離散程度變異數、標準差計算;Z-score = (X − μ) / σ計算
四分位距IQR = Q3 − Q1,常用於箱型圖判斷異常值必考
分佈形狀常態分佈(68-95-99.7 法則)、右偏/左偏分佈判讀
攜帶一般計算機(非工程計算機),備考時需練習手算 Z-score 與變異數。
前往 L22101 互動練習 →
前往 L22101 互動練習 →
L22103 假設檢定與統計推論 必考 ▾
t 檢定比較兩組平均數差異(例:一年級 vs 二年級身高)必考
ANOVA比較三組以上平均數差異,不能用 t 檢定,需用 F 檢定必考
卡方檢定類別資料的獨立性或適合度檢定
p 值判讀p < 0.05 拒絕虛無假設;Type I Error (α) vs Type II Error (β)
官方樣題考點:三組以上比較不可用 t 檢定,應使用 F 檢定/ANOVA。
L222大數據處理技術
L22203 數據處理技術與工具 必考 ▾
MapReduceMap:將資料映射為 key-value 對;Reduce:統合歸納資料必考
HadoopHDFS 分散式儲存 + MapReduce 批次運算,適合離線大規模處理
Spark記憶體內運算,比 Hadoop 快 10-100 倍,支援即時串流必考
串流/批次即時監控/詐騙偵測 → 串流處理;歷史報表 → 批次處理情境題
情境題:「即時監控系統應選哪種架構?」→ 串流處理(Stream Processing)。
L223 — L224分析方法與 AI 應用
L22302 常見大數據分析方法 情境題 ▾
漏斗分析分析用戶從入口到轉換的每步流失率(電商、網站行為)
時間序列物流預測 ETA、股價預測、需求預測等時序資料分析
異常偵測金融詐騙、設備故障預測 — 偵測偏離正常模式的紀錄必考
圖論分析社交網路分析、推薦系統關聯分析
情境配對題常考:給企業情境 → 選最適合的分析方法(詐騙→異常偵測、即時追蹤→時間序列)。
L22404 大數據隱私保護、安全與合規 必考 ▾
GDPR歐盟資料保護法:被遺忘權(Right to be Forgotten)、資料可攜權必考
差分隱私在統計查詢結果加入隨機噪聲,保護個人隱私同時保留統計效用必考
CCPA加州消費者隱私法,賦予消費者知情權與選擇退出權
ZTA零信任架構(Zero Trust Architecture):不預設信任,持續驗證
差分隱私的目的:在發佈統計資料時保護個人隱私(不是加密,而是加噪聲)。
科目選擇提示:L22 偏統計與資料處理,適合商管、資管、BI 分析背景;若對模型訓練與調參更有興趣,可考慮 L23。兩科都含約 25% Python 程式碼閱讀題。