iPAS AI 應用規劃師 中級 科目三

114 年第二梯次 ・ 50 題深度拆解

這份教材把 50 道考古題變成「白話版深度拆解」,目的不是背答案,而是幫你真正理解每題在考什麼,下次出題形式變了還是答得出來。

怎麼用
  1. 點題目進去,先自己作答,再看完整拆解
  2. 每題依序帶你走過:白話情境 → 舊方法為什麼不夠 → 新方法怎麼解 → 技術版(程式碼/公式題含 5 Step 練習)→ 3 個錯選項拆解 → 5 道變形題 → 5 個延伸節點
  3. 技術版覺得難可以先跳過,等讀完其他題目回頭再來

下方每題標題下的小字是題目原文(不含選項),幫你判斷想先看哪題。

  1. Q01交叉驗證怎麼評估模型泛化能力?某零售企業建立一個銷售預測模型,希望評估該模型在不同月份的新資料上,是否仍能維持穩定的預測表現。資料科學團隊計畫利用統計方法檢驗模型對未觀察資料的適應能力與泛化效果。下列哪一種方法最適合用於此目的?
  2. Q02L1 正則化怎麼產生稀疏模型?在建立迴歸或分類模型時,若希望避免模型過度擬合(Overfitting),可透過加入正則化項以限制模型的複雜度。其中,L1 正則化(Lasso)的主要效果為何?
  3. Q03非凸函數最佳化為何容易陷入局部最優解?在訓練非線性模型時,若目標函數為非凸函數(Non-convex Function),演算法在參數更新過程中可能出現多個極值點,導致最佳化結果不穩定。請問此時最可能發生下列哪一種情況?
  4. Q04DBSCAN 中不符合條件的點被歸為什麼?在執行 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)群集分析時,若某資料點鄰域內的樣本數不足以形成核心點(Core Point),且該點未被任何核心點的鄰域所包含,也未與其他群集形成密度可達關係(Density Reachability),此資料點最終將被歸類為哪一種類型?
  5. Q05CNN 第一層卷積層主要做什麼?某智慧製造公司開發一套影像辨識系統,用於自動檢測生產線上的瑕疵產品。系統採用卷積神經網路(Convolutional Neural Network, CNN)作為主要模型架構,其中第一層卷積層(Convolutional Layer)主要負責的功能為下列何者?
  6. Q06CNN 為何比全連接網路更有效率?某智慧城市團隊開發一套交通監控系統,用於即時辨識路口監視器影像中的車輛與行人。團隊比較後發現,卷積神經網路(Convolutional Neural Network, CNN)在訓練與推論效率上,明顯優於傳統的全連接神經網路(Fully Connected Neural Network, FCNN)。請問下列何者為主要原因?
  7. Q07LSTM 最適合哪種應用情境?下列哪一種應用最適合採用長短期記憶網路(Long Short-Term Memory, LSTM)模型?
  8. Q08資訊增益主要應用在哪類模型?資訊增益(Information Gain)常用於衡量特徵對分類結果的不確定性貢獻程度,並據以進行特徵選擇。此方法主要應用於下列哪一類模型架構中?
  9. Q09距離型模型最關鍵的前處理是什麼?在建構以距離為基礎的機器學習模型(如 KNN、SVM)時,下列哪一項資料前處理方式最為關鍵?
  10. Q10AutoML 最適合哪種應用情境?下列哪一種應用情境最適合導入 AutoML,以提升模型開發效率?
  11. Q11Random Search 在高維超參數空間的優勢相較於 Grid Search,Random Search 在超參數調整上具備哪一項主要優勢?
  12. Q12學習率怎麼影響模型收斂速度?某智慧製造公司開發一套設備故障預測系統,利用感測器資料訓練深度神經網路(Deep Neural Network, DNN)模型,以提前偵測異常運作跡象。在訓練過程中,團隊發現模型收斂速度不穩定:有時太快導致過擬合,有時又遲遲無法達到最佳準確率。開發團隊可以藉由調整下列哪一項超參數(Hyperparameter)以改善此問題?
  13. Q13標籤偏差是怎麼產生的?標籤偏差(Label Bias)通常是因為什麼原因造成?
  14. Q14哪種 AI 應用最需要可解釋性?下列哪一種 AI 應用情境中,模型的可解釋性(Explainability)最為關鍵?
  15. Q15線性迴歸的 R² 值 0.85 代表什麼意義?在線性迴歸模型中,若 R² 值為 0.85,其意義為何?
  16. Q16Precision 0.8、Recall 0.6,F1 分數是多少?在二元分類問題中,若精確率(Precision)為 0.8,召回率(Recall)為 0.6,則 F1 分數(F1 Score)為何?
  17. Q17哪種優化演算法內建動量機制?下列哪一種優化演算法內建動量(Momentum)的設計機制?
  18. Q18XGBoost 相較於傳統 GBDT 有哪些技術改進?下列何者最能同時反映 XGBoost(eXtreme Gradient Boosting)相較於傳統梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)的主要技術改進?
  19. Q19不平衡資料集中,哪種做法最不適合提升少數類預測?某醫療機構開發疾病早期偵測模型,正樣本(確診病例)僅佔 3%。在模型訓練與評估過程中,下列哪一種作法最不適合用於提升對少數類病例的預測能力?
  20. Q20互動特徵怎麼設計?乘積交叉組合是關鍵某電子商務公司為開發商品評論情感分析模型,希望模型能捕捉評論中不同特徵之間的關聯影響,例如「商品價格」與「顧客滿意度」的互動效果。下列哪一種特徵工程設計方式最適合用於建立互動特徵(Interaction Features)?
  21. Q21多頭注意力機制為什麼能捕捉多層次資訊?某語音辨識系統開發團隊採用 Transformer 架構,為了讓模型能同時理解語音片段中的發音特徵、語速變化與語意脈絡等多層次資訊,團隊在設計中導入了多頭注意力(Multi-head Attention)機制。請問下列何者為此機制的主要優點?
  22. Q22貝氏定理如何預測購買機率?某電商平台希望預測顧客是否會購買特定商品。系統蒐集顧客的瀏覽紀錄、停留時間、商品類別偏好與過去購買行為,並以此推估「在觀察到這些行為特徵的情況下,該顧客會購買的機率」。若模型採用貝氏定理(Bayes' Theorem)進行推論,下列敘述何者最符合其核心運作機制?
  23. Q23蒙地卡羅方法如何模擬不確定情境?一家再生能源公司希望預測未來三個月太陽能發電量的波動範圍。由於氣候條件具有高度隨機性,且輸入變數(如日照時數、雲量、溫度)之間存在不確定關係,工程團隊決定以隨機抽樣方式模擬多種可能情境,以估算整體發電量的機率分佈與風險區間。請問此時所採用的技術最符合下列哪一種方法?
  24. Q24殘差圖出現彎曲,迴歸模型出了什麼問題?某房地產公司利用多元迴歸模型(Multiple Regression Model)預測房價,並繪製殘差圖(Residual Plot)檢查模型品質。結果顯示部分資料點的殘差極大,且在高價區樣本中出現系統性彎曲分佈現象。根據此觀察,下列何者為最可能的正確解釋?
  25. Q25信用評分卡標準流程不包含哪一項?某金融機構正在建立傳統信用評分卡模型,採用邏輯迴歸(Logistic Regression)作為建模方法,並依循監理機關建議的標準化流程進行模型開發。下列哪一項不是傳統信用評分卡模型開發流程中的常見步驟?
  26. Q26哪個策略不屬於防止過擬合的方法?在防止監督式學習模型過擬合(Overfitting)時,下列哪一種策略不屬於降低模型複雜度或限制學習能力的作法?
  27. Q27線性激活函數讓模型無法學複雜特徵,怎麼改?某智慧製造團隊在開發瑕疵影像偵測模型時,發現使用線性激活函數(Activation Function)後,模型的訓練準確率長期停滯,懷疑模型無法學習到足夠複雜的特徵表達。若要改善此問題,下列哪一項調整方案最為合適?
  28. Q28顧客流失模型對新會員預測不準,原因是什麼?一家零售電商公司希望建立顧客流失預測模型,用以判斷哪些會員可能在三個月內不再消費。團隊以去年會員資料進行訓練,並僅採用「曾經購買三次以上」的活躍顧客紀錄作為樣本。模型上線後,對全體會員進行預測時,發現模型對於新註冊會員與低消費會員的預測準確率明顯偏低。下列何者為造成此現象最可能的原因?
  29. Q29設備故障預測模型長期運行後效能下降,怎麼解決?在工業設備故障預測專案中,模型訓練與超參數調整均依賴於一段歷史數據作為驗證集。然而,隨著設備運行環境與工況條件的變化,原有驗證集已無法充分反映現況,導致模型在實際部署後的預測準確率逐漸下降。下列哪一種策略最能有效提升模型在長期運行環境中的穩定性與泛化能力?
  30. Q30情感分析模型跨語言後 F1 驟降,最合理的解釋是什麼?某情感分析模型在英文資料集上取得 macro F1-score = 0.91。當該模型部署於西班牙文資料集時,F1-score 驟降至 0.58。下列哪一項解釋最合理,且與 F1-score 變化相關?
  31. Q31驗證損失波動時怎麼用早期停止法?某能源公司利用歷史氣象與用電資料,開發長期電力需求預測模型,採用深度神經網路架構進行訓練。在訓練過程中,模型在訓練集上的損失值持續下降,但在驗證集上,損失在第 80 輪後開始波動,呈現週期性上升與下降。團隊懷疑模型受到季節性資料波動與隨機噪音影響,導致驗證損失難以穩定收斂。若要在此情境下合理運用早期停止法(Early Stopping)以確保模型具最佳泛化能力,下列哪一項策略最為適當?
  32. Q32想自動篩選特徵又防過擬合,該用哪種正則化?某電信公司開發客戶流失預測模型,使用大量顧客行為特徵,例如通話時長、上網頻率、帳單金額、客服聯絡次數等。在訓練過程中,團隊發現部分特徵彼此高度相關,但同時也懷疑有些特徵對流失預測的貢獻有限。若希望模型在避免過擬合(Overfitting)的同時,能自動篩選出較具代表性的特徵,採用下列哪一種方法最為合適?
  33. Q33逐一比對所有客戶相似度,時間複雜度是多少?某資料科學團隊正在開發一個客戶相似度比對系統,用於計算所有客戶之間的相似度分數。若系統需逐一比對每一位客戶與其他所有客戶的資料組合,此時演算法的時間複雜度最可能為哪一種?其代表意義為何?
  34. Q34少量不平衡醫療資料,最適合哪種交叉驗證?某醫療人工智慧團隊正在開發心臟病風險預測模型,資料量僅有 150 筆,其中陽性個案不到 8%。由於樣本數稀少且類別分佈極不平衡,團隊希望在有限資料下,仍能準確評估模型在不同資料上的表現穩定性,同時避免訓練資料被過度切分而影響模型效能。若團隊希望在有限樣本下,同時兼顧資料的利用率及各類別在驗證折中的比例一致性,最適合採用下列哪一種交叉驗證方法?
  35. Q35PCA 特徵值怎麼決定保留幾個主成分?某公司針對製程感測器資料進行主成分分析(PCA),經標準化與協方差矩陣分解後,得到三個主成分的特徵值如下:λ1=6.0,λ2=3.0,λ3=1.0。若團隊決定僅保留能解釋至少 80% 總變異量的主成分,以進行後續模型建構,下列哪一項敘述最合理且數據解讀正確?
  36. Q36同態加密在加密資料上直接運算是什麼意思?某銀行計畫與多家合作機構共同訓練一個 AI 信用風險預測模型,為避免客戶交易資料在傳輸與運算過程中外洩,技術團隊評估使用同態加密(Homomorphic Encryption)技術。下列何者最能正確描述同態加密在此應用中的關鍵特性?
  37. Q37跨銀行聯合訓練 AI 需要哪些安全技術組合?某跨銀行風控平台希望整合多家銀行的用戶行為資料,用於訓練信用風險預測模型。由於競爭與法規限制,各銀行僅願意提供加密後資料,且資料在任何時間不得被平台解密。同時,平台需建立安全通訊協議以確保資料在傳輸過程未被竄改或重放。下列哪一組技術最能完整對應上述需求?
  38. Q38這段 Python 計算的是哪個迴歸評估指標?附圖程式碼所計算的是哪一類型的評估指標? def metric(y_true, y_pred): return sum((y_true - y_pred) ** 2) / len(y_true)
  39. Q39這段隨機遮罩程式碼實現的是哪種正則化?附圖程式碼實現的是哪一種正則化技術? def forward(x, p, training=True): if training: mask = np.random.binomial(1, p, size=x.shape) return x * mask / p else: return x
  40. Q40np.dot(v1, v2) 結果是多少?NumPy 向量矩陣運算識別依據附圖程式碼進行資料處理,下列何者正確? import numpy as np v1 = np.array([1, 2, 3]) v2 = np.array([4, 5, 6]) A = np.array([[1, 2], [3, 4]])
  41. Q41Monte Carlo 怎麼算條件機率 P(A|B)?考慮擲出骰子並採用 Monte Carlo 方法估算條件機率,參考附圖程式碼。 import numpy as np np.random.seed(123) n = 100000 dice_rolls = np.random.randint(1, 7, size=n) A = (dice_rolls % 2 == 0) B = (dice_rolls > 3) A_and_B = A & B 事件…
  42. Q42VGG16 哪一層的參數量最多?VGG16 是由牛津大學 Visual Geometry Group (VGG) 在 2014 年提出的經典卷積神經網路(Convolutional Neural Network, CNN)架構。該模型以簡潔且規則的層堆疊設計聞名,廣泛應用於影像分類、特徵提取及遷移學習等任務。附圖程式碼載入了預訓練的 VGG16 模型,並輸出其完整層級結構及參數統計摘要(如附表,總參數約 138,357,544)…
  43. Q43VGG16 哪一層的運算量(FLOPs)最多?VGG16 連題組第二題:在神經網路中,了解各層的運算量分佈,有助於模型壓縮與硬體加速的策略設計。請問在 VGG16 中,下列何者運算量(FLOPs)最多?
  44. Q44VGG16 架構哪個敘述正確?VGG16 連題組第三題:VGG16 層數深且結構規則,由多層卷積、池化及全連接層組成。了解各層的輸入/輸出維度、參數量及記憶體需求,有助於掌握 CNN 模型的組成邏輯與實作技巧。根據 VGG16 的模型架構,下列敘述何者正確? (A) AdaptiveAvgPool2d 的輸出會被攤平後傳入第一個全連接層;由於前一層池化輸出空間為 4×4,所以第一個線性層的輸入維度是 512×4×4 = 819…
  45. Q45VGG16 遷移學習怎麼凍結卷積層只訓練全連接層?VGG16 連題組第四題:在實務應用中,我們常使用遷移學習(transfer learning)技巧,即載入預訓練模型(如 VGG16),凍結部分層的參數,只針對特定任務重新訓練最後幾層,這種做法可節省訓練時間並提升模型效能。假設你要對 VGG16 進行遷移學習(transfer learning),希望凍結卷積層的參數,只訓練最後全連接層(classifier)。下列哪段程式碼寫法正確?
  46. Q46PCA 降噪失效,哪一段程式碼需要修改?在郵遞區號自動辨識的研究中,研究人員收集了一份手寫數字影像資料集(UCI sklearn digits, 8×8 灰階),共 1797 筆。研究人員把含有雜訊的手寫數字影像存放在變數 noisy 中,部分資料經視覺化後外觀如附圖所示。他們嘗試使用 PCA 進行降噪,並希望能保留影像的主要特徵,同時去除影像中的雜訊。 程式碼如下: 程式碼 A: import numpy as np; noisy =…
  47. Q47KNN 搭配交叉驗證,哪幾組程式碼能正確執行?KNN 連題組第二題:研究人員在對 digits 資料集進行分類時,決定使用 KNN 並搭配交叉驗證來評估模型準確率。他們撰寫了四組不同的程式碼來進行 KNN 訓練與交叉驗證,但不確定哪幾組程式碼能正確執行並輸出準確率。請問哪幾組程式碼能正確使用 KNN 搭配交叉驗證,對 digits 資料集進行訓練並輸出準確率? 程式碼 A:使用 StratifiedKFold(n_splits=5, shuf…
  48. Q48Titanic MLP 資料標準化,哪些敘述正確?使用鐵達尼號(Titanic)資料集進行多層感知機(Multilayer Perceptron, MLP)分類預測分析,其中 survived 為反應變數(1 表示存活,0 表示死亡)。資料載入後切分為 X_train(前 9 欄)/y_train(survived)/X_test/y_test,型別為 float32。 參考下圖程式碼: X_train -= X_train.mean(axis=…
  49. Q49Titanic MLP 參數量怎麼算?Titanic MLP 連題組第二題:參考下圖執行結果,下列何者正確? model = Sequential() model.add(Input(shape=(X_train.shape[1],))) model.add(Dense(10, activation="relu")) model.add(Dense(10, activation="relu")) model.add(Dense(1, …
  50. Q50Titanic MLP 損失曲線顏色代碼填空Titanic MLP 連題組第三題:模型訓練後繪製訓練/驗證損失曲線,圖顯示訓練損失(藍實線)持續下降,驗證損失(紅虛線)下降後在 0.45 附近趨平且小幅波動。 history = model.fit(X_train, y_train, validation_split=0.2, epochs=100, batch_size=10) loss, accuracy = model.evaluat…
← 回 iPAS 備考總覽