iPAS AI 應用規劃師 中級 科目一

114 年第二次梯次 ・ 50 題深度拆解

這份教材把 50 道考古題變成「白話版深度拆解」,目的不是背答案,而是幫你真正理解每題在考什麼,下次出題形式變了還是答得出來。

怎麼用
  1. 點題目進去,先自己作答,再看完整拆解
  2. 每題依序帶你走過:白話情境 → 舊方法為什麼不夠 → 新方法怎麼解 → 技術版(程式碼/公式題含 5 Step 練習)→ 3 個錯選項拆解 → 5 道變形題 → 5 個延伸節點
  3. 技術版覺得難可以先跳過,等讀完其他題目回頭再來

下方每題標題下的小字是題目原文(不含選項),幫你判斷想先看哪題。

  1. Q01情感分析在做什麼?某電商企業希望利用自然語言處理(NLP)技術,分析顧客在社群平台與商品評論中的文字內容,以即時掌握顧客對產品的滿意度變化。若採用情感分析(Sentiment Analysis)模型,其主要目的為何?
  2. Q02Transformer 為什麼翻譯長句特別準?某跨國金融科技公司導入 Transformer 架構開發多語客服系統,以提升長篇金融文件的自動翻譯品質。下列何者為該模型能顯著改善翻譯準確度的主要原因?
  3. Q03BERT 預訓練時遮住詞語在做什麼?某企業計畫應用 BERT(Bidirectional Encoder Representations from Transformers)模型分析大量顧客意見,以強化客服自動回覆系統。在 BERT 的預訓練過程中,「遮罩語言模型(Masked Language Model,MLM)」的主要訓練策略為何?
  4. Q04Word2Vec 和 GloVe 的根本差異是什麼?在詞向量(Word Embedding)訓練方法中,GloVe(Global Vectors for Word Representation)與 Word2Vec 的主要差異為何?
  5. Q05TF-IDF 在長文本上為什麼會判斷失準?某企業以詞頻-逆文件頻率(Term Frequency-Inverse Document Frequency,TF-IDF)方法分析顧客意見內容,但發現模型在處理篇幅較長的回饋文本時,無法準確反映關鍵詞的重要性。下列何者為造成此現象的主要原因?
  6. Q06N-gram 語言模型為什麼生成的句子缺乏整體連貫性?某企業嘗試以 N-gram 語言模型(N-gram Language Model)建立客服自動回覆系統,但發現模型生成的句子雖在片段上合理,卻缺乏整體語意連貫性。此問題最可能源自 N-gram 模型的哪一項限制?
  7. Q07IoU 閾值越高代表什麼?在企業導入的智慧監控系統中,模型以物件偵測(Object Detection)方式自動辨識影像中的人物與車輛。若評估指標採用平均精確率(Mean Average Precision,mAP),其中 IoU(Intersection over Union)閾值設定較高時,代表下列哪一項意義?
  8. Q08Softmax 和 Max-Pooling 差在哪?關於 Softmax 與 Max-Pooling,下列敘述何者正確?
  9. Q09資料增強讓模型效能下降,是哪裡出了問題?某企業在訓練生成式 AI 模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。下列哪一項最可能的原因與對應改善策略最為正確?
  10. Q10同時兼顧 Precision 和 Recall,要看哪個指標?如果希望同時兼顧「精確率(Precision)」和「召回率(Recall)」,下列哪一個指標可以作為綜合評估的標準?
  11. Q11DBSCAN 的兩個關鍵超參數是什麼?企業資料分析團隊使用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模型能自動區分主要群集與雜訊資料。在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
  12. Q12多重共線性怎麼解?PCA 登場某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適合?
  13. Q13Kubernetes 在 AI 部署裡做什麼?下列何者為 Kubernetes 在 AI 模型部署與運行中的核心功能?
  14. Q14超參數過度調整怎麼避免?Cross-Validation 出手在調整模型超參數(Hyperparameters)時,若希望避免因過度調整參數而導致過擬合,下列哪一種做法最有效提升模型的泛化能力?
  15. Q15Model Registry 在 MLOps 哪個階段最重要?在企業導入的 MLOps(Machine Learning Operations)流程中,Model Registry 最常用於哪一個階段?
  16. Q16Seq2Seq 適合哪種任務?下列哪一種情境中最適合使用「序列到序列(Seq2Seq)」模型?
  17. Q17RAG 檢索階段最關鍵的挑戰是什麼?在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation,RAG)是一種結合語言模型與向量搜尋的技術,可有效減少模型知識過時與產生幻覺的問題。若要建立一套高效能的 RAG 系統,下列何者為在「檢索階段」最關鍵的挑戰?
  18. Q18Attention Collapse 怎麼解?當 Transformer 模型發生「注意力分布過於平均(Attention Collapse)」的情形時,導致模型無法有效聚焦於關鍵資訊,下列哪一項策略可有效改善此問題?
  19. Q19低資源語言過擬合,怎麼不加真實語料就改善泛化?某研究團隊正在訓練一個針對低資源語言(如少數民族語言)的語言模型,但該語言僅有約 1 萬筆語料可用。在訓練過程中出現明顯的過擬合現象,若希望在不新增真實語料的前提下提升模型的泛化能力,採用下列哪一種方法最為適合?
  20. Q20GAN Mode Collapse 怎麼解?在使用生成對抗網路(GAN)進行人臉影像生成時,若出現「模式崩潰」(Mode Collapse)現象,下列哪一種方法最常被用來有效解決此問題?
  21. Q21多模態模型碰到模態缺失,怎麼辦?在多模態 AI 模型訓練或推論過程中,遇到某一模態資料缺失(例如僅有影像資料但缺少文字說明),下列哪一種策略最有效維持模型效能?
  22. Q22資料漂移怎麼偵測?某電商平台開發的顧客流失預測模型在上線數月後,預測準確率明顯下降。專案團隊懷疑顧客行為模式改變,導致模型輸入特徵的分佈與原始訓練資料不同,出現典型的資料漂移(Data Drift)問題。為了偵測並確認資料分佈是否發生變化,下列哪一種作法最合適?
  23. Q23醫院 AI 怎麼漸進式上線?某大型醫院即將部署一套輔助診斷的 AI 系統,為降低對臨床流程的衝擊,同時確保風險可控與回饋可收斂,應採取何種「漸進式部署」(Phased Rollout)策略最為合適?
  24. Q24對抗性攻擊怎麼防?哪個方法不是針對它的?某金融機構的 AI 風控系統遭受對抗性攻擊,駭客透過對輸入特徵進行微小但惡意的擾動,成功欺騙了模型。為了從根本上解決模型自身對這類攻擊的脆弱性,下列何者並非針對此種攻擊型態的技術手段?
  25. Q25AI 生成內容的著作權風險怎麼防?某企業部署生成式 AI 系統協助行銷與內容產出,但近期遭質疑部分生成內容可能涉及著作權侵權。為降低企業在法律層面的潛在責任與風險,下列哪一項策略最能有效預防侵權問題產生?
  26. Q26多重共線性怎麼解?選哪個模型?在房價預測任務中,若發現特徵如「房間數」與「坪數」存在高度多重共線性(Multicollinearity),為降低共線性對模型參數估計的負面影響,應優先選擇下列哪種模型?
  27. Q27巢狀 JSON 日誌怎麼做時序特徵萃取?某企業需分析半結構化的系統日誌(JSON 格式),以提取關鍵的時序特徵供故障預測模型使用。考量日誌結構複雜且包含巢狀欄位(Nested Fields),下列哪一種策略最有效且實務可行?
  28. Q28連續型與類別型特徵混在一起,怎麼做特徵工程?在一個同時包含連續型特徵與類別型特徵的資料集中,若希望透過適當的特徵工程流程來提升模型整體表現,下列哪一種作法最為合適?
  29. Q29CI 持續整合的核心實踐是什麼?某 AI 開發團隊為提升模型開發效率及品質控制,計畫實施持續整合(Continuous Integration, CI)流程。下列哪一項做法最符合 CI 的核心實踐,且能有效減少整合風險?
  30. Q30AI 金融系統如何確保「不可否認性」?某銀行計劃將 AI 詐欺偵測模組整合至核心交易系統,主管機關要求全流程必須符合金融監管對「不可否認性(Non-repudiation)」的資訊安全規範,以確保日後能進行法務追蹤與稽核。下列哪一項措施最能確保此要求的落實?
  31. Q31每秒萬次推論請求,什麼架構撐得住?某 AI 服務系統每次推論請求需約 1 秒完成,且必須支援高達 10,000 次請求每秒(RPS)的流量。為確保系統具備高可用性且能穩定應付流量峰值,下列哪一種架構方案最為合適?
  32. Q32哪個監控指標能最早偵測模型效能下滑?某企業已將 AI 模型部署於生產環境,為確保系統持續穩定運作,並能提前偵測模型效能可能衰退,技術團隊希望透過監控指標進行預警。下列哪一項監控指標最具預測效力,能提早發現模型效能下滑風險?
  33. Q33Word2Vec 大語料訓練時,哪種策略最能學好罕見詞?企業團隊在使用 Word2Vec 模型訓練客服文本語料時,若訓練資料量龐大且希望模型能更有效捕捉罕見詞的語意關聯,下列哪一種訓練策略最為適合?
  34. Q34自駕車要同時辨識物件類別又區分個體,該用哪種分割技術?在自駕車影像辨識系統中,開發團隊希望模型能同時辨識每個像素所屬的物件類別(例如道路、建築、行人),又能區分出同類物件的不同個體(例如多位行人)。此時最適合採用下列哪一項電腦視覺技術?
  35. Q35CLIP 能用文字提示直接搜影像,靠的是什麼技術?某媒體公司計畫導入 CLIP(Contrastive Language-Image Pre-training)模型,以協助大量影像自動標註與搜尋,並希望在無需新增訓練資料的情況下,僅透過文字提示(Text Prompt)即可識別影像內容。請問此應用情境中,CLIP 能夠達成的關鍵技術特性為何?
  36. Q36系統化找出最穩定超參數組合,最該用哪種方法?某資料科學團隊在開發預測模型時,針對多種模型設定(如學習率、樹深度、正則化係數等)進行系統化測試,希望找出在驗證資料上表現最穩定的組合。此過程最可能採用下列哪一種方法?
  37. Q37訓練大型語音模型時,怎麼降低單張 GPU 的記憶體壓力?某公司正在訓練一個大型語音合成模型,開發團隊使用多台 GPU 進行訓練,但經常出現 GPU 記憶體不足問題。由於模型架構已固定且無法更換硬體,團隊希望在維持模型效能與收斂品質的前提下,下列哪一種方法最有效降低單張 GPU 的記憶體壓力?
  38. Q38Stable Diffusion 生成影像顆粒模糊,要怎麼在生成階段改善?某影像設計團隊在使用 Stable Diffusion 生成 4K 級產品圖時,發現影像邊緣與細節存在顆粒化與模糊現象。若僅能在生成階段進行調整,希望提升畫面清晰度與紋理層次,同時避免過度平滑,下列哪一項操作最適合?
  39. Q39ARIMA 預測殘差週期性波動,代表什麼問題?某企業的資料科學團隊利用 ARIMA 模型(AutoRegressive Integrated Moving Average Model)預測每週產品銷售量。模型建立完成後,分析人員發現預測誤差隨時間呈現週期性波動,且自相關函數(ACF)顯示殘差在多個時間滯(Lag)上仍顯著不為零。根據上述現象,最合理的模型診斷結論為何?
  40. Q40VAE、GAN、擴散模型在跨模態生成上的根本差異是什麼?下列哪一項最正確地描述了 VAE(Variational Autoencoder)、GAN(Generative Adversarial Network)與擴散模型(Diffusion Model)在多模態潛在空間對齊(Latent Alignment)與生成策略上的根本差異?
  41. Q41超參數調校在 K-Fold 交叉驗證資料上同步進行,最可能導致什麼問題?在進行超參數調校(Hyperparameter Tuning)時,若直接在 K-Fold 交叉驗證(Cross-Validation)的資料上同時調整模型參數並評估效能,最可能導致下列哪一種問題?
  42. Q42模型上線後分類錯誤率飆升,最適合用什麼策略應對?若部署一個深度學習模型至金融風控系統,該模型採用鑑別式架構(如 Transformer Classifier)。然而上線後,模型對新樣本的分類錯誤率顯著上升,經檢查發現,輸入資料分佈已與原訓練集明顯不同。針對此情形,下列哪一種應對策略最為適合?
  43. Q43VAE 生成路徑 vs BERT 鑑別路徑,標注資料少的時候比哪個最有意義?某金融科技公司欲導入 AI 模型協助客服郵件自動分類(投訴、詢問、表揚)。團隊同時考慮兩種模型設計:方案 A(生成式路徑):採用 VAE 建構潛在語意空間,再結合下游分類器進行標籤預測;方案 B(鑑別式路徑):採用 BERT Classifier 直接根據輸入文本進行監督式分類。現有標注資料約 2,000 筆,資料分佈均勻但擴充成本高。若團隊希望公平比較兩種模型的資料利用效率與泛化能力,下列哪一種…
  44. Q44同時做流失預測又要生成虛擬樣本,用什麼模型最合適?某電信公司希望建立一個模型來預測顧客是否即將流失,並進一步模擬不同促銷或服務策略下顧客的行為變化,以生成多樣化的虛擬樣本資料進行 A/B 測試與行銷策略評估。若要同時兼顧預測與資料生成的需求,最適合採用下列哪一種方法?
  45. Q45PCA 降維後接 SVM,對這個作法哪個描述最合理?進行影像分類任務時,研究團隊嘗試利用主成分分析(Principal Component Analysis,PCA)將輸入特徵從 1024 維降至 100 維,並將降維後的資料輸入支持向量機(Support Vector Machine,SVM)模型進行訓練。關於此作法,下列哪一項描述最為合理?
  46. Q46模型預測準確率慢慢下降但沒有報錯,MLOps 該怎麼主動偵測?某企業的 AI 模型已部署於線上服務環境中,用於即時預測顧客流失機率。近期團隊注意到模型預測準確率逐漸下降,但系統運作正常且未出現錯誤訊息。經分析發現,近期輸入資料的分佈與模型訓練資料相比出現顯著偏移。若要在 MLOps 流程中主動偵測並預警此類問題,最應採用下列哪項措施?
  47. Q47多任務學習為什麼會讓某個任務越練越差?某金融科技公司導入多任務學習架構,讓單一 Transformer 模型同時執行 OCR(Optical Character Recognition)後的文檔分類以及命名實體辨識(Named Entity Recognition,NER)任務,以協助自動歸檔與抽取關鍵金融資訊。在部署初期,團隊發現當模型的 NER 準確率(Accuracy)提升時,文檔分類準確率反而下降。若模型架構正確且資料品質良好…
  48. Q48DBSCAN 跑百萬筆資料慢到爆,怎麼加速?某數據工程師使用 DBSCAN 演算法對一份數百萬筆的高維顧客資料進行聚類分析,但發現程式執行速度極慢,甚至出現記憶體不足的情況。若要在不改變演算法核心邏輯的前提下,最有效提升其運算效率的作法為何?
  49. Q49情感分析跨語言表現不一致,哪個說法是錯的?某電商平台導入 AI 情感分析模型,用以自動偵測顧客評論中的負面情緒並觸發客服機制。然而,上線後發現模型在面對不同語言或族群書寫風格的評論時表現不一致,例如部分語氣強烈的正面評論被誤判為負面,而禮貌但含批評意圖的評論卻被判為中性。若從技術與資料治理的角度分析,下列哪一項描述不正確?
  50. Q50生成式 AI 圖像的品牌標誌顏色老是跑掉,為什麼?某設計師使用公司內部建置的生成式 AI 工具製作行銷素材,並輸入提示語(Prompt):「請生成一張模特兒手持品牌飲料、背景為海邊夕陽的照片」。系統能正確生成主要主題與場景,但輸出的圖像中,品牌標誌顏色常有誤差,或人物手部姿勢顯得不自然。若從多模態生成模型的技術機制分析,此現象最可能是下列哪一項原因所造成?
← 回 iPAS 備考總覽