iPAS AI 應用規劃師初級　科目一　人工智慧基礎概論

哪個特徵「不符合」非監督式學習？

原題 03

下列何者不符合非監督式學習（Unsupervised Learning）的典型特徵？

白話

這題給你幾個關於非監督式學習（Unsupervised Learning）的描述，請找出其中不對的那一個。

問你：下列哪一個描述不符合非監督式學習的典型特徵？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

非監督式學習不需要標籤，自己找規律；「學習輸入特徵與既定目標標記之間的對應關係」是監督式學習（Supervised Learning）的定義，不符合非監督式學習。

02　情境

先感受問題：沒有老師的機器，怎麼學？

假設你是「鮮旅行」旅遊平台的資料分析師。公司有 10 萬筆用戶行為數據：點擊記錄、搜尋關鍵字、停留時間，但這些數據沒有任何人工標記，沒有人說「這個用戶是背包客」「那個用戶是家庭旅遊客」。

主管說：「幫我把這 10 萬個用戶分成幾個不同類型，讓行銷可以針對不同類型發不同推薦。」

你面臨的困境：沒有標準答案，沒有人告訴你「正確答案是分成 5 類」，你只能讓模型自己去分析數據的相似性，找出自然的分群結構。

這就是非監督式學習（Unsupervised Learning）的用武之地：在沒有標籤、沒有老師的情況下，從數據本身找出結構。

03　對照

監督式學習 vs. 非監督式學習：差在哪？

在「鮮旅行」理解這個差別，要先想像兩種訓練方式：

有老師教（監督式）：每筆數據都有標籤，例如「這個用戶是背包客（1）」「那個用戶不是（0）」。模型學的是「哪些特徵對應哪個標籤」，有固定的正確答案可以對照
沒有老師教（非監督式）：只有原始數據，沒有標籤。模型自己找「哪些用戶的行為很像」，把相似的聚在一起，不靠任何外部定義的類別
標籤成本高：要標記 10 萬筆用戶需要人工逐一判斷，成本極高。非監督式學習的優點就是不需要標籤
目的不同：監督式學習的目的是「預測已知類型」，非監督式是「發現未知結構」。前者要有明確的目標標記，後者不需要
評估方式不同：監督式有準確率可以量化，非監督式的「好不好」較難客觀評估，通常靠業務解釋能力判斷

04　解法

非監督式學習怎麼幫「鮮旅行」分群用戶

「鮮旅行」用 K-means 分群演算法（一種非監督式學習方法），把 10 萬名用戶的行為數據丟進去，不告訴模型「正確答案是幾群」，讓它自己依據行為相似性分群。

結果出來：模型自動找出了 4 個行為群組：深度旅遊者（長停留、搜尋小眾景點）、親子旅客（搜尋親子設施、寬敞房型）、商務出差者（週一週五、市中心飯店）、快閃週末族（短停留、促銷敏感）。

這個過程完全沒有人告訴模型「這些特徵對應的類別標記是什麼」，模型純粹依據數據內部的相似性找出結構。

注意選項 D 說「學習輸入特徵與既定目標標記之間的對應關係」，這句話的關鍵是「既定目標標記」。有「標記」就代表有老師、有答案，這是監督式學習的特徵，不是非監督式學習。

這就是選項 D 為什麼不符合非監督式學習：模型主要學習輸入特徵與既定目標標記之間的對應關係，是監督式學習的定義。

技術版：三種學習範式的位置與對比

機器學習依「是否有標籤」分成三大範式，考試最常考區別：

監督式學習（Supervised Learning）：每筆訓練數據都有輸入（特徵）和輸出（標籤）。模型學習輸入到輸出的對應關係（映射函數）。典型算法：線性迴歸、決策樹、SVM、神經網路。典型任務：分類、迴歸。

非監督式學習（Unsupervised Learning）：只有輸入數據，沒有標籤。模型自己找數據的結構、分群、降維、生成。典型算法：K-means、階層式分群、PCA、自動編碼器。典型任務：分群（Clustering）、降維（Dimensionality Reduction）、異常偵測。

強化式學習（Reinforcement Learning）：沒有標籤，但有「獎懲回饋」。模型透過試錯學習最大化長期獎勵。典型應用：遊戲 AI、機器人控制、推薦系統優化。

為什麼出題者要考這題：AI 應用規劃師在選擇演算法時，第一個問題就是「我有標籤嗎？」。有標籤選監督式，沒標籤選非監督式。搞混了會選錯整個技術方向，規劃出根本跑不起來的系統。

05　陷阱

為什麼其他選項是錯的

A模型可依據資料中的特徵相似性進行自動分群

字面在說什麼

模型根據數據特徵的相似程度，自動把相似的數據點歸在一起。

為什麼不對

這正是非監督式學習的核心用途：分群（Clustering）。K-means 就是典型例子，完全依靠特徵相似性自動分組，不需要人工標籤。A 符合非監督式學習，不能選。

誰會選錯

沒看到題目是「不符合」的反向選題，直接選感覺「對的」選項的人。

B訓練過程中不需仰賴事先定義的標籤資料

字面在說什麼

訓練時不需要人工標記好的答案，模型純粹從原始數據學習。

為什麼不對

「不需要標籤」幾乎是非監督式學習的定義本身，這是它與監督式學習最根本的區別。B 完全符合非監督式學習，不能選。

誰會選錯

不熟悉非監督式學習定義，隨機猜測的人。「不需標籤」是非監督式最重要的關鍵字，要記住。

C常用於探索資料的潛在結構或隱含模式

字面在說什麼

用來發現數據中隱藏的規律，比如用戶行為中隱含的分群結構，或高維數據中的潛在維度。

為什麼不對

「探索潛在結構」是非監督式學習的核心使用情境，特別是在業務探索、數據理解、異常偵測等場景。C 符合非監督式學習，不能選。

非監督式學習（Unsupervised Learning）無需標籤、從數據自身結構學習模式，分群與降維是兩大核心應用場景
監督式學習（Supervised Learning）以標籤數據學習輸入到輸出的映射，與非監督式學習的關鍵差異在於「是否需要標記答案」
K 均值分群（K-Means Clustering）非監督式學習最代表性的分群算法，依特徵相似性自動把數據分成 K 群，無需任何標籤
降維處理（Dimensionality Reduction）非監督式學習的另一大任務，把高維數據壓縮到低維並保留重要結構，PCA 是代表算法
半監督學習（Semi-supervised Learning）結合少量標籤數據與大量無標籤數據訓練，介於監督與非監督之間，易與非監督式學習混淆