---
title: "主成分分析（Principal Component Analysis）"
slug: principal-component-analysis
language: zh-TW
source: https://aiterms.tw/terms/principal-component-analysis
updated_at: 2026-04-29
tags: [統計方法, 特徵工程]
ipas_term: false
---

# 主成分分析（Principal Component Analysis）

> **你有沒有一堆欄位太多，想先濃縮成幾個重點再分析？**
>
> 你可以把 主成分分析 想成 把很多欄位濃縮成少數幾個重點方向。
>
> 維度太高時，計算和理解都會變難，找出變化最大的方向，把資料壓縮到更少維度 這件事就特別重要。
>
> 你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

### 容易混淆
> **主成分分析 vs 特徵選擇**
>
> 特徵選擇像直接從一堆食材中挑出幾樣你覺得最重要的，把其他都丟掉；主成分分析像把所有食材打成綜合果汁，雖然還是所有食材都在裡面，但變成了更濃縮、更精華的幾種成分。
>
> 最關鍵的區別：一個壓成新座標，一個保留原欄位。
>
>
> **主成分分析 vs 特徵選擇**
>
> PCA 是把特徵壓成新座標，特徵選擇是直接挑原本欄位留下
>
> 最關鍵的區別：一個換座標，一個挑欄位。

### 記住這句就好
> 找出變化最大的方向，把資料壓縮到更少維度

### 實際案例
> **案例 1：把上百個感測器欄位壓成少數幾個主成分**
>
> 這種情況下，主成分分析 會幫你把原本手工或靠直覺的步驟變得更穩。
>
>
> **案例 2：先降維再做分群，讓視覺化更清楚**
>
> 另一個常見場景也能看出 主成分分析 的價值，因為它處理的是同一種核心問題。

### 算法與應用
> 核心意思就是：找出變化最大的方向，把資料壓縮到更少維度。
>
> 常用在視覺化、降噪和加速後續模型訓練
>
> 若資料本身是非線性結構，PCA 不一定最合適

### 情境判斷
> **Q1（直覺題）：** 把上百個感測器欄位壓成少數幾個主成分 這種情況，會先想到 主成分分析 嗎？
>
> → 會，因為它正好在處理這件事的核心問題，只是還要看資料乾不乾淨、流程穩不穩。
>
>
> **Q2（判斷題）：** 想保留原始欄位名字時，還適合用 PCA 嗎？
>
> → 看情況，若你需要可解釋欄位，特徵選擇通常比 PCA 更直觀

### 常見問題
> **Q：主成分分析的特徵值代表什麼意義？**
> 特徵值代表對應主成分所解釋的變異量大小。
> 特徵值越大，表示該主成分包含的資訊越多，也就越重要。
> 我們可以根據特徵值的大小來選擇需要保留的主成分數量，通常會選擇累積解釋變異量達到一定比例（例如 80%）的主成分。
>
> **Q：如何判斷主成分分析的降維效果好不好？**
> 可以透過觀察累積解釋變異量來判斷降維效果。
> 如果選取少數幾個主成分就能夠解釋大部分的變異量（例如 85% 以上），則說明降維效果良好。
> 此外，也可以比較降維前後模型的性能，如果降維後模型的性能沒有明顯下降，甚至有所提升，則說明降維是有效的。
>
> **Q：主成分分析是否適用於所有類型的資料？**
> 主成分分析是一種線性降維方法，對於線性結構的資料效果較好。
> 如果資料具有高度非線性的結構，PCA 的效果可能不佳。
> 在這種情況下，可以考慮使用非線性降維方法，例如 Kernel PCA 或 t-SNE。
> 另外，PCA 對於缺失值比較敏感，需要先對缺失值進行處理。

### 相關術語
> - **特徵工程**：看完這個再讀它，會更容易把概念串起來
> - **非監督式學習**：看完這個再讀它，會更容易把概念串起來
> - **機器學習**：看完這個再讀它，會更容易把概念串起來
> - **K 均值分群**：看完這個再讀它，會更容易把概念串起來
> - **密度分群**：看完這個再讀它，會更容易把概念串起來

---

來源：https://aiterms.tw/terms/principal-component-analysis
快查頁：https://aiterms.tw/terms/principal-component-analysis
最後更新：2026/04/29
深度解說：https://aiterms.tw/learning/what-is-principal-component-analysis