GPU（圖形處理器）是什麼？完整定義與解說

機器學習深度學習

你有沒有遇過算圖、剪片、訓練模型時，電腦明明很新卻還是卡？

你可以把 GPU 想成專門處理很多相似小計算的工人群。它不一定每一步都比 CPU 聰明，但能同時做很多件事，所以在深度學習、影像處理和渲染上特別有用。

你可以把它想成一個把抽象概念拉回日常判斷的提示，先知道它解決什麼問題，再看技術細節。

容易混淆

GPU vs CPU CPU 擅長少量複雜任務 GPU 擅長大量平行任務最關鍵的區別是單點能力強，還是同時處理很多件事

GPU vs TPU GPU 很通用，適合很多型別的計算 TPU 更偏向神經網路矩陣運算最關鍵的區別是通用性還是專用加速

記住這句就好

很多小算一起算，找 GPU。

實際案例

模型訓練 深度學習訓練需要大量矩陣運算，GPU 可以把這些運算平行化，所以訓練速度通常比只用 CPU 快很多。

影像渲染 3D 遊戲和影片特效要快速產生大量像素，GPU 就很像專門跑產線的機器，能把畫面算得又快又穩。

算法與應用

GPU 的價值在平行運算能力和記憶體頻寬，很多深度學習框架也直接把它當主要運算後端。實際挑選時，不只看算力，也要看 VRAM、驅動支援和你的工作型態。

情境判斷

Q1： 你只是想跑 Excel 和文書，需不需要高階 GPU？ → 通常不需要，這類工作主要吃 CPU 和記憶體。

Q2： 你要訓練影像分類模型，預算有限，先考慮什麼？ → 先看可用的 GPU 記憶體和雲端租用成本，再決定要不要升級硬體。

常見問題

GPU 一定比 CPU 快嗎？

不是，只有在能大量平行化的工作上才會明顯快。

VRAM 為什麼重要？

因為模型和資料要放得下，記憶體不夠就會變慢甚至跑不動。

雲端 GPU 值得嗎？

短期實驗或偶爾訓練時常常值得，長期大量使用則要算總成本。

範例考題

在大型語言模型（LLM）的推論服務中，常透過請求批次處理（Batching）來提升系統效能。關於批次處理（Batching）機制的影響，下列敘述何者最正確？

A. Batching 可提升加速器資源使用效率並增加整體吞吐量（Throughput），但在部分情境下可能對單筆請求延遲造成影響 ✓ 正確答案
B. Batching 主要用於加快單筆請求回應時間
C. Batching 的效益主要來自降低記憶體使用量，對於吞吐量（Throughput）與延遲表現影響有限
D. Batching 在低併發（Concurrency）請求下，仍能明顯提升系統效能

解析：

Batching 的主要效益是提高 GPU 等加速器的利用率並增加系統吞吐量，但因為需要等待湊滿一批請求再一起處理，可能對個別請求的延遲造成影響。這是批次處理的典型取捨。

某紡織製造公司導入 AI 系統進行布料瑕疵檢測，每天需處理來自 30 條產線的影像資料，包括高解析度照片、感測器數值、生產參數記錄等多種格式。該公司收集的資料量從每日 2GB 增長至 50GB，且需在布料離開產線前的 3 秒內完成瑕疵判定。近期團隊發現系統在尖峰時段容易出現判定延遲，影響製程節奏。若要優先改善此問題，下列哪一種做法最適合？

A. 擴充資料儲存容量，以因應長期資料累積需求
B. 強化即時資料處理與推論計算資源配置，以降低延遲風險 ✓ 正確答案
C. 調整資料格式標準，以降低跨來源整合複雜度
D. 增加資料驗證與清理機制，以提升資料品質穩定性

解析：

系統在尖峰時段出現判定延遲，核心問題是即時推論的計算資源不足。強化即時資料處理與推論的計算資源配置（如增加 GPU、優化推論流程）能直接解決延遲問題，確保在 3 秒內完成判定。