解析:
Batching 的主要效益是提高 GPU 等加速器的利用率並增加系統吞吐量,但因為需要等待湊滿一批請求再一起處理,可能對個別請求的延遲造成影響。這是批次處理的典型取捨。
圖形處理器(GPU)是一種專為並行處理設計的電子電路,最初用於加速圖像渲染,現廣泛應用於深度學習等需要大量計算的領域。|本頁含完整原理、應用場景、iPAS 考試重點與 3 個常見問答。
你有沒有遇過算圖、剪片、訓練模型時,電腦明明很新卻還是卡?
你可以把 GPU 想成專門處理很多相似小計算的工人群。 它不一定每一步都比 CPU 聰明,但能同時做很多件事,所以在深度學習、影像處理和渲染上特別有用。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
GPU vs CPU CPU 擅長少量複雜任務 GPU 擅長大量平行任務 最關鍵的區別是單點能力強,還是同時處理很多件事
GPU vs TPU GPU 很通用,適合很多型別的計算 TPU 更偏向神經網路矩陣運算 最關鍵的區別是通用性還是專用加速
很多小算一起算,找 GPU。
模型訓練 深度學習訓練需要大量矩陣運算,GPU 可以把這些運算平行化,所以訓練速度通常比只用 CPU 快很多。
影像渲染 3D 遊戲和影片特效要快速產生大量像素,GPU 就很像專門跑產線的機器,能把畫面算得又快又穩。
GPU 的價值在平行運算能力和記憶體頻寬,很多深度學習框架也直接把它當主要運算後端。 實際挑選時,不只看算力,也要看 VRAM、驅動支援和你的工作型態。
Q1: 你只是想跑 Excel 和文書,需不需要高階 GPU? → 通常不需要,這類工作主要吃 CPU 和記憶體。
Q2: 你要訓練影像分類模型,預算有限,先考慮什麼? → 先看可用的 GPU 記憶體和雲端租用成本,再決定要不要升級硬體。
不是,只有在能大量平行化的工作上才會明顯快。
因為模型和資料要放得下,記憶體不夠就會變慢甚至跑不動。
短期實驗或偶爾訓練時常常值得,長期大量使用則要算總成本。
在大型語言模型(LLM)的推論服務中,常透過請求批次處理(Batching)來提升系統效能。關於批次處理(Batching)機制的影響,下列敘述何者最正確?
解析:
Batching 的主要效益是提高 GPU 等加速器的利用率並增加系統吞吐量,但因為需要等待湊滿一批請求再一起處理,可能對個別請求的延遲造成影響。這是批次處理的典型取捨。
某紡織製造公司導入 AI 系統進行布料瑕疵檢測,每天需處理來自 30 條產線的影像資料,包括高解析度照片、感測器數值、生產參數記錄等多種格式。該公司收集的資料量從每日 2GB 增長至 50GB,且需在布料離開產線前的 3 秒內完成瑕疵判定。近期團隊發現系統在尖峰時段容易出現判定延遲,影響製程節奏。若要優先改善此問題,下列哪一種做法最適合?
解析:
系統在尖峰時段出現判定延遲,核心問題是即時推論的計算資源不足。強化即時資料處理與推論的計算資源配置(如增加 GPU、優化推論流程)能直接解決延遲問題,確保在 3 秒內完成判定。