張量處理單元 是什麼?
TPU — 張量處理單元 的完整解釋
張量處理單元(TPU)是Google專為加速機器學習工作負載而設計的客製化硬體加速器,尤其擅長處理張量運算,是深度學習的利器。
容易混淆
張量處理單元 vs CPU CPU 是通用處理器 TPU 是偏向張量和矩陣運算的專用加速器 最關鍵的區別:通用和專用
張量處理單元 vs GPU GPU 也很擅長平行運算 TPU 更偏向某些深度學習工作負載 最關鍵的區別:同樣是加速器,但設計重點不同
張量處理單元 vs 雲端服務 TPU 是硬體 雲端服務是提供硬體的使用方式 最關鍵的區別:晶片和平台不要混淆
記住這句就好
大量矩陣運算,交給專門的加速晶片最划算。
實際案例
大型訓練 模型訓練要跑數十億次乘加運算時,用 TPU 可以把時間壓得更短
線上推論 在服務流量很高的時候,TPU 能幫忙把每秒處理量撐起來
算法與應用
| 矩陣乘法 | 深度學習最常見的核心運算 | TPU 對這類工作很友善 | | 平行運算 | 同時處理很多數值 | 效能高但要配合模型設計 | | 能耗控制 | 以更低功耗完成運算 | 大規模部署時很重要 | | 工作負載 | 不是每種程式都適合 | 要看模型和資料流形態 |
情境判斷
Q1(直覺題):你要把很多張圖片一起丟進模型做推論,TPU 有幫助嗎? → 有可能有幫助,尤其在批次大、矩陣運算多的情況下。
Q2(判斷題):你只是寫一個小型資料整理腳本,還需要 TPU 嗎? → 通常不需要,通用 CPU 就足夠。
相關術語
常見問題
TPU 一定比 GPU 快嗎?
不一定,要看模型類型、框架支援和工作負載。
TPU 可以拿來做訓練嗎?
可以,而且很多大模型訓練本來就會用它。
TPU 和量子電腦有關嗎?
沒有,TPU 是傳統運算的專用加速硬體。