iPAS AI 應用規劃師初級　科目二　生成式 AI 應用與規劃

Token Economics 不包含什麼？

原題 28

某市政府交通局計劃導入生成式 AI 技術來自動生成公車到站時間預測的文字報告，每日需處理約 50 萬筆交通資料並生成 1000 份報告。在評估導入成本時，團隊希望進行 Token Economics 分析（指模型推理與生成過程中，Token 使用量及其費用）。下列何者不屬於 Token Economics 的考量範圍？

白話

題目已定義 Token Economics 的範圍：「模型推理與生成過程中，Token 使用量及其費用」。有四個成本項目，其中一個不在這個定義範圍內。

問你：哪一個項目不屬於 Token Economics 的考量範圍？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

Token Economics 只管「模型跑起來用了多少 Token、花多少錢」，模型訓練階段的 GPU 記憶體成本不在這個範疇，它是訓練成本，不是推理使用成本。

02　情境

先感受問題：公車報告系統每天花多少 Token？

假設你在「台北市交通局」的數位化小組工作。主管要你估算這套 AI 報告生成系統每月的 API 費用。

你開始整理：每份報告要輸入多少交通資料（輸入 Token），AI 要生成多少字的報告（輸出 Token），每天 1000 份乘以 30 天是多少 Token，乘上費率就是每月費用。

這個計算過程就是 Token Economics 分析，關注的是「模型在執行任務（推理和生成）時的 Token 消耗」。

有一個同事說：「我們當初訓練這個模型花了大量 GPU 算力，這個要不要算進去？」

你要判斷：訓練成本算不算在 Token Economics 範圍內？

03　對照

訓練成本和推理成本，是兩件不同的事

很多人會把 AI 的所有費用混在一起，但實際上有清楚的分工：

訓練階段成本：一次性費用（或定期重訓），包含 GPU 算力費、訓練資料標注費、工程師時間。這是「建造 AI 的成本」，只有在建模型時才發生
推理階段成本（Token Economics 的範圍）：每次使用 AI 時產生的費用。用 API 時以 Token 計費；自架模型時以 GPU 運算時間計費。這是「使用 AI 的成本」，每次呼叫都發生
維護成本：監控、更新提示詞、處理異常等人力成本
基礎設施成本：伺服器、網路、儲存等固定成本
合規成本：資安審計、個資保護、法遵認證等

Token Economics 只聚焦在「推理和生成過程中的 Token 使用與費用」，也就是項目 2，不包含訓練成本（項目 1）。

04　解法

怎麼分辨什麼在 Token Economics 範圍內

一個簡單的判斷方法：「這個成本是在模型推理/生成時發生的嗎？」

輸入 Token 數量：是的，每次 API 呼叫時把交通資料送進模型，這是推理階段的輸入 Token，在範圍內。

輸出 Token 費用：是的，模型生成報告文字需要輸出 Token，按字數計費，在範圍內。

推理過程的 Token 使用量統計：是的，這就是推理的直接指標，在範圍內。

訓練階段的 GPU 記憶體成本：不是。訓練是在「建模型」，不是在「用模型」。GPU 記憶體是訓練時的硬體資源，跟推理時用了多少 Token 完全無關。而且「台北市交通局」用的是現成的語言模型 API，根本不需要自己訓練，更談不上訓練 GPU 成本。

這就是選項 C 為什麼不屬於 Token Economics 的考量範圍：AI 模型訓練階段使用 Token 數量所需的 GPU 記憶體成本，是訓練成本，不是推理使用成本。

技術版：Token Economics 在 AI 成本管理中的位置

Token Economics 是近年隨著 LLM API 商業化而興起的成本管理概念，專注在「使用 AI 推理能力的邊際成本」。

為什麼 Token Economics 很重要：傳統軟體授權費是固定的，但 LLM API 是按使用量計費。一個日處理 50 萬筆資料的系統，輸入 Token 稍微多幾個字，一個月的費用差異可能達幾萬元。Token Economics 讓你能精確預估、控制和優化這個可變成本。

Token Economics 的主要管理策略：精簡提示詞（減少不必要的輸入 Token）、批次處理（把多筆資料合成一次 API 呼叫以減少固定成本）、選擇適合任務複雜度的模型（貴的大模型不見得每個任務都需要）、快取重複查詢（相同問題不重複呼叫 API）。

訓練 vs 推理的成本結構差異：訓練是一次性大成本（可能幾十萬到幾億美元），推理是持續的小成本（每次幾分之一到幾分錢）。兩者的成本性質、計費單位、優化方法完全不同，不能混為一談。

為什麼出題者要考這題：AI 規劃師在制定預算時必須清楚知道哪些費用屬於哪個類別，才不會在評估時漏算或算錯。這道題考的是對 Token Economics 定義邊界的精確理解。

05　陷阱

為什麼其他選項是錯的

A每次 API 呼叫所需的輸入 Token 數量

字面在說什麼

每次把交通資料送進模型時，這些文字佔了多少 Token。

為什麼不對

這完全屬於 Token Economics 的核心範圍。輸入 Token 是每次 API 呼叫時的直接費用來源，Token Economics 的第一步就是估算每次呼叫的輸入 Token 量。A 是屬於範圍內的，不能選。

誰會選錯

沒注意題目問「不屬於」的人。

B生成報告內容所消耗的輸出 Token 費用

字面在說什麼

AI 生成的報告文字有多少字，每個字算多少 Token，這些 Token 的費用是多少。

為什麼不對

輸出 Token 通常比輸入 Token 貴，是 Token Economics 分析的重要項目。「生成報告」就是 LLM 的生成動作，這個動作的費用完全在 Token Economics 範圍內。B 是屬於範圍內的，不能選。

誰會選錯

看到「費用」兩個字，覺得這是成本概念，跟 Token Economics 不一樣，其實 Token Economics 就是在算費用。

D模型推理過程中的 Token 使用量統計

字面在說什麼

追蹤和統計模型在推理時消耗了多少 Token。

為什麼不對

題目定義 Token Economics 就是「模型推理與生成過程中，Token 使用量及其費用」，D 選項幾乎是在複述這個定義。使用量統計是 Token Economics 最基本的工作，完全在範圍內，不能選。

符記（Token）LLM 處理與計費的基本文字單位，Token Economics 的分析對象就是推理與生成過程中 Token 的消耗量與費用
推論（Inference）訓練好的模型接收輸入並輸出結果的運作過程，是 Token Economics 所聚焦的成本來源，訓練階段不在此範疇
批次推論（Batch Inference）打包多筆請求一次處理的推論模式，可降低單次成本，是大量報告生成任務的 Token Economics 優化選項
提示工程（Prompt Engineering）設計輸入給 LLM 的指令以控制輸出品質與長度，直接影響輸入輸出 Token 數量，是 Token Economics 優化的核心手段
模型服務化（Model Serving）將訓練完成的模型部署為可呼叫 API 的服務，是 Token 計費發生的環境，與訓練階段 GPU 成本完全分開計算