你有沒有想過,模型不只會回答,還能去查資料、算數字、發指令? 你可以把工具使用能力想成「AI 會說話,也會動手做事」 模型先判斷要不要用工具,再把參數送出去,拿回結果後再繼續推理 它很適合查資料、呼叫 API 和執行工作流,但工具設計不好就容易出錯
容易混淆
工具使用能力 vs 提示工程 工具使用能力是模型和外部工具互動的能力 提示工程是你設計輸入內容的方法 最關鍵的區別:一個是系統能力,一個是輸入技巧
工具使用能力 vs 函數呼叫 工具使用能力是更大的概念 函數呼叫是常見的實作方式 最關鍵的區別:概念範圍不同
工具使用能力 vs 代理程式 工具使用能力是代理程式的重要零件 代理程式還要有規劃、記憶和迴圈 最關鍵的區別:工具只是其中一環
記住這句就好
會回答不夠,還要會選工具、填參數、讀結果。
實際案例
查資料 模型先呼叫搜尋或資料庫工具,再把找到的內容整理成答案,比憑空猜更可靠
工作流程 訂票、寄信、建日曆這類任務,需要模型把語意轉成可執行的動作
算法與應用
| 工具選擇 | 先判斷要不要查詢、計算或操作系統 | 選錯工具就會走偏 | | 參數生成 | 把自然語言轉成工具需要的欄位 | 欄位名要對得上 | | 結果回讀 | 把工具回傳的內容再整理成回答 | 這一步常決定可用性 | | 錯誤處理 | 處理缺值、失敗和格式不合 | 實務上很重要 |
情境判斷
Q1(直覺題): 你要讓模型查今天會議室是否空著,適合用它嗎?
Q2(判斷題): 你只是想讓模型寫一段短文,還一定要接工具嗎?
常見問題
工具使用能力一定要靠 API 嗎?
不一定,但最常見的實作就是把工具包成可呼叫的介面。
為什麼模型有時候會亂選工具?
因為它可能沒看清楚任務邊界,或工具描述寫得不夠明確。
工具使用能力和 RAG 一樣嗎?
不一樣,RAG 偏向先檢索資料再生成,工具使用還可能包含操作系統和執行動作。