AI 代理(AI Agent)是什麼?

AI 代理是能自主規劃、執行任務並運用工具的 AI 系統,它不只回答問題,更能實際採取行動|本頁含完整原理、應用場景、iPAS 考試重點與 4 個常見問答。

AI 代理(AI Agent)是什麼? iPAS 高頻 AI應用AI基礎

你有沒有用過 Siri 或 Google Assistant 幫你訂鬧鐘、查天氣、甚至叫外送?

這些助手不只是回答你的問題,它們會自己判斷該做什麼、呼叫哪個app、按什麼順序完成任務。AI代理就是這類系統的統稱:一個能自主感知環境、規劃步驟、呼叫工具、然後真正執行動作的AI,不只是聊天,而是替你做事。

你可以把它想成一個先回答「用途是什麼」的入口,抓住生活場景後,再看技術細節會更容易。

容易混淆

AI 代理 vs 聊天機器人 vs RPA

聊天機器人:只能根據輸入產生文字回覆,不會主動採取行動。

RPA(機器人流程自動化):按照預設的固定腳本重複執行操作,不會自己規劃。

AI 代理:能理解目標、自主規劃步驟、動態選擇工具,遇到意外還能調整策略。

最關鍵的區別:聊天機器人只回話,RPA 只照做,AI 代理會想再做。

記住這句就好

不只回答問題,還會自己規劃步驟、呼叫工具、完成任務。

實際案例

客服自動化:從回答到解決

傳統客服聊天機器人只能回答「你的訂單已出貨」,遇到退貨請求就轉接人工。導入 AI 代理後,系統能自己查訂單狀態、判斷是否符合退貨條件、啟動退款流程、發送確認信,整個過程不需要人介入。Zendesk 報告導入 AI 代理後,客服工單處理時間減少了 40%。

程式開發助手:從建議到執行

傳統的程式碼補全工具(如 GitHub Copilot 早期版本)只能根據你正在寫的程式碼建議下一行。新一代的 AI 代理(如 Claude Code、Cursor Agent)能接收「幫我加一個登入功能」這樣的高層指令,自己規劃需要修改哪些檔案、產生程式碼、執行測試、修正錯誤,整個開發流程自動完成。

算法與應用

AI 代理的核心運作迴圈

步驟 做什麼 對應技術
感知 接收使用者指令或環境訊號 自然語言處理、API 串接
規劃 拆解任務,決定執行順序 鏈式思考、任務分解
執行 呼叫外部工具完成子任務 Function Calling、工具使用
反思 檢查結果,決定是否需要修正 自我評估、錯誤偵測

常見的代理架構

架構 特色 代表
ReAct 交替進行推理和行動 LangChain ReAct Agent
計畫再執行 先完整規劃,再逐步執行 AutoGPT
多代理協作 多個專責代理分工合作 CrewAI、AutoGen
反思迴圈 執行後自我檢討,持續改進 Reflexion

情境判斷

Q1(直覺題): 一家電商想要自動處理客戶的退貨申請,包括查訂單、驗條件、啟動退款。這需要聊天機器人還是 AI 代理?

→ AI 代理。聊天機器人只能回覆文字,無法主動查詢系統和執行退款操作。這個任務需要自主規劃和工具呼叫。

Q2(判斷題): 一家醫院想用 AI 代理自動幫病患排程手術,根據病情嚴重度、醫師排班、手術室可用時間做最佳安排。這適合全自動還是人機協作?

→ 看情況。技術上 AI 代理可以處理排程優化,但手術排程涉及醫療風險判斷和病患隱私,全自動的法律責任不明確。多數醫院的做法是讓 AI 代理產生建議排程,由醫師做最終確認,也就是人機迴路(Human-in-the-Loop)模式。

iPAS 考題

出題方向: AI 代理相關題目約佔 AI 應用規劃師考題 7%,常考導入評估方法、代理 vs 傳統自動化的區別、應用場景判斷。

題目 關於 AI 代理(AI Agent)的特性,下列敘述何者正確? (A) AI 代理只能處理預先定義好的固定任務流程 (B) AI 代理能自主規劃執行步驟並動態選擇工具 (C) AI 代理不需要外部工具就能完成所有任務 (D) AI 代理與傳統聊天機器人的功能完全相同

答案:B。 AI 代理的核心特徵是自主規劃和工具使用。A 描述的是 RPA,C 錯誤因為工具呼叫是代理的核心能力,D 忽略了代理會採取行動而聊天機器人只回覆。

常見問題

AI 代理會不會做出危險的事?

會,這是目前最大的風險。AI 代理有執行能力,如果理解錯誤或規劃失誤,可能刪除重要檔案、發送錯誤訊息、或做出不可逆的操作。所以多數實際部署都會加上「護欄」(Guardrails),限制代理能呼叫的工具範圍,或在高風險操作前要求人工確認。

現在的 AI 代理真的能取代人類工作嗎?

目前還不行。AI 代理在定義明確、步驟可拆解的任務上表現很好(如客服、資料處理),但在需要常識推理、情感判斷、或跨領域創造力的工作上仍然不穩定。現階段更適合看成「超強的自動化助手」而不是「替代人力」。

AI 代理和大型語言模型(LLM)是什麼關係?

LLM 是 AI 代理的「大腦」,負責理解指令和推理。但 LLM 本身只能產生文字,AI 代理在 LLM 之上加了工具呼叫、記憶系統、規劃能力,讓它從「能想」變成「能做」。可以說 LLM 是引擎,AI 代理是整台車。

多代理系統比單一代理更好嗎?

不一定。多代理系統讓不同代理專責不同任務,理論上更靈活,但也帶來協調成本和溝通延遲。簡單任務用單一代理更快更可靠,複雜的跨領域任務才需要多代理協作。

範例考題

關於 2025 年 OpenAI 提供的 AgentKit,下列何者最能描述其主要用途?

  • A. 建立強化式學習(Reinforcement Learning)訓練所需的互動式模擬環境
  • B. 提供代理(Agent)模型的大規模預訓練與權重優化機制
  • C. 「Agent-to-Agent」的代理通訊協議
  • D. 支援 Agents 的建構、工具整合與任務流程開發 ✓ 正確答案

解析:

OpenAI 的 AgentKit 主要用途是幫助開發者建構 AI 代理、整合外部工具,並開發任務流程,是一個 Agent 開發框架。

在規劃生成式 AI 解決方案時,下列何種應用場景最適合採用 GPT-Realtime 類型模型?

  • A. 需長時間批次處理的大規模報表生成任務
  • B. 即時資料查詢與結構化資訊檢索系統
  • C. 即時語音客服與互動式 AI 代理 ✓ 正確答案
  • D. 以高一致性為優先的法規文件自動摘要

解析:

GPT-Realtime 類型模型專為即時互動設計,支援語音輸入輸出與低延遲對話,最適合即時語音客服與互動式 AI 代理等需要即時回應的場景。

立即測驗

想測試你對 AI 代理 的掌握程度? 開始模擬考