iPAS AI 應用規劃師中級　科目三　機器學習技術與應用

蒙地卡羅方法如何模擬不確定情境？

原題 23

一家再生能源公司希望預測未來三個月太陽能發電量的波動範圍。由於氣候條件具有高度隨機性，且輸入變數（如日照時數、雲量、溫度）之間存在不確定關係，工程團隊決定以隨機抽樣方式模擬多種可能情境，以估算整體發電量的機率分佈與風險區間。請問此時所採用的技術最符合下列哪一種方法？

白話

一家再生能源公司想預測未來三個月的太陽能發電量範圍。氣候條件有很高的不確定性，日照、雲量、溫度等輸入變數之間的關係也不確定。工程團隊選擇用隨機抽樣的方式，模擬大量可能的氣候情境，然後統計這些情境下的發電量分佈和風險範圍。

問你：這種「隨機抽樣模擬多種情境來估算機率分佈」的技術是哪一種方法？

點選你的答案。

← 回 50 題列表回 iPAS 備考總覽

01　總結

一句話總結

用隨機抽樣模擬大量情境、估算機率分佈與風險區間的技術是：蒙地卡羅方法（Monte Carlo Method）——反覆從輸入變數的機率分佈中取樣，計算每次結果，再把所有結果匯聚成輸出的機率分佈。

02　情境

先感受問題：太陽明天會不會露臉，你怎麼決策？

你是台灣電力公司可再生能源部門的工程師。老闆要求你在下週提交「未來三個月太陽能發電量的風險評估報告」，並且要給出「最樂觀情境、最悲觀情境、以及最有可能的範圍」。

問題是：日照時數、雲量、溫度每天都不一樣，而且三者之間還相互影響。你沒辦法精確預測氣候，但你有過去五年的氣候資料，知道每個月各項指標的統計分佈。

你想到：如果我用過去五年的統計資料，隨機「抽」出 10,000 種可能的三個月氣候組合，然後算出每種組合的發電量，最後看這 10,000 個發電量的分佈，不就知道範圍了嗎？

這個「抽樣 → 計算 → 統計分佈」的思路，就是蒙地卡羅方法的精髓。

03　對照

沒有蒙地卡羅，處理不確定性有什麼困難？

解析解往往不存在：當多個不確定變數（日照、雲量、溫度）交互影響，想用數學公式直接推出發電量的機率分佈，通常沒有閉合解（Closed-form Solution），計算極為複雜。
單點預測忽略風險：只預測「平均發電量是 XX 度」不夠，決策者需要「最差情況下還有多少」才能做電網調度。
高維不確定性難以窮舉：若每個變數有 10 個可能值，3 個變數就有 1000 種組合；5 個變數就有 100,000 種。窮舉法在高維空間爆炸式增長。
模型假設太強：傳統確定性模型假設輸入是固定值，無法自然地處理「輸入本身就是隨機分佈」的情況。
無法給出信賴區間：沒有機率分佈的估算，就無法說出「有 90% 的把握發電量在 XX 到 XX 之間」這樣的風險聲明。

04　解法

蒙地卡羅方法怎麼解

台灣電力公司工程團隊的做法：

建立輸入的機率分佈：根據過去五年氣候資料，建立日照時數、雲量、溫度的統計分佈（例如日照時數在夏季服從均值 8 小時、標準差 1.5 小時的常態分佈）。
隨機抽樣：從每個變數的分佈中隨機抽樣，產生一組「假設的三個月氣候條件」。
計算輸出：把這組氣候條件代入發電量計算模型，得到一個發電量值。
重複大量次：重複上述步驟 10,000 次（或更多），得到 10,000 個發電量結果。
統計輸出分佈：把 10,000 個結果畫成直方圖，就能看出發電量的機率分佈、平均值、第 5 百分位（悲觀情境）、第 95 百分位（樂觀情境）。

這樣不需要知道「正確的」數學公式，只需要能從分佈中取樣，就能估算出任意複雜情境下的輸出分佈。

這就是選項 A 講的：蒙地卡羅方法（Monte Carlo Method）。

技術版：蒙地卡羅方法在 AI 與機器學習中的位置

蒙地卡羅方法（Monte Carlo Method）屬於計算統計學與數值方法的範疇，在機器學習與 AI 中有多個重要應用場景。

在 AI 領域的位置：蒙地卡羅方法不是一個特定的機器學習模型，而是一種通用的計算技術，透過隨機取樣估算複雜系統的機率特性。在 ML 中常見的應用包括：貝氏推論中的 MCMC（馬可夫鏈蒙地卡羅）、強化學習中的 Monte Carlo Policy Evaluation、以及決策樹的隨機森林（本質上也借用了隨機取樣的概念）。

實務上誰在用：金融風險管理（VaR 計算）、能源預測（如本題）、供應鏈模擬、新藥臨床試驗樣本量規劃、自動駕駛的場景模擬測試等。在 AI 工程上，蒙地卡羅 Dropout 可以用來估算神經網路的預測不確定性。

跟相關術語的對比：

確定性模型：給定輸入永遠得到同一輸出，無法表達不確定性。蒙地卡羅是隨機性的，專門用來處理不確定性。
K-means 聚類：非監督式分群算法，把資料點分組，跟機率模擬完全不同。
支持向量迴歸（SVR）：預測連續輸出的監督式學習，給一個確定預測值，不輸出機率分佈。

為什麼出題者要考這題：蒙地卡羅方法是連接統計學與 AI 的重要橋樑，特別在處理不確定性和風險評估時不可缺少。能識別「隨機取樣 → 模擬情境 → 估算機率分佈」這個核心特徵，並與聚類、迴歸、特徵選取區分，是中級考試的重要考點。

05　陷阱

為什麼其他選項是錯的

BK-means 聚類（K-means Clustering）

字面在說什麼

K-means 是把資料點依距離分成 K 個群組的非監督式學習算法。

為什麼不對

K-means 的目的是分群（找出哪些資料點相似），不是模擬隨機情境或估算機率分佈。它處理的是靜態資料集的結構，而不是對未來的隨機過程進行取樣模擬。

誰會選錯

看到「氣候條件分類」就聯想到聚類的人。聚類是把已有資料分組，而蒙地卡羅是從機率分佈中生成新的假設情境。兩者操作對象和目的都不同。

C支持向量迴歸（Support Vector Regression, SVR）

字面在說什麼

SVR 是支持向量機的迴歸版本，用來預測連續數值輸出，例如預測一個具體的發電量數字。

為什麼不對

SVR 給出一個確定性的預測值（點預測），不輸出機率分佈或風險區間。題目需要的是「波動範圍」和「機率分佈」，SVR 無法直接提供這些資訊。而且 SVR 需要已標記的訓練資料，不是靠隨機取樣模擬。

誰會選錯

看到「預測發電量」就直覺選迴歸方法的人。題目的關鍵詞是「機率分佈」和「風險區間」，這才是鑑別蒙地卡羅的關鍵，不是「預測數值」本身。

D特徵選取（Feature Selection）

字面在說什麼

特徵選取是從眾多輸入變數中挑出最有預測力的子集，減少維度、提升模型效率。

為什麼不對

特徵選取是資料前處理的步驟，目的是決定「用哪些變數」，不是模擬情境或估算機率分佈。題目的工程團隊已經確定了輸入變數（日照時數、雲量、溫度），要做的是模擬，不是再去篩選變數。

誰會選錯

看到題目提到「輸入變數之間存在不確定關係」就想到要「處理特徵」的人。題目強調的是「隨機抽樣模擬」和「機率分佈估算」，這才是蒙地卡羅的核心特徵。

06　變形

同個考點下次怎麼變形

變形 1

蒙地卡羅方法需要多少次取樣才夠？

直覺

取樣次數越多，估算越準確，但計算成本也越高。

答案

蒙地卡羅的收斂速度是 O(1/√N)，取樣 N 次的誤差與 1/√N 成正比。取樣 10,000 次的誤差約為 100 次的 1/10。實務上通常需要幾千到幾萬次取樣，具體看所需精度和計算資源。

變形 2

蒙地卡羅和模擬退火（Simulated Annealing）有什麼差別？

直覺

兩者都有「隨機」成分，但目的不同。

答案

蒙地卡羅方法用隨機取樣來估算機率分佈或積分，目的是「描述」一個隨機系統的行為。模擬退火是一種最佳化算法，用「受控隨機性」逃離局部最佳解，目的是「找到」最佳解。兩者的隨機性角色完全不同。

變形 3

強化學習中的 Monte Carlo Policy Evaluation 是什麼？

直覺

強化學習也用「跑多次」的方式估算策略的價值，這跟蒙地卡羅方法有關係嗎？

答案

有關係。Monte Carlo Policy Evaluation 讓智能體用當前策略完整跑完多個 Episode，然後用實際回報的平均值估算每個狀態的價值函數（Value Function）。這正是蒙地卡羅精神：透過大量隨機樣本估算期望值。與時序差分學習（TD Learning）的差別在於，TD 可以在 Episode 中途更新，蒙地卡羅需要等整個 Episode 結束才更新。

變形 4

風險值（VaR）是什麼，蒙地卡羅怎麼計算它？

直覺

金融業最常用的風險指標，說的是「在 95% 信心水準下，最大可能損失是多少」。

答案

蒙地卡羅計算 VaR 的流程：對市場變數（股價、匯率、利率）建立機率分佈模型，隨機模擬大量情境（例如 10,000 個未來 1 天的市場走勢），算出每個情境的投資組合損益，然後取結果的第 5 百分位數（最差的 5%），就是 95% 信心水準的 VaR。

變形 5

MCMC（馬可夫鏈蒙地卡羅）是什麼應用場景？

直覺

當我們連從機率分佈中取樣都很困難，需要更複雜的取樣方法。

答案

MCMC（Markov Chain Monte Carlo）是一種從複雜高維機率分佈中取樣的方法。當貝氏推論的後驗分佈沒有閉合解，MCMC 透過構建一條馬可夫鏈，讓其收斂到目標分佈，再從鏈的穩態取樣。常用在貝氏統計模型、機率圖模型的推論中。在現代深度學習興起前，MCMC 是貝氏推論的主要計算工具。

07　延伸

想再往下看，這 5 個

蒙地卡羅方法（Monte Carlo Method）本題核心，透過大量隨機取樣估算機率分佈，是處理不確定性問題的通用計算工具。
機率分佈（Probability Distribution）蒙地卡羅方法輸入和輸出都是機率分佈，理解分佈是掌握此方法的前提。
隨機森林（Random Forest）集成學習方法，借用隨機取樣（Bootstrap）的精神，與蒙地卡羅有概念上的相通之處。
特徵工程（Feature Engineering）蒙地卡羅取樣的前提是建立輸入變數的機率模型，特徵的分佈假設直接影響模擬結果的可信度。
異常偵測（Anomaly Detection）蒙地卡羅模擬出的機率分佈可用於定義正常範圍，超出範圍的實際觀測值即可視為異常。