iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用

蒙地卡羅方法如何模擬不確定情境?

原題 23

一家再生能源公司希望預測未來三個月太陽能發電量的波動範圍。由於氣候條件具有高度隨機性,且輸入變數(如日照時數、雲量、溫度)之間存在不確定關係,工程團隊決定以隨機抽樣方式模擬多種可能情境,以估算整體發電量的機率分佈與風險區間。請問此時所採用的技術最符合下列哪一種方法?

白話

一家再生能源公司想預測未來三個月的太陽能發電量範圍。氣候條件有很高的不確定性,日照、雲量、溫度等輸入變數之間的關係也不確定。工程團隊選擇用隨機抽樣的方式,模擬大量可能的氣候情境,然後統計這些情境下的發電量分佈和風險範圍。

問你:這種「隨機抽樣模擬多種情境來估算機率分佈」的技術是哪一種方法?

點選你的答案。

01 總結

一句話總結

用隨機抽樣模擬大量情境、估算機率分佈與風險區間的技術是:蒙地卡羅方法(Monte Carlo Method)——反覆從輸入變數的機率分佈中取樣,計算每次結果,再把所有結果匯聚成輸出的機率分佈。

02 情境

先感受問題:太陽明天會不會露臉,你怎麼決策?

你是台灣電力公司可再生能源部門的工程師。老闆要求你在下週提交「未來三個月太陽能發電量的風險評估報告」,並且要給出「最樂觀情境、最悲觀情境、以及最有可能的範圍」。

問題是:日照時數、雲量、溫度每天都不一樣,而且三者之間還相互影響。你沒辦法精確預測氣候,但你有過去五年的氣候資料,知道每個月各項指標的統計分佈。

你想到:如果我用過去五年的統計資料,隨機「抽」出 10,000 種可能的三個月氣候組合,然後算出每種組合的發電量,最後看這 10,000 個發電量的分佈,不就知道範圍了嗎?

這個「抽樣 → 計算 → 統計分佈」的思路,就是蒙地卡羅方法的精髓。

03 對照

沒有蒙地卡羅,處理不確定性有什麼困難?

  1. 解析解往往不存在:當多個不確定變數(日照、雲量、溫度)交互影響,想用數學公式直接推出發電量的機率分佈,通常沒有閉合解(Closed-form Solution),計算極為複雜。
  2. 單點預測忽略風險:只預測「平均發電量是 XX 度」不夠,決策者需要「最差情況下還有多少」才能做電網調度。
  3. 高維不確定性難以窮舉:若每個變數有 10 個可能值,3 個變數就有 1000 種組合;5 個變數就有 100,000 種。窮舉法在高維空間爆炸式增長。
  4. 模型假設太強:傳統確定性模型假設輸入是固定值,無法自然地處理「輸入本身就是隨機分佈」的情況。
  5. 無法給出信賴區間:沒有機率分佈的估算,就無法說出「有 90% 的把握發電量在 XX 到 XX 之間」這樣的風險聲明。
04 解法

蒙地卡羅方法怎麼解

台灣電力公司工程團隊的做法:

  1. 建立輸入的機率分佈:根據過去五年氣候資料,建立日照時數、雲量、溫度的統計分佈(例如日照時數在夏季服從均值 8 小時、標準差 1.5 小時的常態分佈)。
  2. 隨機抽樣:從每個變數的分佈中隨機抽樣,產生一組「假設的三個月氣候條件」。
  3. 計算輸出:把這組氣候條件代入發電量計算模型,得到一個發電量值。
  4. 重複大量次:重複上述步驟 10,000 次(或更多),得到 10,000 個發電量結果。
  5. 統計輸出分佈:把 10,000 個結果畫成直方圖,就能看出發電量的機率分佈、平均值、第 5 百分位(悲觀情境)、第 95 百分位(樂觀情境)。

這樣不需要知道「正確的」數學公式,只需要能從分佈中取樣,就能估算出任意複雜情境下的輸出分佈。

這就是選項 A 講的:蒙地卡羅方法(Monte Carlo Method)

技術版:蒙地卡羅方法在 AI 與機器學習中的位置

蒙地卡羅方法(Monte Carlo Method)屬於計算統計學數值方法的範疇,在機器學習與 AI 中有多個重要應用場景。

在 AI 領域的位置:蒙地卡羅方法不是一個特定的機器學習模型,而是一種通用的計算技術,透過隨機取樣估算複雜系統的機率特性。在 ML 中常見的應用包括:貝氏推論中的 MCMC(馬可夫鏈蒙地卡羅)、強化學習中的 Monte Carlo Policy Evaluation、以及決策樹的隨機森林(本質上也借用了隨機取樣的概念)。

實務上誰在用:金融風險管理(VaR 計算)、能源預測(如本題)、供應鏈模擬、新藥臨床試驗樣本量規劃、自動駕駛的場景模擬測試等。在 AI 工程上,蒙地卡羅 Dropout 可以用來估算神經網路的預測不確定性。

跟相關術語的對比:

  • 確定性模型:給定輸入永遠得到同一輸出,無法表達不確定性。蒙地卡羅是隨機性的,專門用來處理不確定性。
  • K-means 聚類:非監督式分群算法,把資料點分組,跟機率模擬完全不同。
  • 支持向量迴歸(SVR):預測連續輸出的監督式學習,給一個確定預測值,不輸出機率分佈。

為什麼出題者要考這題:蒙地卡羅方法是連接統計學與 AI 的重要橋樑,特別在處理不確定性和風險評估時不可缺少。能識別「隨機取樣 → 模擬情境 → 估算機率分佈」這個核心特徵,並與聚類、迴歸、特徵選取區分,是中級考試的重要考點。

05 陷阱

為什麼其他選項是錯的

BK-means 聚類(K-means Clustering)

字面在說什麼

K-means 是把資料點依距離分成 K 個群組的非監督式學習算法。

為什麼不對

K-means 的目的是分群(找出哪些資料點相似),不是模擬隨機情境或估算機率分佈。它處理的是靜態資料集的結構,而不是對未來的隨機過程進行取樣模擬。

誰會選錯

看到「氣候條件分類」就聯想到聚類的人。聚類是把已有資料分組,而蒙地卡羅是從機率分佈中生成新的假設情境。兩者操作對象和目的都不同。

C支持向量迴歸(Support Vector Regression, SVR)

字面在說什麼

SVR 是支持向量機的迴歸版本,用來預測連續數值輸出,例如預測一個具體的發電量數字。

為什麼不對

SVR 給出一個確定性的預測值(點預測),不輸出機率分佈或風險區間。題目需要的是「波動範圍」和「機率分佈」,SVR 無法直接提供這些資訊。而且 SVR 需要已標記的訓練資料,不是靠隨機取樣模擬。

誰會選錯

看到「預測發電量」就直覺選迴歸方法的人。題目的關鍵詞是「機率分佈」和「風險區間」,這才是鑑別蒙地卡羅的關鍵,不是「預測數值」本身。

D特徵選取(Feature Selection)

字面在說什麼

特徵選取是從眾多輸入變數中挑出最有預測力的子集,減少維度、提升模型效率。

為什麼不對

特徵選取是資料前處理的步驟,目的是決定「用哪些變數」,不是模擬情境或估算機率分佈。題目的工程團隊已經確定了輸入變數(日照時數、雲量、溫度),要做的是模擬,不是再去篩選變數。

誰會選錯

看到題目提到「輸入變數之間存在不確定關係」就想到要「處理特徵」的人。題目強調的是「隨機抽樣模擬」和「機率分佈估算」,這才是蒙地卡羅的核心特徵。

06 變形

同個考點下次怎麼變形

變形 1

蒙地卡羅方法需要多少次取樣才夠?

直覺

取樣次數越多,估算越準確,但計算成本也越高。

答案

蒙地卡羅的收斂速度是 O(1/√N),取樣 N 次的誤差與 1/√N 成正比。取樣 10,000 次的誤差約為 100 次的 1/10。實務上通常需要幾千到幾萬次取樣,具體看所需精度和計算資源。

變形 2

蒙地卡羅和模擬退火(Simulated Annealing)有什麼差別?

直覺

兩者都有「隨機」成分,但目的不同。

答案

蒙地卡羅方法用隨機取樣來估算機率分佈或積分,目的是「描述」一個隨機系統的行為。模擬退火是一種最佳化算法,用「受控隨機性」逃離局部最佳解,目的是「找到」最佳解。兩者的隨機性角色完全不同。

變形 3

強化學習中的 Monte Carlo Policy Evaluation 是什麼?

直覺

強化學習也用「跑多次」的方式估算策略的價值,這跟蒙地卡羅方法有關係嗎?

答案

有關係。Monte Carlo Policy Evaluation 讓智能體用當前策略完整跑完多個 Episode,然後用實際回報的平均值估算每個狀態的價值函數(Value Function)。這正是蒙地卡羅精神:透過大量隨機樣本估算期望值。與時序差分學習(TD Learning)的差別在於,TD 可以在 Episode 中途更新,蒙地卡羅需要等整個 Episode 結束才更新。

變形 4

風險值(VaR)是什麼,蒙地卡羅怎麼計算它?

直覺

金融業最常用的風險指標,說的是「在 95% 信心水準下,最大可能損失是多少」。

答案

蒙地卡羅計算 VaR 的流程:對市場變數(股價、匯率、利率)建立機率分佈模型,隨機模擬大量情境(例如 10,000 個未來 1 天的市場走勢),算出每個情境的投資組合損益,然後取結果的第 5 百分位數(最差的 5%),就是 95% 信心水準的 VaR。

變形 5

MCMC(馬可夫鏈蒙地卡羅)是什麼應用場景?

直覺

當我們連從機率分佈中取樣都很困難,需要更複雜的取樣方法。

答案

MCMC(Markov Chain Monte Carlo)是一種從複雜高維機率分佈中取樣的方法。當貝氏推論的後驗分佈沒有閉合解,MCMC 透過構建一條馬可夫鏈,讓其收斂到目標分佈,再從鏈的穩態取樣。常用在貝氏統計模型、機率圖模型的推論中。在現代深度學習興起前,MCMC 是貝氏推論的主要計算工具。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二梯次 iPAS AI 應用規劃師 中級 科目三 機器學習技術與應用 第 23 題

查看官方原文 PDF