iPAS AI 應用規劃師 中級 科目二 大數據處理分析與應用

描述客服來電數量該用哪種分佈?

原題 15

某客服中心統計資料發現,平均每小時會接到約 20 通顧客來電,但每分鐘的來電數量不固定,可能為 0、1、2 通不等。這些來電事件彼此獨立,且在短時間內,發生的機率與時間長短成正比。若要以機率模型描述「每分鐘接到幾通來電」的機率分佈,下列哪一種最適合使用?

白話

客服中心平均每小時接 20 通電話。具體到每一分鐘,可能接到 0 通、1 通或 2 通,數量不固定。每一通電話的發生和其他通話沒有關聯(彼此獨立),而且在更短的時間內,來電機率跟時間長度成比例。

問你:哪一種機率分佈最適合描述「某一分鐘內接到幾通電話」這個情況?

點選你的答案。

01 總結

一句話總結

「固定時段內,發生次數不固定、事件彼此獨立、平均速率已知」:這三個條件完全符合卜瓦松分佈(Poisson Distribution)的使用情境,用它來描述「每分鐘接到幾通電話」再精準不過。

02 情境

先感受問題:客服排班要準備幾個人?

聯捷電商的客服主管曉薇,負責安排客服班次。她知道每小時平均有 20 通來電,換算下來每分鐘平均 20/60 ≈ 0.33 通。

但她不知道的是:某一分鐘是否真的會有電話進來?會有 0 通?1 通?還是偶爾衝到 3 通?

如果她能算出「某一分鐘接到 0 通的機率」「接到 1 通的機率」「接到 2 通的機率」,她就能更精準地安排值班人力,不會讓客戶等太久,也不會浪費人力成本。

這種「固定時間視窗內、計數隨機事件發生次數」的問題,就是卜瓦松分佈(Poisson Distribution)的經典應用場景。

03 對照

用錯分佈會造成什麼問題

  1. 用均勻分佈的錯誤:均勻分佈假設所有結果機率相等(例如擲骰子)。但來電數量不是「0 到 10 通都一樣可能發生」,事實上 0 通最常見,越多通電話越少見,用均勻分佈完全不符合實際觀察。
  2. 用常態分佈的錯誤:常態分佈是連續分佈,可以取任何實數值(包括負數),而來電次數是非負整數(0、1、2...),用連續分佈描述計數資料在概念上就不對。樣本數極大時 Poisson 才漸近常態。
  3. 用指數分佈的錯誤:指數分佈描述的是「兩次事件之間的等待時間」(例如:下一通電話多久後會來),不是「某段時間內發生幾次」。雖然兩者密切相關,但問題形式不同。
  4. 忽視「事件獨立性」假設的錯誤:卜瓦松分佈要求每次事件獨立發生。如果來電會互相影響(例如:一個大客戶打電話後,會帶動其他客戶也打來),就不符合假設,卜瓦松分佈的預測就不準確。
  5. 用錯分佈導致資源誤估:如果用常態分佈估算,預測某分鐘接到「-2 通」電話就荒謬了;用均勻分佈則會高估高來電次數的機率,導致排太多客服卻閒著。
04 解法

卜瓦松分佈:計算固定時段內「發生幾次」的機率

聯捷電商的曉薇用卜瓦松分佈來建立來電模型:

已知:平均每分鐘接到 λ = 20/60 ≈ 0.333 通電話。

題目給出的條件完全符合卜瓦松分佈的三個假設:

1. 固定時間區間(每分鐘)
2. 事件彼此獨立(每通電話的發生不影響其他通話)
3. 在短時間內,機率與時間長短成正比(稀有事件假設)

用卜瓦松公式,曉薇可以算出某一分鐘:

  • 接到 0 通的機率(最常見)
  • 接到 1 通的機率
  • 接到 2 通或更多通的機率(較少見)

有了這個分佈,排班規劃就有了數學依據,而不是憑感覺猜。

這就是選項 C 講的:卜瓦松分佈(Poisson distribution)

技術版:卜瓦松分佈的數學性質與應用條件

卜瓦松分佈(Poisson Distribution)的機率質量函數

P(X = k) = (λ^k × e^(-λ)) / k!

其中:λ(Lambda)= 固定時間區間內的平均事件發生次數,k = 實際發生次數(非負整數),e ≈ 2.718(自然常數)。

卜瓦松分佈的特性

  • 期望值 E(X) = λ
  • 變異數 Var(X) = λ(期望值和變異數相等,是卜瓦松分佈的獨特性質)
  • 只取非負整數值(0、1、2、3...)
  • λ 很大時,卜瓦松分佈趨近常態分佈

適用卜瓦松分佈的三個條件

  1. 事件在固定時間區間(或空間區域)內發生
  2. 事件彼此獨立(一個事件的發生不影響另一個)
  3. 短時間內,事件發生的機率與時間長度成正比(稀有事件假設,發生機率小)

計算範例(本題)

λ = 20/60 ≈ 0.333(每分鐘平均來電通數)

P(X=0) = (0.333^0 × e^(-0.333)) / 0! = e^(-0.333) ≈ 0.717(71.7% 的分鐘沒有電話)
P(X=1) = (0.333^1 × e^(-0.333)) / 1! ≈ 0.239(23.9%)
P(X=2) = (0.333^2 × e^(-0.333)) / 2! ≈ 0.040(4.0%)
P(X≥3) ≈ 0.004(約 0.4%,非常少見)

卜瓦松分佈的其他應用場景

  • 每小時某路口發生的交通事故次數
  • 每天網站收到的惡意攻擊次數
  • 某區域每年發生的自然災害次數
  • 機器學習中的文本詞頻(稀有詞的出現次數)

卜瓦松 vs 指數分佈的關係:如果事件按卜瓦松過程發生(速率 λ),那麼「兩次事件之間的等待時間」服從指數分佈(參數 λ)。它們描述同一個隨機過程的不同面向:卜瓦松看「次數」,指數看「間隔時間」。

05 陷阱

為什麼其他選項是錯的

A均勻分佈(Uniform distribution)

字面在說什麼

每一種可能的來電數量機率相同,例如 0 通、1 通、2 通的機率各 1/3。

為什麼不對

均勻分佈假設每個結果等可能發生,適合擲骰子、隨機號碼產生這類情境。來電數量不是「0 到 n 通都一樣可能」,在低到中等負載時,0 通最常見,次數越多越少見,機率遞減。均勻分佈完全無法反映這個現象。

誰會選錯

對「分佈」概念模糊,覺得只要有多個結果就用均勻分佈的人。均勻分佈是「所有結果機率相等」的特殊情況,不是預設選項。

B指數分佈(Exponential distribution)

字面在說什麼

用指數分佈來描述來電次數的機率。

為什麼不對

指數分佈描述的是「等待時間」,例如「下一通電話多久後才來」(連續型,可以是任意正實數)。題目問的是「某一分鐘內接到幾通」(離散計數,只取非負整數)。雖然指數分佈和卜瓦松分佈有數學上的對應關係,但兩者描述的問題形式不同,不能混用。

誰會選錯

知道指數分佈也用在描述事件發生,但沒有分清楚「等待時間(指數)」和「發生次數(卜瓦松)」的差別。

D常態分佈(Normal distribution)

字面在說什麼

用鐘形曲線描述每分鐘來電數量的分佈。

為什麼不對

常態分佈是連續型分佈,理論上取值從負無窮到正無窮,不適合描述「只取非負整數」的計數資料。來電次數不可能是 -1.5 通。雖然當 λ 很大時卜瓦松分佈會趨近常態分佈,但在這道題(λ ≈ 0.33,非常小)的情況下,常態近似完全不適用。

誰會選錯

把常態分佈當「通用分佈」的人。常態分佈是自然界很常見的分佈,但不是所有資料都適用,特別是計數資料和等待時間資料。

06 變形

同個考點下次怎麼變形

變形 1

「下一通電話多久後會來」,應該用哪種分佈描述?

直覺

來電間隔時間,不是次數,要換一種分佈?

答案

應用指數分佈(Exponential Distribution)。如果每分鐘平均來電 λ 通,則兩通電話之間的等待時間服從指數分佈,期望等待時間 = 1/λ 分鐘。指數分佈的特性是「無記憶性」:不管上一通電話等了多久,下一通電話的等待時間分佈不變。

變形 2

卜瓦松分佈的期望值和變異數有什麼特別的關係?

直覺

為什麼卜瓦松分佈的期望值和變異數都等於 λ?

答案

這是卜瓦松分佈的獨特性質:E(X) = Var(X) = λ。在實務資料分析中,如果你觀察到計數資料的均值和變異數「幾乎相等」,這是卜瓦松分佈的一個徵兆。如果變異數明顯大於均值(過度離散,Overdispersion),應考慮負二項分佈(Negative Binomial Distribution)。

變形 3

哪些現象可以用卜瓦松分佈建模?

直覺

除了電話,還有什麼情境適合?

答案

所有「固定時間或空間內,發生次數可計數、事件獨立」的情境:每天收到的客訴數量、每小時網路請求數、每月發生的機器故障次數、文字中特定詞出現的頻率(Zipf 分佈的近似)、放射性衰變的粒子計數。核心判斷:「計數」而非「連續量」,且事件獨立、發生率穩定。

變形 4

常態分佈適合描述什麼類型的資料?

直覺

常態分佈不適合來電次數,那它適合什麼?

答案

常態分佈適合連續型、對稱分佈、沒有下界限制的資料:人的身高體重、測量誤差、財務報酬率(近似)、大量獨立隨機變數的總和(中央極限定理)。關鍵特徵:連續、對稱(均值 = 中位數 = 眾數)、鐘形曲線。

變形 5

λ 很大時,卜瓦松分佈趨近哪種分佈?

直覺

λ 越大,分佈形狀會改變嗎?

答案

當 λ 很大(通常 λ > 30 就相當接近),卜瓦松分佈趨近常態分佈 N(μ=λ, σ²=λ)。這是中央極限定理的一種體現:很多獨立稀有事件累加起來,趨向常態。在 λ 大的情境下,可以用常態分佈近似計算,但在 λ 小(本題 λ ≈ 0.33)時,分佈高度右偏,常態近似完全不適用。

07 延伸

想再往下看,這 5 個

出處

iPAS 經濟部產業人才能力鑑定 ・ 114 年第二梯次 iPAS AI 應用規劃師 中級 科目二 大數據處理分析與應用 第 15 題

查看官方原文 PDF