你有沒有算過,一小時內大概會來幾通電話、幾個請求?
你可以把 卜瓦松分佈 想成 固定時間內數事件發生幾次。
很適合看罕見事件或到達次數,固定時間內,數事件發生次數 這件事就特別重要。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
卜瓦松分佈 vs 二項式分佈
二項式像擲硬幣,每次只有兩種結果,且次數固定;卜瓦松像數中樂透的次數,事件發生是隨機且稀有的,沒有固定總次數限制。
最關鍵的區別:一個看單位時間的次數,一個看固定試驗的成功次數。
卜瓦松分佈 vs 二項式分佈
卜瓦松看固定時間內來幾次,二項式看固定次數裡成功幾次
最關鍵的區別:一個數到達次數,一個數成功次數。
記住這句就好
固定時間內,數事件發生次數
實際案例
案例 1:客服中心預估每小時來電數
這種情況下,卜瓦松分佈 會幫你把原本手工或靠直覺的步驟變得更穩。
案例 2:網站統計某分鐘的請求數波動
另一個常見場景也能看出 卜瓦松分佈 的價值,因為它處理的是同一種核心問題。
算法與應用
核心意思就是:固定時間內,數事件發生次數。
常用在客服來電、請求數、事故數這種稀有事件
當事件平均發生率穩定、彼此近似獨立時最常用
情境判斷
Q1(直覺題): 客服中心預估每小時來電數 這種情況,會先想到 卜瓦松分佈 嗎?
→ 會,因為它正好在處理這件事的核心問題,只是還要看資料乾不乾淨、流程穩不穩。
Q2(判斷題): 事件很多而且很密集時,還適合嗎?
→ 看情況,若事件不再稀有或獨立性不強,其他分佈可能更合適
常見問題
卜瓦松分佈與二項分佈有什麼區別?
二項分佈描述的是在固定次數的獨立試驗中,成功的次數。 而卜瓦松分佈描述的是在固定時間或地點內,事件發生的次數。 當試驗次數很大,且每次試驗成功的機率很小時,二項分佈可以近似為卜瓦松分佈。
如何估計卜瓦松分佈的平均發生率 λ?
估計卜瓦松分佈的平均發生率 λ 最簡單的方法是計算樣本的平均值。 例如,如果我們在 10 個小時內觀察到事件發生了 50 次,那麼平均發生率 λ 的估計值就是 50/10 = 5。
卜瓦松分佈在異常檢測中有哪些應用?
卜瓦松分佈可以用於檢測異常事件。 例如,如果我們知道一個網站平均每小時收到 100 個請求,我們可以利用卜瓦松分佈來判斷某個小時收到 200 個請求是否異常。 如果這個機率非常小,那麼我們就可以認為這個事件是異常的。