你有沒有遇過一個模型,資料進去後就一路往前算,不會回頭看前文?
你可以把前饋神經網路想成直線往前走的判斷器,輸入只往下一層傳,不會把前一輪狀態再拿回來。
它重要,是因為很多表格式資料只需要穩定的前向計算,不一定要記住前面的時間順序。
你可以把它想成一個把抽象概念拉回日常判斷的提示,先知道它解決什麼問題,再看技術細節。
容易混淆
前饋神經網路 vs 循環神經網路 前饋網路只做單次前向傳遞。 循環神經網路會把過去狀態帶回來,適合序列資料。
前饋神經網路 vs 轉換器架構 前饋網路是最基礎的全連接堆疊。 轉換器會再加上注意力機制,處理長距離關係更強。
記住這句就好
只往前算、不回頭記,就是前饋神經網路。
實際案例
信用審核 把收入、負債、年資丟進去,模型直接前向輸出風險分數,很適合固定欄位資料。
工廠良率預測 用溫度、壓力、轉速等欄位預測結果,通常不需要時間記憶時,前饋網路就能工作。
算法與應用
它通常由輸入層、隱藏層和輸出層組成,層與層之間做加權求和與非線性轉換。 這是很多深度學習模型的基礎骨架,也是理解更複雜架構前很值得先懂的東西。
情境判斷
Q1: 如果資料是固定欄位、沒有時間順序,前饋網路常常可以派上用場嗎?
可以,這正是它最常見的舞台。
Q2: 如果你要做語音逐字輸入,前饋網路一定是最佳選擇嗎?
不一定,因為那是序列問題,通常要看情況改用能處理時間依賴的模型。
常見問題
前饋神經網路就是深度學習嗎?
不是,前饋網路只是深度學習裡的一種基本架構。
它能處理文字嗎?
可以做分類類任務,但若要理解上下文,通常還要更強的序列模型。
為什麼它叫前饋?
因為訊號主要從前往後流動,不會回圈。
層數越多一定越好嗎?
不一定,太深會增加訓練難度,也可能更難調。