Question 1

決策樹如何處理缺失值？

Accepted Answer

決策樹可以透過多種方式處理缺失值，例如忽略包含缺失值的樣本，或使用其他樣本的值進行填補。更進階的方法是在選擇最佳特徵時，考慮缺失值對信息增益或 Gini 不純度的影響，並將缺失值作為一個單獨的分支進行處理。

Question 2

決策樹有哪些常見的剪枝策略？

Accepted Answer

決策樹的剪枝策略可以分為預剪枝 (Pre-pruning) 和後剪枝 (Post-pruning) 兩種。預剪枝是在樹的生長過程中，提前停止樹的生長，例如設定最大樹深度或最小樣本數。後剪枝是在樹完全生長完成後，自底向上地刪除一些節點，例如使用驗證集進行評估，刪除能夠提高泛化能力的節點。

Question 3

隨機森林 (Random Forest) 和決策樹有什麼關係？

Accepted Answer

隨機森林是一種集成學習演算法，它由多棵決策樹組成。每棵決策樹都是在原始資料的一個隨機子集上訓練的，並且在選擇最佳特徵時，只考慮一部分特徵。隨機森林透過集成多棵決策樹的預測結果，可以有效降低過擬合風險，提高模型的準確率和泛化能力。

決策樹（Decision Tree）是什麼？

容易混淆