兩分類資料堆疊整合學習器

兩分類資料堆疊整合學習器Two-Classification Data Stack Integrated Learner

指導教授:李名鏞

專題組員:許博翔、顏畯榤、張妍婷、柯廷翰、陳宗揚、葉芷儀、韋葶妤、倪佩榆

8
驗證資料集
16
基礎模型
8+
分析圖表
摘要
研究核心概念與整體方向

我們比較多種二元分類基礎模型,並透過不同的 stacking 與機率加權整合方式,檢驗是否能在多資料集任務中提升分類準確度、穩定性與泛化能力。

研究流程涵蓋資料前處理、模型訓練、模型篩選、次層整合與結果解釋,並藉由互動式網站將方法與結果以更具可讀性的形式呈現。

研究動機
單一模型在不同資料集上的穩定性有限,因此希望透過堆疊整合學習降低模型波動,提升分類表現。我們提出了勝算加權方法以及逆變異數加權方法,透過直接且解釋性高的加權方式來提升 兩分類資料的分類準確度。
研究目的
我們針對二元分類問題,提出一種「基於勝算的堆疊演算法」(Odds-Based Stacking Algorithm)。 該方法透過計算k個基礎模型之預測勝算(Odds)及其比例關係,將其轉化為堆疊過程中的加權依據,進而建構具備統計解釋性的水平堆疊(Horizontal Stacking)機制。