兩分類資料堆疊整合學習器

兩分類資料堆疊整合學習器Two-Classification Data Stack Integrated Learner

指導教授:李名鏞

專題組員:許博翔、顏畯榤、張妍婷、柯廷翰、陳宗揚、葉芷儀、韋葶妤、倪佩榆

驗證資料集

基礎模型

分析圖表

摘要

研究核心概念與整體方向

我們比較多種二元分類基礎模型，並透過不同的 stacking 與機率加權整合方式，檢驗是否能在多資料集任務中提升分類準確度、穩定性與泛化能力。

研究流程涵蓋資料前處理、模型訓練、模型篩選、次層整合與結果解釋，並藉由互動式網站將方法與結果以更具可讀性的形式呈現。

研究動機

單一模型在不同資料集上的穩定性有限，因此希望透過堆疊整合學習降低模型波動，提升分類表現。我們提出了勝算加權方法以及逆變異數加權方法，透過直接且解釋性高的加權方式來提升兩分類資料的分類準確度。

研究目的

我們針對二元分類問題，提出一種「基於勝算的堆疊演算法」（Odds-Based Stacking Algorithm）。該方法透過計算k個基礎模型之預測勝算（Odds）及其比例關係，將其轉化為堆疊過程中的加權依據，進而建構具備統計解釋性的水平堆疊（Horizontal Stacking）機制。