• Nem Talált Eredményt

圖表 15-4 模式選擇設定

模式選擇方法。選擇其中一種模式選擇方法 (詳細資訊如下) 或「」,以僅將所有可用 的預測值輸入為主效果模式項目。依預設,系統會使用「向前逐步」。

向前逐步選擇。此方法一開始並不會對模式產生任何效果,但會根據逐步條件一步一步

新增或移除效果,直至無法再新增或移除任何效果為止。

„ 選入/移除的條件。 此統計量決定是否應在模式中新增或移除效果。資訊準則 (AICC) 是以指定模式訓練集的概似為基礎,且會經過調整以懲罰過於複雜的模式。F 統 計量是以模式錯誤改善的統計檢定為基礎。已調整 R 平方是以訓練集的配適度為基 礎,且會經過調整以懲罰過於複雜的模式。過適預防準則 (ASE)是以過適預防集的 配適度 (平均平方誤,或 ASE) 為基礎。過適預防集是原始資料集 30% 左右的隨 機次樣本,不用來訓練模式。

若選擇任何非「F 統計量」的條件,則系統會將每個步驟中對應至最大正向增加條件 的效果新增至模式。系統會移除模式中任何對應至減少條件的效果。

章節 15

若選擇「F 統計量」作為條件,則系統會在每個步驟中,將最小 p 值小於指定門檻 (

包含 p 值小於此值的效果」) 的效果新增至模式。預設值是 0.05。系統會移除任何 p 值大於指定門檻 (「移除 p 值大於此值的效果」) 之模式中的效果。預設值是 0.10。

„ 自訂最終模式的最大效果數目。依預設,系統會將所有可用的效果輸入至模式。

或者,若逐步演算法以指定的最大效果數目來結束步驟,則演算法在停止時會保 有目前的效果集。

„ 自訂步驟的最大數目。逐步演算法在經過特定步驟數目後即會停止。依預設,此為可

用效果數目的 3 倍。或者,請指定正整數的步驟最大數目。

最佳子集選擇。這會檢查「所有可能」模式或是大於向前逐步的可能模式子集,以根據

最佳子集條件來選擇最佳子集。資訊準則 (AICC)是以指定模式訓練集的概似為基礎,且 會經過調整以懲罰過於複雜的模式。已調整 R 平方是以訓練集的配適度為基礎,且會經過 調整以懲罰過於複雜的模式。過適預防準則 (ASE) 過適預防準則 (平均平方誤,或 ASE) 為 基礎。過適預防集是原始資料集 30% 左右的隨機次樣本,不用來訓練模式。

系統會將具有最大條件值的模式選作最佳模式。

注意:最佳子集選擇較向前逐步選擇更需要大量計算。搭配 boosting、bagging 或極大 資料集執行最佳子集時,其建立時間會長於使用向前逐步選擇建立的標準模式。

集合

圖表 15-5 集合設定

系統在「目標」中要求 boosting、bagging 或極大資料集時,這些設定會決定所發生 的集合行為。系統會忽略無法套用至所選目標的選項。

81 線性模式

Bagging 與極大資料集。系統執行集合評分時,可使用此規則來合併基底模式的預測 值,以運算集合分數值。

„ 連續目標的預設合併規則。系統會使用基底模式預測值的平均數或中位數,來

合併連續目標的集合預測值。

請注意,若目標是用於強化模式準確性,則系統會忽略合併規則選擇。Boosting 會一律 使用大部分的加權投票來為類別目標評分,並且使用加權中位數來為連續目標評分。

Boosting 與 Bagging。當目標用於強化模式準確性或穩定性時,可指定欲建立的基底模 式數目;若為 bagging,則此為自助法範例的數目。其應為正整數。

進階

圖表 15-6 進階設定

複製結果。設定亂數種子以供您複製分析。系統會使用亂數產生器來選擇過適預防集中

的記錄。請指定一個整數,或是按一下「產生」以建立介於 1 和 2147483647 之間 (含) 的虛擬亂數整數。預設值是 54752075。

章節 15