• Nem Talált Eredményt

TwoStep 集群分析

In document 關於 SPSS Inc.,是一家 IBM 公司 (Pldal 167-171)

「TwoStep 集群分析」程序是設計用來顯示資料集中自然分組 (或集群) 的探索工 具 (原本不會加以顯示)。此程序所採用的演算法有數種理想的功能,這使它們與傳 統的集群技術因而有所區分。

„ 處理類別和連續變數。 藉由假設變數為自變數,結合的多項式-常態分配就可以放置

在類別和連續變數上。

„ 自動選擇集群數目。 藉由比較不同集群解之間的模型-選項準則的值,此程序可自

動決定最適集群數目。

„ 擴展性 藉由建構可摘要記錄的集群功能 (CF) 樹狀結構,TwoStep 演算法可讓您 分析大型資料檔。

範例。零售商和消費者產品公司通常會將集群技術,套用到描述它們客戶之消費習慣、

性別、年齡、收入水準等的資料。這些公司對每個消費者組別量身訂做行銷和產品跚 圖表 24-1

「TwoStep 集群分析」對話方塊

©Copyright SPSS Inc. 1989, 2010 153

章節 24 資訊準則」(Bayesian Information Criterion,BIC),或指定「Akaike 資訊準則」

(Akaike Information Criterion,AIC)。

資料。 此程序可用在連續變數及類別變數上。觀察值代表要集群的物件,變數則代

使用「雙變數相關分析」程序來檢定兩個連續變數的獨立性。Use the Crosstabs procedure to test the independence of two categorical variables. 使用「平均數」程 序來檢定連續變數和類別變數間的獨立性。 使用「預檢資料」程序來檢定連續變數的常

155 TwoStep 集群分析

「TwoStep 集群分析選項」

圖表 24-2

「TwoStep 集群選項」對話方塊

偏離值處理。 此組別可讓您處理偏離值,特別是在集群過程中集群功能 (CF) 樹狀結 構填滿時。CF 樹狀結構的分葉節點如果無法再接受任何觀察值,且沒有可分割的分 葉節點時,就是填滿的狀態。

„ 如果您選取噪音處理且 CF 樹狀結構為填滿狀態,分葉的中觀察值在放置到「噪 音」分葉後會重新成長。如果分葉包含少於最大分葉大小指定的觀察值百分比,此 種分葉就屬於稀疏。在樹狀結構重新成長之後,偏離值將會放到 CF 樹狀結構中 ( 如果可能的話)。如果沒有的話,偏離值會被捨棄。

„ 如果您沒有選取噪音處理而 CF 樹狀結構為填滿狀況,其在將變更門檻值變大時 會重新成長。在最終集群之後,無法指定到集群的值就會標記為偏離值。偏離值 集群的識別碼為 –1,且不算在集群數目的個數中。

記憶體配置。 此組別可讓您指定記憶體的最大容量 (以千位元組 MB 為單位),這也是集 群演算法應該使用的。如果程序超過此最大值,它將會使用磁碟來儲存不適合存在記憶 體的資訊。請指定一個大於或等於 4 的數值。

„ 有關您可在系統中指定的最大值,請諮詢您的系統管理員。

„ 如果此值過低,演算法可能會找不到正確或需要的集群數目。

章節 24

157

In document 關於 SPSS Inc.,是一家 IBM 公司 (Pldal 167-171)