[TwoStep クラスタ分析] 手続きは、データセット内の自然なグループ (ま たはクラスタ) を明らかにすることを目的として設計された探索ツールで す。この手続きで使用されるアルゴリズムには、従来のクラスタ分析技術 とは異なるいくつかの優れた特徴があります。
カテゴリ変数と連続変数の処理。 変数が独立していると仮定することに
より、カテゴリ変数および連続変数について、多項分布と正規分布を 結合できます。
クラスタ数の自動選択。 異なるクラスタ解の間でモデル選択基準の値を
比較することにより、手続きで、最適なクラスタ数を自動的に判断 できます。
スケーラビリティ。 レコードを要約するクラスタ機能 (CF) ツリーを作成
することにより、TwoStep アルゴリズムで大きなデータ ファイルを 解析できます。
例:€小売業者および対消費者企業は定期的に、顧客の購買習慣、性別、年 齢、収入レベルなどを説明するデータにクラスタリング手法を適用します。
これらの企業は、マーケティングおよび製品開発戦略を各消費者グループ ごとに作成し、販売を拡大し、ブランド ロイヤリティを構築します。
© Copyright SPSS Inc. 1989, 2010 183
184 24 章
図 24-1
[TwoStep クラスタ分析] ダイアログ ボックス
距離測度。2 つのクラスタ間の類似度を計算する方法を指定します。
対数尤度。この尤度測定により、変数の確率分布を求めます。連続変数
は正規分布しているものと仮定し、カテゴリ変数は多項分布しているも のと仮定します。すべての変数は独立しているものと仮定します。
ユークリッド。 ユークリッド測定は、2 つのクラスタ間の「直線」距離
です。この測定方法は、すべての変数が連続している場合にだけ使用 できます。
クラスタ数。 この項目を選択すると、クラスタの個数の判定方法を指定
できます。
自動的に判定。 この手続きは、[クラスタ化の基準] グループで指定さ
れた基準を使用して、「最適な」クラスタの個数を自動的に判定しま す。オプションとして、手続きで考慮するクラスタの個数の最大値を正 の整数で入力できます。
固定値を指定。 解に含まれるクラスタの個数を固定できます。正の整
数を入力してください。
連続変数の数。このグループは、[オプション] ダイアログ ボックスで指定
された連続変数の標準化設定の集計を示します。詳細は、 p.186 TwoStep クラスタ分析のオプション を参照してください。
TwoStep クラスタ分析
186 24 章