• Nem Talált Eredményt

TwoStep クラスタ分析

In document IBM SPSS Statistics Base 19 (Pldal 197-200)

[TwoStep クラスタ分析] 手続きは、データセット内の自然なグループ (ま たはクラスタ) を明らかにすることを目的として設計された探索ツールで す。この手続きで使用されるアルゴリズムには、従来のクラスタ分析技術 とは異なるいくつかの優れた特徴があります。

„ カテゴリ変数と連続変数の処理。 変数が独立していると仮定することに

より、カテゴリ変数および連続変数について、多項分布と正規分布を 結合できます。

„ クラスタ数の自動選択。 異なるクラスタ解の間でモデル選択基準の値を

比較することにより、手続きで、最適なクラスタ数を自動的に判断 できます。

„ スケーラビリティ。 レコードを要約するクラスタ機能 (CF) ツリーを作成

することにより、TwoStep アルゴリズムで大きなデータ ファイルを 解析できます。

例:€小売業者および対消費者企業は定期的に、顧客の購買習慣、性別、年 齢、収入レベルなどを説明するデータにクラスタリング手法を適用します。

これらの企業は、マーケティングおよび製品開発戦略を各消費者グループ ごとに作成し、販売を拡大し、ブランド ロイヤリティを構築します。

© Copyright SPSS Inc. 1989, 2010 183

184 24 章

図 24-1

[TwoStep クラスタ分析] ダイアログ ボックス

距離測度。2 つのクラスタ間の類似度を計算する方法を指定します。

„ 対数尤度。この尤度測定により、変数の確率分布を求めます。連続変数

は正規分布しているものと仮定し、カテゴリ変数は多項分布しているも のと仮定します。すべての変数は独立しているものと仮定します。

„ ユークリッド。 ユークリッド測定は、2 つのクラスタ間の「直線」距離

です。この測定方法は、すべての変数が連続している場合にだけ使用 できます。

クラスタ数。 この項目を選択すると、クラスタの個数の判定方法を指定

できます。

„ 自動的に判定。 この手続きは、[クラスタ化の基準] グループで指定さ

れた基準を使用して、「最適な」クラスタの個数を自動的に判定しま す。オプションとして、手続きで考慮するクラスタの個数の最大値を正 の整数で入力できます。

„ 固定値を指定。 解に含まれるクラスタの個数を固定できます。正の整

数を入力してください。

連続変数の数。このグループは、[オプション] ダイアログ ボックスで指定

された連続変数の標準化設定の集計を示します。詳細は、 p.186 TwoStep クラスタ分析のオプション を参照してください。

TwoStep クラスタ分析

186 24 章

In document IBM SPSS Statistics Base 19 (Pldal 197-200)