線型モデルを構成するには - IBM SPSS Statistics Base 19

この機能は Statistics Base オプションが必要です。

メニューから次の項目を選択します。

分析(A) > Regression > 自動線型モデル...

E 対象フィールドと入力フィールドが少なくとも 1 つずつ必要です。

E [作成オプション] をクリックして、オプションの作成設定およびモデル設定

を指定します。

E [モデルオプション]をクリックし、スコアをアクティブなデータセットに保存したり、モデルを外部ファイルにエクスポートできます。

E [実行]をクリックして手続きを実行してモデルオブジェクトを作成します。

線型モデル

非常に大きなデータセットのモデルを構築 (IBM® SPSS® Statistics Server が必要)。この方式により、データセットを個別のデータブロックに分割してアンサンブルモデルを構築します。上記のモデルのいずれかを作成するにはデータセットが大きすぎる場合、または増分モデル構築の場合、こ

94 15 章

のオプションを選択します。このオプションは、標準モデルと比べて構築には時間がかからないものの、スコア付けに時間がかかる場合があります。このオプションには、SPSS Statistics Server 接続が必要です。

図 15-3 [基本] の設定

自動的にデータを準備する：内部的にに対象フィールドおよび予測フィールド

を変換し、モデルの予測精度を最大化できます。モデルによって変換が保存され、スコアリングする新しいデータに適用されます。変換フィールドの元のバージョンはモデルから除外されます。デフォルトでは、次の自動データ準備が実行されます。

日付および時間の処理各日付の予測フィールドは、基準日 (1970-01-01)

以降の経過時間を含む連続型予測フィールドに変換されます。各時間の予測フィールドは、基準時刻 (00:00:00) 以降の経過時間を含む連続型予測フィールドに変換されます。

測定レベルの調整：値が 5 個より少ない連続型予測フィールドは順序型

予測フィールドに変更されます。10 個より多くの値を持つ順序型予測フィールドは連続型予測フィールドに変更されます。

外れ値の処理:分割値を超える連続型予測フィールドの値 (平均値から

の標準偏差が 3) は分割値に設定されます。

線型モデル

欠損値の処理：名義型予測フィールドの欠損値は、学習データ区分の最

頻値と置き換えられます。順序型予測フィールドの欠損値は、学習データ区分の中央値と置き換えられます。連続型予測フィールドの欠損値は、学習データ区分の平均値と置き換えられます。

監視結合：目標と関連して処理するフィールドの数を減らして、より節

約的なモデルを作成します。同様のカテゴリが、入力フィールドと目標フィールド間の関係に基づいて特定されます。それほど重要でないカテゴリ、つまり p が 0.1 より大きいカテゴリは、結合されます。

すべてのカテゴリが 1 つのカテゴリに結合される場合、予測値としての値がないため、元のバージョンのフィールドおよび派生した化されたフィールドはモデルから除外されます。

確信度レベル。係数ビューでモデル係数の間隔の推定値を計算するために使

用する確信度のレベルです。0 より大きく、100 より小さいの値を指定します。デフォルトは 95 です。

In document IBM SPSS Statistics Base 19 (Pldal 106-109)