この機能は Statistics Base オプションが必要です。
メニューから次の項目を選択します。
分析(A) > Regression > 自動線型モデル...
E 対象フィールドと入力フィールドが少なくとも 1 つずつ必要です。
E [作成オプション] をクリックして、オプションの作成設定およびモデル設定
を指定します。
E [モデル オプション]をクリックし、スコアをアクティブなデータセットに保存 したり、モデルを外部ファイルにエクスポートできます。
E [実行]をクリックして手続きを実行してモデル オブジェクトを作成します。
線型モデル
非常に大きなデータセットのモデルを構築 (IBM® SPSS® Statistics Server が必 要)。この方式により、データセットを個別のデータ ブロックに分割して アンサンブル モデルを構築します。上記のモデルのいずれかを作成する にはデータセットが大きすぎる場合、または増分モデル構築の場合、こ
94 15 章
のオプションを選択します。このオプションは、標準モデルと比べて構 築には時間がかからないものの、スコア付けに時間がかかる場合があり ます。このオプションには、SPSS Statistics Server 接続が必要です。
基本
図 15-3 [基本] の設定
自動的にデータを準備する: 内部的にに対象フィールドおよび予測フィールド
を変換し、モデルの予測精度を最大化できます。モデルによって変換が保 存され、スコアリングする新しいデータに適用されます。変換フィール ドの元のバージョンはモデルから除外されます。デフォルトでは、次の 自動データ準備が実行されます。
日付および時間の処理各日付の予測フィールドは、基準日 (1970-01-01)
以降の経過時間を含む連続型予測フィールドに変換されます。各時間の 予測フィールドは、基準時刻 (00:00:00) 以降の経過時間を含む連続型 予測フィールドに変換されます。
測定レベルの調整: 値が 5 個より少ない連続型予測フィールドは順序型
予測フィールドに変更されます。10 個より多くの値を持つ順序型予測 フィールドは連続型予測フィールドに変更されます。
外れ値の処理:分割値を超える連続型予測フィールドの値 (平均値から
の標準偏差が 3) は分割値に設定されます。
線型モデル
欠損値の処理: 名義型予測フィールドの欠損値は、学習データ区分の最
頻値と置き換えられます。順序型予測フィールドの欠損値は、学習デー タ区分の中央値と置き換えられます。連続型予測フィールドの欠損値 は、学習データ区分の平均値と置き換えられます。
監視結合:目標と関連して処理するフィールドの数を減らして、より節
約的なモデルを作成します。同様のカテゴリが、入力フィールドと目 標フィールド間の関係に基づいて特定されます。それほど重要でない カテゴリ、つまり p が 0.1 より大きいカテゴリは、結合されます。
すべてのカテゴリが 1 つのカテゴリに結合される場合、予測値とし ての値がないため、元のバージョンのフィールドおよび派生した化さ れたフィールドはモデルから除外されます。
確信度レベル。係数ビューでモデル係数の間隔の推定値を計算するために使
用する確信度のレベルです。0 より大きく、100 より小さいの値を指定 します。デフォルトは 95 です。