• Nem Talált Eredményt

線型モデルを構成するには

In document IBM SPSS Statistics Base 19 (Pldal 106-109)

この機能は Statistics Base オプションが必要です。

メニューから次の項目を選択します。

分析(A) > Regression > 自動線型モデル...

E 対象フィールドと入力フィールドが少なくとも 1 つずつ必要です。

E [作成オプション] をクリックして、オプションの作成設定およびモデル設定

を指定します。

E [モデル オプション]をクリックし、スコアをアクティブなデータセットに保存 したり、モデルを外部ファイルにエクスポートできます。

E [実行]をクリックして手続きを実行してモデル オブジェクトを作成します。

線型モデル

„ 非常に大きなデータセットのモデルを構築 (IBM® SPSS® Statistics Server が必 要)。この方式により、データセットを個別のデータ ブロックに分割して アンサンブル モデルを構築します。上記のモデルのいずれかを作成する にはデータセットが大きすぎる場合、または増分モデル構築の場合、こ

94 15 章

のオプションを選択します。このオプションは、標準モデルと比べて構 築には時間がかからないものの、スコア付けに時間がかかる場合があり ます。このオプションには、SPSS Statistics Server 接続が必要です。

基本

図 15-3 [基本] の設定

自動的にデータを準備する: 内部的にに対象フィールドおよび予測フィールド

を変換し、モデルの予測精度を最大化できます。モデルによって変換が保 存され、スコアリングする新しいデータに適用されます。変換フィール ドの元のバージョンはモデルから除外されます。デフォルトでは、次の 自動データ準備が実行されます。

„ 日付および時間の処理各日付の予測フィールドは、基準日 (1970-01-01)

以降の経過時間を含む連続型予測フィールドに変換されます。各時間の 予測フィールドは、基準時刻 (00:00:00) 以降の経過時間を含む連続型 予測フィールドに変換されます。

„ 測定レベルの調整: 値が 5 個より少ない連続型予測フィールドは順序型

予測フィールドに変更されます。10 個より多くの値を持つ順序型予測 フィールドは連続型予測フィールドに変更されます。

„ 外れ値の処理:分割値を超える連続型予測フィールドの値 (平均値から

の標準偏差が 3) は分割値に設定されます。

線型モデル

„ 欠損値の処理: 名義型予測フィールドの欠損値は、学習データ区分の最

頻値と置き換えられます。順序型予測フィールドの欠損値は、学習デー タ区分の中央値と置き換えられます。連続型予測フィールドの欠損値 は、学習データ区分の平均値と置き換えられます。

„ 監視結合:目標と関連して処理するフィールドの数を減らして、より節

約的なモデルを作成します。同様のカテゴリが、入力フィールドと目 標フィールド間の関係に基づいて特定されます。それほど重要でない カテゴリ、つまり p が 0.1 より大きいカテゴリは、結合されます。

すべてのカテゴリが 1 つのカテゴリに結合される場合、予測値とし ての値がないため、元のバージョンのフィールドおよび派生した化さ れたフィールドはモデルから除外されます。

確信度レベル。係数ビューでモデル係数の間隔の推定値を計算するために使

用する確信度のレベルです。0 より大きく、100 より小さいの値を指定 します。デフォルトは 95 です。

In document IBM SPSS Statistics Base 19 (Pldal 106-109)