代入値が各変数の値の妥当な範囲外に出てしまうことを避けるため、変 数に制約条件を設けてユーザー指定による代入モデルを指定します。さ らに、「家族全体の収入」がかなり右に歪んでおり、詳細な分析に「収 入」の対数を使用するのが望ましいため、収入の対数を直接入力して も問題ないと思われます。
E 元のデータセットがアクティブであることを確認します。
E 収入の対数の変数を作成するには、メニューから次の項目を選択します。
[変換] > [変数の計算...]
図 5-15
[変数の計算] ダイアログ
E 目標変数として 「lninc」と入力します。
E 数式として「ln(income)」と入力します。
E [型 & ラベル] をクリックします。
図 5-16
[型とラベルの定義] ダイアログ ボックス
E ラベルに「Log of income」と入力します。
E [続行] をクリックします。
E [変数の計算] ダイアログ ボックスで[OK] をクリックします。
図 5-17
代入モデルの家族全体の収入を置き換える「Log of income」 という [変数] タブ
E [欠損データ値を代入] ダイアログ ボックスをもう一度開き、[変数]タブ をクリックします。
E [家族全体の収入 [収入]] のチェックを外し、モデルの変数として [Log of income [lninc]] を選択します。
E [方法] タブをクリックします。
図 5-18
既存のデータセットの置き換えの警告
E 警告が表示された場合は、[はい] をクリックします。
図 5-19 [方法] タブ
E [ユーザー指定] を選択し、 代入方法として、[完全条件指定]を選択したま まの状態にします。
E [制約条件] タブをクリックします。
図 5-20 [制約条件] タブ
E [データのスキャン]をクリックします。
E [制約の定義] グリッドで、「サービス月間 [期間]」の最小値に「1」と入 力します。
E 「年齢」の最小値として「18」と入力します。.
E 「居住年数 (現住所での居住年数)」の最小値として「0」と入力します。.
E 「雇用 (勤続年数)」の最小値として「0」と入力します。
E 「同居人数 (世帯の同居人数)」の最小値として「1」、丸めとして「1」と入
力します。他のスケール変数の多くは、整数値として報告されますが、現 在の住所に誰かが 13.8 年間住んでいると仮定することはできますが、2.2 人がそこに住んでいるとは実際は考えられません。
E 「lninc (収入の対数)」の最小値として「0」と入力します。
E [出力] タブをクリックします。
図 5-21 [出力] タブ
E [反復の記述を作成] を選択し、新しいデータセット名として、「telcoFCS」 と入力します。
E [OK] をクリックします。
代入制限
図 5-22 代入制限
ユーザー指定の代入モデルは、結果として、代入モデルに設けられた 制約を確認する新しいテーブルになります。すべては、ユーザーの指 定にしたがって、作成されます。
[記述統計]
図 5-23
期間 (サービス月間) の記述統計量
制約条件が設けられたユーザー指定の代入モデルの「期間 (サービス月 間)」の記述統計量テーブルは、「期間」に、マイナスの値が代入される問 題が解決していることが分かります。
図 5-24
婚姻状況の記述統計量
「婚姻状況」のテーブルは、分布が元のデータにさらに一致した代入 (3) が行われていますが、大部分は依然として、元のデータよりも多くのケー スが婚姻状態にあることを示しています。これは、ランダムな変動が原因 であることが考えられますが、これらの値がランダムに欠損 (MAR) してい ないかどうかを決定するために、詳細にデータを研究する必要があるかも しれません。ここでは、これ以上追求することはしません。
図 5-25
lninc (収入の対数) の記述統計量
「期間」と同様、その他すべてのスケール変数、「lninc (収入の対数)」
は、マイナスの代入値を表しません。さらに、代入の平均値は、—「収入」
スケールの自動代入の実行時より元のデータの平均値に近く、「lninc 」 の元のデータの平均値は、約 e3.9291=50.86 です。それに対し、代入の標準 的な平均値は、約 e4.2=66.69 です。また、それぞれの代入の最大値は、元 のデータの最大値に近くなっています。