• Nem Talált Eredményt

テキスト ウィザード

In document IBM SPSS Statistics (Pldal 54-65)

テキスト ウィザードを使用すると、次のようなさまざまな書式のテキスト データ ファイルを読み込むことができます。

タブ区切りファイル

スペース区切りファイル

カンマ区切りファイル

固定フィールド書式ファイル

自由書式ファイルでは、値と値の間に入れる区切り文字として他の文字を指 定することもでき、さらに複数の区切り文字を指定することもできます。

テキスト データ ファイルを読み込むには

E メニューから次の項目を選択します。

ファイル(F) > テキスト データの読み込み(D)...

E [ファイルを開く] ダイアログ ボックスで、テキスト ファイルを選択 します。

E テキスト ウィザードの手順に従って、データ ファイルの読み込み方法 を定義します。

テキスト ウィザード: ステップ 1

図 3-13

テキスト ウィザード: ステップ 1

プレビュー ウィンドウにテキスト ファイルが表示されます。定義済み の形式 (テキスト ウィザードですでに保存されている形式) を適用した り、テキスト ウィザードのステップに従って、データの読み込み方法を 指定できます。

テキスト ウィザード: ステップ 2

図 3-14

テキスト ウィザード: ステップ 2

このステップでは、変数に関する情報を指定します。変数は、データベース のフィールドに似ています。たとえば、アンケートの各項目は変数です。

元データの形式 データを正しく読み込むために、テキスト ウィザードで

は、ある変数のデータ値がどこで終わり、次の変数のデータ値がどこで始 まるかを判別する方法を指定する必要があります。変数の並べ方によっ て、前の変数と次の変数を区別する方法を定義します。

自由書式。スペース、カンマ、タブ、またはその他の文字を使用して変

数を区切ります。変数は各ケースに対して同じ順序で記録されますが、

必ずしも同じ列位置ではありません。

固定書式。 各変数は、データ ファイルの各ケースに対して同じレコー

ド (行) 上の同じ列位置に記録されます。変数と変数との間に区切り 文字は必要ありません。実際、一般のコンピュータ プログラムで生 成されたテキスト データ ファイルの多くは、データ値はスペースで 区切られることもなく、列記されて表示されます。列位置により、読 み込まれる変数が決まります。

ファイルの先頭に変数名を含んでいますか? データ ファイルの先頭の行に各 変数を説明するラベルが含まれている場合は、それらのラベルを変数名 として使用できます。変数の命名規則に従っていない値は、有効な変数 名に変換されます。

テキスト ウィザード: ステップ 3 (自由書式)

図 3-15

テキスト ウィザード: ステップ 3 (自由書式用)

このステップでは、ケースに関する情報を指定します。ケースは、デー タベースのレコードに似ています。たとえば、アンケートのそれぞれ の回答者は、1 つのケースです。

最初のケースの取り込み開始行番号(F)データ値が格納されているデータ ファ

イルの 1 行目を示します。データ ファイルの最初の行にデータ値を表さ ない説明ラベルまたはその他のテキストが含まれている場合、この値 は 1 行目にはなりません。

ケースの表される方法 各ケースの終わる位置と次のケースの始まる位置をテ

キスト ウィザードが判別する方法を設定します。

各行が 1 つのケースを表す。 各行には 1 つのケースしか入りません。大量 の変数が含まれるデータ ファイルで非常に長い行になることがあって も、各ケースが 1 行に収められていることはよくあります。すべての 行に同一個数のデータ値が含まれるわけではない場合、各ケースの変数 の個数は、最大個数のデータ値が含まれる行によって決まります。デー タ値が少ないケースには、追加変数の欠損値が割り当てられます。

特定の数の変数が 1 つのケースを表す。 テキスト ウィザードは、各ケース

の変数の指定された数から、前のケースの読み込みを停止する位置と次 のケースの読み込みを開始する位置を判断します。同一行に多数のケー スが含まれることがあり、またケースが前の行の真中から始まり、次 の行まで続くということもあります。テキスト ウィザードは、行数 に関係なく、読み込んだ値の個数に基づいて各ケースの終わりを判別 します。各ケースは、すべての変数に対してデータ値 (または区切り 文字が示す欠損値) を含んでいる必要があります。そうでない場合、

データ ファイルは正常に読み込まれません。

インポートするケース数データ ファイル内のすべてのケース、最初の n 個の

ケース (n は指定した数)、または指定したパーセントの無作為抽出サン プルをインポートできます。無作為抽出ルーチンは各ケースに対して独 立した疑似無作為決定を行うので、選択されたケースのパーセントを指 定したパーセントに近づけることができます。データ ファイル内にケー スが多くあるほど、選択されたケースのパーセントは指定したパーセン トに近くなります。

テキスト ウィザード: ステップ 3 (固定書式)

図 3-16

テキスト ウィザード: ステップ 3 (固定書式用)

このステップでは、ケースに関する情報を指定します。ケースは、デー タベースのレコードに似ています。たとえば、アンケートの回答者は、

1 つのケースになります。

最初のケースの取り込み開始行番号(F)データ値が格納されているデータ ファ

イルの 1 行目を示します。データ ファイルの最初の行にデータ値を表さ ない説明ラベルまたはその他のテキストが含まれている場合、この値 は 1 行目にはなりません。

1 つのケースを表す行数(L)各ケースの終わる位置と次のケースの始まる位置

をテキスト ウィザードが判別する方法を設定します。各変数は、その変数 のケース内の行数とその変数の列位置によって定義されます。データを正 常に読み込むには、ケースごとに行数を指定する必要があります。

インポートするケース数データ ファイル内のすべてのケース、最初の n 個の

ケース (n は指定した数)、または指定したパーセントの無作為抽出サン プルをインポートできます。無作為抽出ルーチンは各ケースに対して独

立した疑似無作為決定を行うので、選択されたケースのパーセントを指 定したパーセントに近づけることができます。データ ファイル内にケー スが多くあるほど、選択されたケースのパーセントは指定したパーセン トに近くなります。

テキスト ウィザード: ステップ 4 (自由書式)

図 3-17

テキスト ウィザード: ステップ 4 (自由書式用)

このステップでは、最良と思われるデータ ファイルの読み込み方法が表示 されます。また、データ ファイルからテキスト ウィザードに変数を読 み込ませる方法を修正できます。

変数間に使用する区切り記号 データ値を区切る文字または記号を示します。

スペース、カンマ、セミコロン、タブ、その他の文字を組み合せて選択 できます。データ値が間に挟まっていない複数の連続する区切り文字 は、欠損値として取り扱われます。

テキスト修飾子 区切り記号を含む値を囲むために使用する文字のことです。

たとえば、カンマが区切り記号の場合、値にカンマが含まれていると、テ キスト修飾子で値を囲まなければ、その値は正しく読み込まれません。テ キスト修飾子で値を囲むことにより、値の中のカンマが区切り記号と解釈 されないようにします。Excel からエクスポートされた CSV 形式のデータ ファイルは、テキスト修飾子として二重引用符 (“) を使用しています。テ キスト修飾子は値の始まりと終わりの両方に使用され、値全体を囲みます。

テキスト ウィザード: ステップ 4 (固定書式)

図 3-18

テキスト ウィザード: ステップ 4 (固定書式用)

このステップでは、最良と思われるデータ ファイルの読み込み方法が表 示されます。また、データ ファイルからテキスト ウィザードに変数を 読み込ませる方法を修正できます。プレビュー ウィンドウの垂直線は、

そのファイルでテキスト ウィザードが現在認識している各変数の開始位 置を示しています。

変数を区切るため、必要に応じて変数分割行を挿入、移動、および削除 できます。各ケースに複数行が使用されると、行の終わりに追加した次の 行に各ケース 1 行としてデータが表示されます。

注:

コンピュータ生成のデータ ファイルが、間にスペースやその他の識別文字 が入らない、連続するデータ値列で構成されていると、各変数はどこか ら始まるのか判別が難しい場合があります。このようなデータ ファイル は、通常、各変数の行および列位置を指定したデータ定義ファイルまた はその他の記述書に依存します。

テキスト ウィザード: ステップ 5

図 3-19

テキスト ウィザード: ステップ 5

このステップでは、テキスト ウィザードで各変数を読み込むときに使用 する変数名とデータ形式、さらに最終的なデータ ファイルに含める変数

このステップでは、テキスト ウィザードで各変数を読み込むときに使用 する変数名とデータ形式、さらに最終的なデータ ファイルに含める変数

In document IBM SPSS Statistics (Pldal 54-65)