• Nem Talált Eredményt

Der Text-Assistent kann Textdatendateien in einer Vielzahl von verschiedenen Formaten einlesen:

Tabulator-getrennte Dateien

Leerzeichen-getrennte Dateien

Komma-getrennte Dateien

Dateien mit Spalten fester Breite

Sie können bei Dateien mit Trennzeichen auch andere Zeichen als Trennzeichen zwischen Werten festlegen, und Sie können mehrere Trennzeichen bestimmen.

So lesen Sie Textdatendateien ein

E Wählen Sie die folgenden Befehle aus den Menüs aus:

Datei > Textdaten lesen...

E Wählen Sie im Dialogfeld “Öffnen von Daten” die Textdatei aus.

E Bestimmen Sie, wie die Datendatei eingelesen werden soll. Gehen Sie dazu anhand der Schritte im Text-Assistenten vor.

Text-Assistent: Schritt 1

Abbildung 3-13 Text-Assistent: Schritt 1

Die Textdatei wird im Vorschaufenster angezeigt. Sie können ein vordefiniertes (also zuvor im Text-Assistenten gespeichertes) Format anwenden oder anhand der Schritte im Text-Assistenten vorgehen, um festzulegen, wie die Daten eingelesen werden sollen.

Text-Assistent: Schritt 2

Abbildung 3-14 Text-Assistent: Schritt 2

In diesem Schritt erhalten Sie Informationen über die Variablen. Eine Variable ist vergleichbar mit einem Feld in einer Datenbank. So stellt beispielsweise jede Frage auf einem Fragebogen eine Variable dar.

Wie sind die Variablen angeordnet?Damit der Text-Assistent die Daten ordnungsgemäß einlesen kann, müssen Sie dem Text-Assistenten mitteilen, woran das Ende des Datenwerts einer Variablen bzw. der Anfang des Datenwerts der nachfolgenden Variablen erkannt werden kann. Die Methode, mit der eine Variable von der nächsten unterschieden wird, ist abhängig von der Anordnung der Variablen.

Mit Trennzeichen. Leerzeichen, Kommata, Tabulatoren oder andere Zeichen werden zum Trennen von Variablen verwendet. Die Variablen werden für jeden Fall in derselben Reihenfolge aufgezeichnet, befinden sich aber nicht notwendigerweise an derselben Spaltenposition.

Feste Breite.Jede Variable wird für jeden Fall in der Datendatei an der gleichen Spaltenposition in derselben Zeile im Datensatz aufgezeichnet. Zwischen den Variablen sind keine

Trennzeichen erforderlich. Bei vielen durch Computerprogramme erzeugten Textdatendateien kann es den Anschein haben, dass die Datenwerte ohne Trennzeichen ineinanderlaufen.

Durch die Spaltenposition ist jedoch festgelegt, welche Variable eingelesen wird.

Enthält die erste Zeile der Datei die Variablennamen? Wenn die erste Zeile der Datendatei aussagekräftige Beschreibungen für jede Variable enthält, können Sie diese Beschreibungen als Variablennamen einsetzen. Werte, die nicht den Regeln für Variablennamen entsprechen, werden in gültige Variablennamen umgewandelt.

Text-Assistent: Schritt 3 (durch Trennzeichen getrennte Dateien)

Abbildung 3-15

Text-Assistent: Schritt 3 (für durch Trennzeichen getrennte Dateien)

In diesem Schritt erhalten Sie Informationen über die Fälle. Ein Fall ist vergleichbar mit einem Datensatz in einer Datenbank. So ist zum Beispiel jede Person, die einen Fragebogen ausfüllt, ein Fall.

In welcher Zeile befindet sich der erste Fall in den Daten?Gibt die erste Zeile der Datendatei an, die Datenwerte enthält. Wenn die erste(n) Zeile(n) der Datendatei aussagekräftige Beschreibungen oder anderen Text und somit keine Datenwerte enthalten, ist diesnichtZeile 1.

Wie sind die Fälle dargestellt? Gibt an, woran der Text-Assistent erkennt, wo jeder Fall endet und der nächste beginnt.

Jede Zeile stellt einen Fall dar. Jede Zeile enthält nur einen Fall. Sehr häufig ist jeder Fall in einer einzigen Zeile enthalten. Hierbei kann es sich auch um eine sehr lange Zeile in einer Datendatei mit einer großen Anzahl von Variablen handeln. Wenn nicht alle Zeilen die gleiche Anzahl von Werten enthalten, wird die Anzahl der Variablen für jeden Fall durch die Zeile mit

den meisten Datenwerten festgelegt. Fällen mit weniger Datenwerten werden fehlende Werte für die zusätzlichen Variablen zugewiesen.

Folgende Anzahl von Variablen stellt einen Fall dar.Durch die festgelegte Anzahl von Variablen pro Fall wird dem Text-Assistenten mitgeteilt, an welcher Stelle eine Variable endet und die nächste beginnt. Eine Zeile kann mehrere Fälle enthalten, und Fälle können in der Mitte einer Zeile beginnen und in der nächsten Zeile fortgesetzt werden. Der Text-Assistent bestimmt das Ende jedes Falls unabhängig von der Anzahl der Zeilen anhand der Anzahl von eingelesenen Werten. Für jeden Fall müssen Datenwerte (oder durch Trennzeichen angezeigte fehlende Werte) für alle Variablen vorhanden sein. Ansonsten wird die Datendatei nicht ordnungsgemäß eingelesen.

Wie viele Fälle sollen importiert werden? Sie können alle Fälle der Datendatei, die erstennFälle (nist eine von Ihnen festgelegte Zahl) oder eine Stichprobe mit einem bestimmten Prozentsatz der Fälle importieren. Da die Routine für Zufallsstichproben für jeden Fall eine unabhängige Pseudo-Zufallsentscheidung trifft, entspricht der Prozentsatz der tatsächlich ausgewählten Fälle nur ungefähr dem angegebenen Prozentwert. Je mehr Fälle sich in der Datendatei befinden, desto eher entspricht der Prozentsatz ausgewählter Fälle dem angegebenen Prozentsatz.

Text-Assistent: Schritt 3 (Dateien mit Spalten fester Breite)

Abbildung 3-16

Text-Assistent: Schritt 3 (für Dateien mit Spalten fester Breite)

In diesem Schritt erhalten Sie Informationen über die Fälle. Ein Fall ist vergleichbar mit einem Datensatz in einer Datenbank. So ist zum Beispiel jede Person, die einen Fragebogen ausfüllt, ein Fall.

In welcher Zeile befindet sich der erste Fall in den Daten?Gibt die erste Zeile der Datendatei an, die Datenwerte enthält. Wenn die erste(n) Zeile(n) der Datendatei aussagekräftige Beschreibungen oder anderen Text und somit keine Datenwerte enthalten, ist diesnichtZeile 1.

Wie viele Zeilen stellen einen Fall dar?Gibt an, woran der Text-Assistent erkennt, wo jeder Fall endet und der nächste beginnt. Jede Variable ist durch ihre Zeilennummer innerhalb des Falls und durch ihre Spaltenposition festgelegt. Sie müssen die Anzahl der Zeilen pro Fall angeben, damit die Daten richtig eingelesen werden können.

Wie viele Fälle sollen importiert werden? Sie können alle Fälle der Datendatei, die erstennFälle (nist eine von Ihnen festgelegte Zahl) oder eine Stichprobe mit einem bestimmten Prozentsatz der Fälle importieren. Da die Routine für Zufallsstichproben für jeden Fall eine unabhängige Pseudo-Zufallsentscheidung trifft, entspricht der Prozentsatz der tatsächlich ausgewählten Fälle nur ungefähr dem angegebenen Prozentwert. Je mehr Fälle sich in der Datendatei befinden, desto eher entspricht der Prozentsatz ausgewählter Fälle dem angegebenen Prozentsatz.

Text-Assistent: Schritt 4 (durch Trennzeichen getrennte Dateien)

Abbildung 3-17

Text-Assistent: Schritt 4 (für durch Trennzeichen getrennte Dateien)

In diesem Schritt zeigt der Text-Assistent einen Vorschlag an, wie die Variablen aus der Datendatei eingelesen werden. Sie können diesen Vorschlag ändern.

Welches Zeichen trennt die Variablen? Geben Sie hier das Zeichen an, mit dem die Datenwerte getrennt werden. Sie können eine beliebige Kombination aus Leerzeichen, Kommata, Semikola, Tabulatoren und anderen Zeichen wählen. Mehrere aufeinander folgende Trennzeichen, die keine Datenwert einschließen, werden als fehlende Werte behandelt.

Was ist das Texterkennungszeichen? Hierbei handelt es sich um Zeichen, mit denen Werte eingeschlossen werden, die Trennzeichen enthalten. Wenn beispielsweise ein Komma das Trennzeichen ist, werden Werte mit Kommata falsch eingelesen, sofern es keine

Texterkennungszeichen gibt, die den Wert einschließen und damit verhindern, dass die Kommata in dem Wert als Trennzeichen zwischen Werten interpretiert werden. Bei Datendateien

im CSV-Format, die aus Excel exportiert werden, werden Anführungszeichen (“) als

Texterkennungszeichen verwendet. Die Texterkennungszeichen erscheinen am Anfang und am Ende des Werts, umschließen also den ganzen Wert.

Text-Assistent: Schritt 4 (Dateien mit Spalten fester Breite)

Abbildung 3-18

Text-Assistent: Schritt 4 (für Dateien mit Spalten fester Breite)

In diesem Schritt zeigt der Text-Assistent einen Vorschlag an, wie die Variablen aus der Datendatei eingelesen werden. Sie können diesen Vorschlag ändern. Vertikale Linien im Vorschaufenster kennzeichnen die Positionen, von denen der Text-Assistent annimmt, dass sie den Anfang der einzelnen Variablen in der Datei kennzeichnen.

Fügen Sie erforderlichenfalls weitere Variablentrennlinien ein oder verschieben bzw. löschen Sie vorhandene Linien. Wenn für jeden Fall mehrere Zeilen verwendet werden, werden die Daten jeweils als eine einzige Zeile für jeden Fall angezeigt, wobei die nachfolgenden Zeilen am Ende der angezeigten Zeile angehängt werden.

Anmerkungen:

Bei computergenerierten Datendateien mit einem kontinuierlichen Fluß an Datenwerten ohne trennende Leerzeichen oder andere Zeichen kann es große Schwierigkeiten bereiten, zu bestimmen, wo die einzelnen Variablen beginnen. Bei dieser Art von Datendatei sind normalerweise Datendefinitionsdateien oder andere schriftliche Beschreibungen notwendig, in denen die Zeile und die Spalte für jede Variable aufgeführt sind.

Text-Assistent: Schritt 5

Abbildung 3-19 Text-Assistent: Schritt 5

In diesem Schritt legen Sie fest, welchen Variablennamen und welches Datenformat der Text-Assistent beim Einlesen der Variablen verwendet und welche Variablen in der endgültigen Datendatei enthalten sein werden.

Variablenname. Sie können die vom System vorgegebenen Variablennamen durch Ihre eigenen überschreiben. Beim Einlesen von Variablennamen aus der Datendatei ändert der Text-Assistent automatisch Variablennamen, die nicht den Regeln für Variablennamen entsprechen. Wählen Sie im Vorschaufenster eine Variable und geben Sie einen Variablennamen ein.

Datenformat. Wählen Sie im Vorschaufenster eine Variable und wählen Sie ein Format aus der Dropdown-Liste aus. Halten Sie zum Auswählen mehrerer aufeinander folgender Variablen beim Klicken die UMSCHALTTASTE gedrückt. Halten Sie beim Auswählen von mehreren nicht aufeinander folgenden Variablen beim Klicken die STRG-Taste gedrückt.

Das Standardformat wird durch die Datenwerte in den ersten 250 Zeilen vorgegeben. Falls innerhalb der ersten 250 Zeilen mehr als ein Format (z.B. numerisch, Datum, String) gefunden wird, wird das Standardformat auf String eingestellt.

Formatoptionen im Text-Assistenten

Beim Einlesen von Variablen mit dem Text-Assistenten sind die folgenden Formatoptionen verfügbar:

Nicht importieren.Die gewählte(n) Variable(n) in der Datendatei wird/werden übersprungen.

Numerisch. Gültige Werte sind Ziffern, ein führendes Plus- oder Minuszeichen und ein Dezimaltrennzeichen.

String. Gültige Werte hierfür sind fast alle Zeichen, die auf der Tastatur eingegeben werden können, und eingebettete Leerzeichen. Bei Dateien mit Trennzeichen können Sie die Anzahl der Zeichen im Wert angeben, bis zu maximal 32.767. In der Standardeinstellung setzt der Text-Assistent die Zeichenanzahl auf den längsten String, der für die gewählte(n) Variable(n) in den ersten 250 Zeilen der Datei gefunden werden kann. Bei Dateien mit Spalten fester Breite wird die Zeichenanzahl der Strings durch die Anordnung der Variablentrennlinien in Schritt 4 bestimmt.

Datum/Uhrzeit.Zu den gültigen Werten zählen Daten im allgemeinen Formattt-mm-jjjj,mm/tt/jjjj, tt.mm.jjjj,jjjj/mm/tt,hh:mm:ssund eine Vielzahl anderer Formate für das Datum und die Uhrzeit.

Monate können durch arabische oder römische Ziffern und dreibuchstabige Abkürzungen dargestellt oder vollständig ausgeschrieben werden. Wählen Sie ein Datumsformat aus der Liste aus.

Dollar.Als zulässige Werte gelten Ziffern mit optionalem führenden Dollarzeichen und optionalen Kommata als Tausendertrennzeichen.

Komma. Als gültige Werte hierfür gelten Zahlen, in denen Dezimalstellen durch einen Punkt wiedergegeben und Kommata als Tausendertrennzeichen verwendet werden.

Punkt. Als gültige Werte hierfür gelten Zahlen, in denen Dezimalstellen durch ein Komma wiedergegeben und Punkte als Tausendertrennzeichen verwendet werden.

Hinweis: Werte, die unzulässige Zeichen für das gewählte Format enthalten, werden als fehlende Werte behandelt. Werte, in denen eines der angegebenen Trennzeichen enthalten ist, werden als Mehrfachwerte behandelt.

Text-Assistent: Schritt 6

Abbildung 3-20 Text-Assistent: Schritt 6

Dies ist der letzte Schritt im Text-Assistenten. Sie können Ihre Einstellungen in einer Datei speichern, um sie beim Importieren ähnlicher Textdatendateien verwenden zu können. Sie können auch die vom Text-Assistenten erzeugte Syntax in ein Syntax-Fenster einfügen. Sie können die Syntax dann anpassen und/oder speichern, um sie bei anderen Sitzungen oder Produktionsjobs einsetzen zu können.

Daten in lokalen Zwischenspeicher. Ein Zwischenspeicher (Cache) für die Daten ist eine vollständige Kopie der Datendatei, die temporär auf der Festplatte gespeichert wird.

Zwischenspeichern der Datendatei kann die Leistung verbessern.