• Nem Talált Eredményt

读取数据库文件

In document IBM SPSS Statistics (Pldal 31-45)

只要有某种数据库格式的数据库驱动程序,就可以读取该数据库格式的数据。用本地分 析模式时,本地计算机上必须装有所需的驱动程序。用分布式分析模式时(IBM® SPSS®

Statistics Server 提供),远程服务器上必须安装这些驱动程序。

注意:如果您正在运行 SPSS Statistics 的 Windows 64 位版本,则无法读取 Excel、

Access 或 dBASE 数据库源,即使它们出现在可用数据库源列表中。这些产品的 32 位

ODBC 数据源(O)

如果没有配置任何 ODBC 数据源,或者要添加新的数据源,请单击添加 ODBC 数据源

„ 在 Linux 操作系统中,该按钮不可用。在 odbc.ini 中指定 ODBC 数据源,并且 ODBCINI 环境变量必须设定为该文件的位置。有关更多信息,请参见数据库驱 动程序文档。

„ 用分布式分析模式时(IBM® SPSS® Statistics Server 提供),该按钮不可用。要 用分布式分析模式添加数据源,请咨询系统管理员。

ODBC 数据源由两条基本信息组成:要用来访问数据的驱动程序和要访问的数据库的位 置。要指定数据源,必须装有适当的驱动程序。针对不同数据库格式的驱动程序可以 从http://www.spss.com/drivers 获得。

图片 3-1 数据库向导

OLE DB 数据源

要访问 OLE DB 数据源(在 Microsoft Windows 操作系统上可用),必须安装有以下内容:

„ .NET Framework。要获得最新版本的 .NET Framework,请转至 http://www.microsoft.com/net。

„ IBM® SPSS® Data Collection Survey Reporter Developer Kit。可以从安装介质上安 装与此发行版本兼容的某个版本。如果您在使用 IBM® SPSS® Statistics Developer,

则可以从www.spss.com/statistics (http://www.spss.com/statistics/) 的“下 载”选项卡上下载兼容的版本。

以下限制适用于 OLE DB 数据源:

„ OLE DB 数据源不支持表连接。一次只能读取一个表。

„ 您只能以本地分析模式添加 OLE DB 数据源。要在 Windows 服务器上以分布式分析模 式添加 OLE DB 数据源,请咨询系统管理员。

„ 使用分布式分析模式时(SPSS Statistics Server 提供),OLE DB 数据源只能在 Windows 服务器上使用,并且该服务器上必须安装有 .NET 和 SPSS Survey Reporter Developer Kit。

图片 3-2

使用数据库向导访问 OLE DB 数据源

添加 OLE DB 数据源:

E 单击添加 OLE DB 数据源

E 在“数据链接属性”对话框中,单击提供程序选项卡,然后选择 OLE DB 提供程序。

E 单击下一步,或单击连接选项卡。

E 可通过输入目录位置和数据库名称,或者单击按钮浏览到数据库来选择数据库。(还可 能需要用户名和密码。)

E 输入所有必需信息后,单击确定。(您可通过单击测试连接按钮来确保指定的数据库 可用。)

E 为数据库连接信息输入名称。(该名称将显示在可用的 OLE DB 数据源列表中。)

图片 3-3

“将 OLE DB 连接信息另存为”对话框

E 单击确定

此操作将返回到“数据库向导”的第一个屏幕,您可以在该屏幕上从 OLE DB 数据源列 表中选择已保存的名称,然后继续执行向导的下一步。

删除 OLE DB 数据源

要从 OLE DB 数据源列表中删除数据源名称,可在下列位置删除包含该数据源名称 的 UDL 文件:

[驱动器]:\Documents and Settings\[user login]\Local Settings\Application Data\SPSS\UDL

选择数据字段

“选择数据”步骤控制将读取哪些表和字段。数据库字段(列)读取为变量。

如果在表中选择了任何字段,则在以下“数据库向导”窗口中所有的字段都可见,

但只有在这一步中选中的字段才作为变量导入。这使您可以创建表连接,并使用未 导入的字段指定条件。

图片 3-4

数据库向导,选择数据

显示字段名称。要列出表中的字段,请单击表名称左边的加号 (+)。要隐藏字段,请

单击表名称左边的减号 (–)。

要添加字段。双击“可用的表”列表中的任何字段,或者将其拖到“按此顺序检索字

段”列表中。在字段列表中拖放字段可以对其重新排序。

删除字段。双击“按此顺序检索字段”列表中的任何字段,或者将其拖到“可用

的表”列表。

将字段名称排序。如果选中该复选框,“数据库向导”就会按照字母顺序显示可用

的字段。

默认情况下,可用表的列表只显示标准数据库表。可以控制列表中显示的项的类型:

„ 表。标准数据库表。

„ 视图。视图是由查询定义的虚拟的或动态的“表”。视图中可以包含基于其他字段值 计算得出的多个表和/或字段的连接。

„ 同义词。同义词是表或视图的别名,通常在查询中定义。

„ 系统表。系统表定义数据库的属性。在某些情况下,标准数据库表可能会被分类 成系统表,并且仅在选择了该选项后才会显示。通常只有数据库管理员才有访问 真正的系统表的权限。

注意:对于 OLE DB 数据源(仅在 Windows 操作系统上可用),只能从单个表中选择字 段。OLE DB 数据源不支持多个表连接。

创建表之间的关系

“指定关系”步骤使您可以定义 ODBC 数据源的表之间的关系。如果选择的字段来自一 个以上的表,则必须定义至少一个连接。

图片 3-5

数据库向导,指定关系

建立关系。要创建关系,请将任意表上的字段拖到要连接的字段上。“数据库向导”将

在两个字段之间画一条连接线,表明它们的关系。这些字段的数据类型必须相同。

自动连接表。可尝试按照主/外键或匹配的字段名和数据类型来自动连接表。

连接类型。如果驱动程序支持外部连接,则可以指定内部连接、左边外连接或右边

外连接。

„ Inner joins.内部连接仅包括相关字段相等的行。在此示例中,将包括两个表中 具有匹配的 ID 值的所有行。

„ 外部连接。除了内部连接的一对一匹配外,还可以使用外部连接通过一对多匹配方案

来合并表。例如,您可以将其中只包含少量代表数据值和关联描述性标签的记录的 表,和包含上百个或上千个代表调查响应者的记录的表中的值相匹配。左边外连接包 括左边的表中的所有记录,而仅包括右边的表中相关字段相等的记录。在右边外连 接中,连接从右边的表导入所有记录,而仅从左边的表导入相关字段相等的记录。

限制检索的个案

“限制检索的个案”步骤使您可以指定选择个案(行)的子集的条件。限制个案通常包 括用条件填充条件网格。条件由两个表达式以及它们之间的某种关系组成。该表达式返 回每个个案的 true、false 或 missing 值。

„ 如果结果是 true,则选中该个案。

„ 如果结果是 false 或 missing,则不选中该个案。

„ 大多数条件使用六个关系运算符中的一个或多个(<、>、<=、>=、= 和 <>)。

„ 表达式可以包括字段名、常数、算术运算符、数字和其他函数以及逻辑变量。

可以将不打算导入的字段用作变量。

图片 3-6

数据库向导,限制检索的个案

要建立条件,至少需要两个表达式和一种连接表达式的关系。

E 要建立表达式,请选择下列一种方法:

„ 在“表达式”单元格中,键入字段名、常数、算术运算符、数字和其他函数或逻

{ts '2005-01-01 01:05:00'}

函数。可选择内置算术、逻辑、字符串、日期和时间 SQL 函数。可将函数从列表中拖到 机抽样(如果对该数据源可用)速度比 IBM® SPSS® Statistics 随机抽样要快,因为 SPSS Statistics 随机抽样必须读取整个数据源才能抽取随机样本。

„ 近似. 生成近似于指定个案百分比的随机样本。由于此例程为每个个案作出独立的 伪随机决策,因此选定个案的百分比只能近似于指定的百分比。数据文件中的个 案越多,选定个案的百分比与指定百分比就越接近。

„ 准确. 从指定的个案总数中选择指定数目的个案作为随机样本。如果指定的个案总数 超过数据文件中的个案总数,则样本将按比例包含比请求数目少的个案。

注意:如果使用随机抽样,则分类汇总(SPSS Statistics Server 中的分布式模式提 供)不可用。

输入值提示。可以在查询中嵌入一个提示来创建参数查询。当用户运行查询时,系统将

要求用户输入信息(根据此处指定的信息)。如果要查看同一数据的不同视图,则可能 要进行这一操作。例如,您可能想要运行相同的查询来查看不同财政季度的销售数据。

E 将光标放在任何“表达式”单元格中,然后单击输入值提示来创建提示。

创建参数查询

使用“输入值提示”步骤来创建一个对话框,在每次有人运行查询时请求用户提供信 息。如果要用不同的条件查询相同的数据源,则该功能将很有用。

图片 3-7 值的提示

要建立提示,请输入提示字符串和默认值。每次用户运行查询时,该提示字符串都会显 示。该字符串应指定要输入的信息类型。如果用户不从列表中进行选择,那么该字符串 应给出有关如何设置输入格式的提示。示例如下:输入季度(Q1、Q2、Q3...)

允许用户从列表中选择值。如果选中该复选框,您可以限制用户选择您放在此处的值。

确保使用回车分隔值。

数据类型。在此处选择数据类型(数字字符串日期)。

最后的结果看起来如下所示:

图片 3-8 用户定义提醒

分类汇总数据

如果处于分布式模式中,并已连接到远程服务器(IBM® SPSS® Statistics Server 提 供),那么可以先对数据进行分类汇总,然后再将其读入 IBM® SPSS® Statistics 中。

图片 3-9

数据库向导,汇总数据

还可以在将数据读到 SPSS Statistics 中之后再对其进行分类汇总,但对于大数据源来 说,预先进行分类汇总可以节省时间。

E 要创建分类汇总数据,请选择一个或多个定义如何分组个案的分隔变量。

E 选择一个或多个分类汇总变量。

E 为每个分类汇总变量选择一个分类汇总函数。

E 或者,创建包含每个分类组中的个案数的变量。

注意:如果使用 SPSS Statistics 随机抽样,分类汇总将不可用。

定义变量

变量名和标签。完整的数据库字段(列)名用作变量标签。除非您修改变量名,否则

变量名和标签。完整的数据库字段(列)名用作变量标签。除非您修改变量名,否则

In document IBM SPSS Statistics (Pldal 31-45)