Руководство пользователя по
базовой системе Statistics 19
publication does not include any product warranties, and any statements provided in this manual should not be interpreted as such.
When you send information to IBM or SPSS, you grant IBM and SPSS a nonexclusive right to use or distribute the information in any way it believes appropriate without incurring any obligation to you.
© Copyright SPSS Inc. 1989, 2010.
Предисловие
IBM SPSS Statistics
IBM® SPSS® Statisticsэто универсальная система для анализа данных. SPSS Statistics может считывать данные практически любого типа и использовать их для создания табличных отчетов,диаграмм,графиков распределений и трендов,вычисления итожащих показателей,проведения статистического анализа и построения моделей.
В этом руководстве,Руководство пользователя по базовой системеStatistics 19,описан графический интерфейсSPSS Statistics..Примеры использования аналитических процедур, доступных в дополнительных модулях,можно найти в Справочной системе,установленной вместе с программным обеспечением.
Помимо меню и диалоговых окон вSPSS Statisticsиспользуется командный язык- синтаксис. Некоторые возможности системы доступны только средствами командного синтаксиса. (Эти возможности недоступны в Студенческой версииIBM SPSS Statistics.) Подробная информация о синтаксисе содержится в справочной системе,а также в отдельном документеРуководство по синтаксису,вызываемому в меню Справка.
IBM SPSS Statistics Дополнительные модули
Для расширения функциональных возможностей базовой системыIBM® SPSS® Statistics доступны следующие дополнительные модули:
Статистическая базапредоставляет широкий диапазон статистических процедур для базового анализа и создания отчетов,включая частоты,сопряженности и описательные таблицы,кубыOLAPи отчеты шифровальных книг. Также этот модуль предоставляет широкий диапазон уменьшения размера,методы классификации и сегментации,например факторный анализ,кластерный анализ,анализ методом ближайшего соседа и анализ дискриминантной функции.Кроме этого, SPSS StatisticsБаза предлагает широкий диапазон алгоритмов сравнения средних величин и методы прогноза,напримерt-статистику,
дисперсионный анализ,линейную и порядковую регрессию.
ВAdvanced Statisticsсодержатся методы, часто используемые в сложных
экспериментальных и биомедицинских исследованиях. Он включает процедуры общей линейной модели(ОЛМ),смешанных линейных моделей,анализа компонент дисперсии, логлинейного анализа,порядковой регрессии,страховых таблиц,анализа выживаемости Каплана-Мейера,а также базовую и расширенную регрессию Кокса.
Бутстреппингявляется методом наследования мощных измерений стандартных ошибок и доверительных интервалов для измерений,таких как среднее,медиана,пропорция, кумулятивное отношение,коэффициенты корреляции и регрессии.
Categories-процедуры оптимального шкалирования,включая анализ соответствий.
© Copyright SPSS Inc. 1989, 2010 iii
потребителей. С помощьюConjointможно легко измерять эффект попеременного использования каждого атрибута продукта в контексте набора атрибутов продукта—как это делают потребители,когда принимают решение о покупке.
Custom Tablesпозволяет создавать разнообразные табличные отчеты,готовые для презентаций,включая сложные отчеты и таблицы для переменных с множественными ответами.
Data Preparationпозволяет практически мгновенно получить первое представление о данных. Этот дополнительный модуль также позволяет применять к данным правила проверки для обнаружения недопустимых значений.Вы можете создавать правила,которые выявляют значения,выходящие за пределы диапазона,и пропущенные значения. Имеется возможность сохранять переменные,содержащие информацию о нарушении правил контроля и общее количество нарушений по каждому наблюдению. Предоставляется ограниченный набор предопределенных правил,который можно скопировать или изменить.
Decision Treesпозволяет строить модели деревьев классификации. Такие модели классифицируют наблюдения на группы или предсказывают значения зависимой (целевой)переменной по значениям независимой переменной(предиктора). Для таких моделей также доступны инструменты проверки для разведочного и подтверждающего классификационного анализа.
Прямой маркетингпозволяет сделать маркетинговые программы эффективными в такой степени,насколько это возможно с помощью методов,специально разработанных для прямого маркетинга.
Exact Testsпозволяет вычислять точные уровниpдля статистических критериев в том случае,когда маленький размер или неравномерность выборки может сделать обычные критерии неточными. Этот модулю доступен только в версиях для системWindows.
Forecastingдает возможность анализировать и предсказывать временные ряды,
предоставляя множество моделей аппроксимации кривых,сглаживания,а также методов оценивания авторегрессионных функций.
Missing Valuesдает возможность описывать закономерности в пропущенных данных, оценивать средние значения и другие статистики и производить импутацию пропущенных значений.
Neural Networksможет использоваться при выборе решений в сфере бизнеса при предсказании спроса на продукцию как функции от цены и от других переменных,или при группировке клиентов на основе покупательских привычек и демографических характеристик.Нейронные сети являются средством нелинейного моделирования данных.
Они могут быть полезны при моделировании сложных отношений между входом и выходом или при поиске шаблонов в данных.
ВRegressionреализованы методы анализа данных,не удовлетворяющих предположениям традиционных линейных статистических моделей. Он содержит процедуры для
пробит-анализа,логистической регрессии,взвешенного оценивания,двухэтапной регрессии методом наименьших квадратов,общей нелинейной регрессии.
iv
восприятия и других поведенческих факторов.
Об SPSS Inc., компании IBM
SPSS Inc.,компанияIBM -ведущий мировой поставщик программного обеспечения и решений в области прогностической аналитики. Полный набор продуктов для прогностической аналитики— data mining,статистический анализ,моделирование и внедрение—позволяет узнать мнения людей,предсказывать результаты взаимодействия с клиентами и предпринимать практические шаги,встраивая аналитику в бизнес-процессы.
РешенияSPSS Inc. позволяют достигать целей,стоящих перед организациями,за счет интеграции аналитики,информационно-технологической архитектуры и бизнес-процессов.
Коммерческие организации,органы государственного управления,а также академические организации всего мира используют технологиюSPSS Inc. для достижения конкурентных преимуществ путем эффективного привлечения и удержания клиентов,повышения отдачи от клиентов,снижения ущерба от мошенничеств и управления рисками. SPSS Inc.
был купленIBMв октябре2009. Для получения дополнительной информации посетите http://www.spss.com.
Техническая поддержка
Техническая поддержка предоставляется клиентам,оплачивающим обновительные взносы. Пользователи могут обращаться в службу технической поддержки,если у них возникают какие-либо проблемы с использованием или установкой программного обеспеченияSPSS Inc.. Для получения технической поддержки посетите веб-сайт SPSS Inc.http://support.spss.comили найдите местный офис при помощи веб-сайта http://support.spss.com/default.asp?refpage=contactus.asp. Пожалуйста,при обращении за поддержкой будьте готовы назвать себя и организацию,в которой Вы работаете.
Обслуживание клиентов
Если у Вас есть вопросы по поводу покупки или расчетов,обратитесь в Ваш местный офис, координаты которого можно найти на сайтеhttp://www.spss.com/worldwide. Пожалуйста, будьте готовы назвать Ваш серийный номер.
Учебные курсы
КомпанияSPSS Inc. регулярно проводит курсы,обучающие пользованию программным обеспечением,а также методам анализа данных. Все курсы проводятся в специально оборудованных компьютерных классах и включают в себя практические занятия. Курсы проводятся в крупных городах на постоянной основе. Для получения дополнительных сведений о курсах обратитесь в Ваш местный офис,координаты которого можно найти на сайтеhttp://www.spss.com/worldwide.
v
Companion,иSPSS Statistics: Advanced Statistical Procedures Companion,написанные Марией Норусис(Marija Noruš)is)и опубликованныеPrentice Hall,доступны в качестве рекомендуемых сопроводительных материалов.В этих публикациях подробно описываются статистические процедурыSPSS Statistics Base, Advanced StatisticsиRegression. Вне зависимости от того,насколько хорошо Вы разбираетесь в анализе данных,эти книги помогут Вам эффективно использовать возможности программного обеспеченияIBM®
SPSS® Statistics. Дополнительную информацию о перечисленных выше публикациях Вы можете найти на веб-сайте автора: http://www.norusis.com
vi
Содержание
1 Обзор 1
Новые возможности в версии 19. . . 1
Windows . . . 2
Отличие окна назначения от активного окна . . . 4
Строка состояния . . . 4
Диалоговые окна. . . 5
Имена и метки переменных в списках диалоговых окон . . . 5
Изменение размеров диалоговых окон . . . 5
Управляющие элементы диалоговых окон. . . 6
Выбор переменных . . . 6
Значки типа данных, уровня измерения и списка переменных. . . 7
Получение информации о переменных в диалоговых окнах . . . 7
Основные шаги в анализе данных . . . 8
Репетитор по статистике . . . 8
Получение дополнительной информации . . . 9
2 Получение справки 10
Получение Справки по терминам в выводе . . . 113 Файлы данных 12
Открытие файлов данных . . . 12Как открывать файлы данных . . . 12
Типы файлов данных. . . 13
Параметры открытия файлов . . . 14
Чтение файлов Excel 95 и более поздних версий . . . 14
Чтение файлов Excel старых версий и других электронных таблиц . . . 14
Чтение файлов dBASE. . . 15
Чтение файлов Stata . . . 15
Чтение файлов баз данных . . . 16
Конструктор импорта текстовых файлов SPSS . . . 32
Чтение IBM SPSS Data Collection данных. . . 42
vii
Сохранение файлов данных во внешних форматах . . . 46
Сохранение файлов данных в формате Excel . . . 48
Сохранение файлов данных в формате SAS . . . 49
Сохранение файлов данных в формате Stata. . . 50
Сохранение наборов переменных . . . 51
Экспорт в базу данных . . . 52
Экспорт в IBM SPSS Data Collection. . . 65
Защита исходных данных . . . 66
Виртуальный активный файл . . . 67
Кэширование данных. . . 68
4 Режим распределенного анализа 70
Подключение к серверу . . . 70Добавление и редактирование установок подключения к серверу . . . 71
Как выбрать, переключить, или добавить серверы . . . 72
Поиск доступных серверов . . . 73
Как сохранить файл данных в распределенном режиме анализа. . . 74
Доступ к файлам в режиме локального и распределенного анализа . . . 74
Процедуры анализа, доступные в распределенном режиме анализа данных . . . . 76
Сравнение абсолютных и относительных путей . . . 76
5 Редактор данных 78
Закладка Данные . . . 78Закладка Переменные. . . 79
Как просмотреть или изменить свойства переменных . . . 80
Имена переменных . . . 81
Шкала измерения переменной . . . 82
Тип переменной . . . 83
Метки переменных . . . 85
Метки значений . . . 86
Вставка разрывов строк в метках . . . 86
Пропущенные значения . . . 87
Роли. . . 88
Ширина столбца . . . 88
viii
Настраиваемые свойства переменной. . . 90
Настройка закладки Переменные . . . 94
Проверка правописания . . . 95
Ввод данных. . . 95
Как вводить числовые данные . . . 96
Как вводить нечисловые данные. . . 96
Как использовать заданные метки значений для ввода данных . . . 96
Ограничения на значения данных в Редакторе данных . . . 97
Редактирование данных . . . 97
Замена или изменение значений данных . . . 97
Удаление, копирование и вставка значений . . . 97
Вставка новых наблюдений . . . 98
Вставка новых переменных . . . 99
Как изменить тип данных . . . 99
Поиск наблюдений, переменных или импутированных значений . . . 100
Поиск и замена значений данных и свойств. . . 102
Состояние отбора наблюдений в Редакторе данных . . . 102
Настройки Редактора данных. . . 103
Печать из Редактора данных . . . 104
Печать содержимого Редактора данных . . . 104
6 Работа с несколькими наборами данных 105
Основные операции с несколькими наборами данных . . . 106Работа с несколькими наборами данных в командном синтаксисе. . . 107
Копирование и вставка информации из одних наборов данных в другие . . . 108
Переименование наборов данных . . . 108
Скрытие нескольких наборов данных . . . 109
7 Подготовка данных 110
Свойства переменных . . . 110Задание свойств переменных . . . 111
Как задать свойства переменных . . . 111
Задание меток значений и других свойств переменных. . . 113
Задание шкалы измерения . . . 115
ix
Наборы множественных ответов . . . 120
Задание наборов множественных ответов . . . 120
Копирование свойств данных . . . 123
Как копировать свойства данных. . . 124
Выбор исходных переменных и переменных назначения . . . 125
Выбор копируемых свойств переменных . . . 126
Копирование свойств наборов (файлов) данных. . . 128
Результаты . . . 131
Поиск дублирующихся наблюдений . . . 131
Визуальная категоризация. . . 135
Чтобы категоризовать переменные . . . 136
Категоризация переменных . . . 136
Автоматическое формирование категорий интервалов . . . 139
Копирование категорий интервалов . . . 142
Пользовательские пропущенные значения в процедуре Визуальная категоризация . . . 143
8 Преобразование данных 144
Вычисление переменных . . . 144Вычислить переменную: Отбор наблюдений . . . 146
Вычислить переменную: Тип и метка . . . 147
Функции . . . 147
Пропущенные значения в аргументах функций . . . 148
Генераторы случайных чисел. . . 148
Подсчитать встречаемость значений в наблюдениях . . . 149
Подсчет встречаемости значений в наблюдениях: Подсчитываемые значения. . . 150
Подсчет встречаемости значений: Отбор наблюдений . . . 151
Сдвинуть значения . . . 151
Перекодирование значений . . . 153
Перекодировать в те же переменные . . . 153
Перекодирование в те же переменные: Старые и новые значения. . . 154
Перекодировать в другие переменные . . . 155
Перекодирование в другие переменные: Старые и новые значения. . . 156
Автоматическая перекодировка . . . 158
x
Ранжирование наблюдений: Совпадающие наблюдения . . . 163
Конструктор дат и времени . . . 164
Даты и время в IBM SPSS Statistics . . . 166
Формирование переменной даты/времени из текстовой переменной . . . 167
Создание переменной даты/времени из набора переменных. . . 168
Выполнить сложение и вычитание для переменных дат/времени. . . 170
Выделение части переменной даты/времени . . . 177
Преобразования временных рядов . . . 179
Задать даты . . . 180
Создать временной ряд . . . 181
Заменить пропущенные значения . . . 184
9 Работа с файлами 186
Сортировка наблюдений . . . 186Сортировать переменные . . . 187
Транспонировать . . . 189
Слияние данных . . . 189
Добавление наблюдений . . . 190
Добавление наблюдений: Переименование переменных . . . 192
Добавление наблюдений: Информация из словаря данных. . . 193
Слияние данных из более чем двух источников . . . 193
Добавление переменных . . . 193
Добавление переменных: Переименование переменных . . . 195
Слияние данных из более чем двух источников . . . 195
Агрегирование данных . . . 196
Агрегирование данных: Агрегирующая функция. . . 199
Агрегирование данных: Имя и метка переменной. . . 200
Расщепить файл. . . 200
Отобрать наблюдения . . . 201
Отбор наблюдений: Если . . . 203
Отбор наблюдений: Случайная подвыборка . . . 204
Отбор наблюдений: Диапазон . . . 205
Взвесить наблюдения . . . 206
Реструктуризация данных . . . 207
Как реструктурировать данные . . . 207
Конструктор реструктуризации данных: Выберите тип . . . 208
xi
Конструктор реструктуризации данных (переменные в наблюдения): Создать
индексные переменные . . . 214
Конструктор реструктуризации данных (переменные в наблюдения): Создать одну индексную переменную . . . 217
Конструктор реструктуризации данных (переменные в наблюдения): Создание нескольких индексных переменных . . . 218
Конструктор реструктуризации данных (переменные в наблюдения): Параметры . . . 219
Конструктор реструктуризации данных (наблюдения в переменные): Выбрать переменные . . . 220
Конструктор реструктуризации данных (наблюдения в переменные): Сортировка данных . . . 221
Конструктор реструктуризации данных (наблюдения в переменные): Параметры . . . 222
Конструктор реструктуризации данных: Готово . . . 224
10 Работа с выводом результатов 226
Система просмотра. . . 226Показ и скрытие результатов . . . 227
Перемещение, копирование и удаление результатов . . . 227
Изменение исходного выравнивания. . . 228
Изменение выравнивания элементов вывода . . . 228
Схемы . . . 228
Добавление элементов во Viewer . . . 230
Поиск и замена информации во Viewer . . . 231
Копирование вывода в другие приложения . . . 232
Копирование и вставка объектов вывода в другие приложения . . . 233
Экспортировать вывод . . . 233
Параметры HTML . . . 235
Параметры Word/RTF . . . 236
Параметры Excel . . . 237
Параметры экспорта в PowerPoint. . . 239
Параметры PDF . . . 240
Параметры текста . . . 242
Параметры только для графики . . . 243
Параметры графических форматов. . . 244
Печать документов Viewer . . . 245
Печать вывода и диаграмм . . . 245
xii
Атрибуты страницы: Параметры. . . 248
Сохранение результатов . . . 249
Сохранение документа Viewer . . . 249
11 Мобильные таблицы 251
Управление мобильной таблицей . . . 251Активация мобильной таблицы . . . 251
Трансформация таблицы . . . 252
Изменение порядка отображения элементов внутри размерности . . . 252
Перемещение строк и столбцов в пределах одной размерности . . . 252
Транспонирование строк и столбцов . . . 253
Группирование строк или столбцов . . . 253
Разгруппирование строк или столбцов . . . 253
Поворот меток строк или столбцов . . . 254
Работа со слоями . . . 254
Создание и показ слоев . . . 254
Перейти к категории слоя. . . 256
Отображение и скрытие объектов. . . 257
Скрытые строк и столбцов в таблице. . . 257
Отображение скрытых строк и столбцов в таблице . . . 257
Скрытие и отображение меток измерений . . . 257
Отображение и скрытие заголовков таблицы . . . 258
Шаблоны таблиц. . . 258
Как применить или сохранить шаблон таблиц . . . 258
Как отредактировать или создать шаблон таблиц. . . 259
Свойства таблицы. . . 259
Как изменить свойства мобильной таблицы . . . 260
Свойства таблицы: общие . . . 260
Свойства таблицы: сноски . . . 263
Свойства таблицы: формат ячеек . . . 264
Свойства таблицы: границы . . . 267
Свойства таблицы: печать . . . 267
Свойства ячейки . . . 269
Шрифт и фон . . . 269
Формат значения. . . 270
Выравнивание и поля . . . 270
Сноски и заголовки . . . 271
Добавление сносок и заголовков. . . 271
xiii
Изменение нумерации сносок . . . 273
Ширина ячеек данных . . . 273
Изменение ширины столбца . . . 273
Отображение скрытых границ в мобильной таблице . . . 273
Выбор строк и столбцов в мобильной таблице. . . 274
Печать мобильных таблиц . . . 275
Управление разбивкой таблицы для широких и длинных таблиц . . . 275
Создание диаграммы из мобильной таблицы . . . 276
Облегченные таблицы. . . 276
12 Модели 277
Взаимодействие с моделью . . . 277Работа со Средством просмотра моделей . . . 277
Печать моделей . . . 279
Экспорт модели . . . 279
Сохранение полей, использованных в модели в новом наборе данных . . . 280
Сохранение предикторов в новом наборе данных на основе их важности . . . 280
Модели для ансамблей . . . 281
Сводка по модели . . . 284
Важность предикторов . . . 285
Частота предикторов . . . 286
Точность моделей компонентов . . . 287
Подробности о моделях компонентов . . . 289
Автоматическая подготовка данных . . . 290
Средство просмотра расщепленных моделей . . . 290
13 Работа с командным синтаксисом 292
Правила синтаксиса . . . 292Вставка команд из диалоговых окон . . . 294
Вставка команд из диалоговых окон . . . 294
Копирование синтаксиса из журнала во Viewer . . . 295
Как скопировать синтаксис из журнала в выводе . . . 296
xiv
Терминология . . . 300
Автозавершение . . . 300
Цветовое кодирование. . . 301
Контрольные точки . . . 302
Закладки. . . 303
Закомментирование или раскомментирование текста . . . 304
Форматирование синтаксиса . . . 305
Выполнение командного синтаксиса . . . 306
Файлы синтаксиса Юникод. . . 307
Несколько команд Execute . . . 307
14 Обзор графических возможностей 309
Создание и редактирование диаграммы . . . 309Построение диаграмм . . . 309
Редактирование диаграмм . . . 313
Параметры построения диаграмм. . . 316
Добавление и изменение заголовков и сносок . . . 316
Задание общих параметров . . . 317
15 Скоринг данных с использованием прогнозных моделей 321
Конструктор скоринга . . . 322Сопоставление полей модели и полей набора данных . . . 324
Выбор функций скоринга . . . 326
Скоринг активного набора данных. . . 328
Объединение XML-файлов модели и преобразований . . . 329
16 Cервис 331
Информация о переменной . . . 331Комментарии к файлу данных . . . 332
Наборы переменных . . . 332
Задание наборов переменных . . . 333 Использование наборов переменных для отображения и скрытия переменных . 334
xv
Установка пакетов расширений . . . 337
Обзор установленных пакетов расширений . . . 341
17 Параметры 343
Общие параметры . . . 344Параметры Viewer. . . 347
Параметры данных . . . 348
Изменение стандартного представления переменных . . . 351
Параметры валют . . . 351
Как создать пользовательский формат валюты . . . 352
Параметры в закладке Метки в выводе . . . 352
Параметры диаграмм . . . 354
Цвета элементов данных . . . 355
Линии элементов данных . . . 355
Маркеры элементов данных . . . 356
Заливка элементов данных . . . 357
Параметры мобильных таблиц . . . 357
Параметры местоположения файлов . . . 360
Параметры скриптов . . . 362
Параметры Редактора синтаксиса . . . 365
Параметры множественной импутации . . . 367
18 Настройка меню и панелей инструментов 369
Редактор меню . . . 369Настройка панелей инструментов. . . 370
Отображение панелей инструментов . . . 370
Как настраивать панели инструментов . . . 371
Свойства панели инструментов . . . 372
Изменить панель инструментов . . . 372
Создание нового инструмента . . . 373
xvi
управление ими 375
Структура Конструктора настраиваемого диалогового окна . . . 376
Создание настраиваемого диалогового окна . . . 376
Свойства диалогового окна . . . 377
Указание местоположения меню для настраиваемого диалогового окна . . . 379
Компоновка управляющих элементов на макете . . . 380
Создание шаблона синтаксиса. . . 381
Предварительный просмотр настраиваемого диалогового окна . . . 384
Управление настраиваемыми диалоговыми окнами . . . 385
Типы управляющих элементов . . . 387
Исходный список . . . 388
Целевой список . . . 389
Фильтрация списков переменных . . . 390
Флажок . . . 391
Поле со списком и элементы управления поля со списком . . . 391
Поле ввода текста . . . 393
Поле ввода чисел . . . 394
Статическое текстовое поле . . . 395
Группа элементов . . . 395
Группа переключателей . . . 396
Группа флажков . . . 398
Обозреватель файлов . . . 399
Кнопка вложенного диалога . . . 400
Настраиваемые диалоговые окна для команд расширения . . . 402
Создание локализованных версий настраиваемых диалоговых окон . . . 403
20 Производственные задания 406
Параметры HTML . . . 409Параметры PowerPoint . . . 409
Параметры PDF . . . 409
Параметры текста. . . 410
Значения в рабочем цикле. . . 410
Запросы к пользователям . . . 412
Запуск производственных заданий из командной строки. . . 412
Преобразование файлов производственного режима. . . 414
xvii
Типы объектов вывода . . . 418
Идентификаторы команд и подтипы таблиц. . . 419
Метки. . . 420
Параметры OMS . . . 421
Журнал . . . 427
Не выводить во Viewer . . . 428
Направление вывода в файлы данных IBM SPSS Statistics . . . 428
Пример: Одна двумерная таблица . . . 429
Пример: Таблицы со слоями . . . 430
Файлы данных, создаваемые из нескольких таблиц . . . 430
Управление элементами столбцов для управления переменными в файле данных . . . 433
Имена переменных в генерируемых с помощью OMS файлах данных . . . 435
Структура таблицы OXML . . . 436
OMS-идентификаторы . . . 440
Копирование идентификаторов OMS из панели схемы Viewer . . . 441
22 Скрипты 443
Автоскрипты . . . 444Создание автоскриптов . . . 445
Связывание существующих скриптов с объектами Viewer . . . 446
Написание скриптов с помощью языка программирования Python . . . 447
Выполнение скриптов Python и программ Python . . . 449
Редактор скриптов для языка программирования Python. . . 450
Написание скриптов в Basic . . . 450
Совместимость с более ранними версиями, чем версия 16.0. . . 451
Объект scriptContext . . . 454
Стартовый скрипт . . . 455
xviii
A Конвертер командного синтаксиса TABLES и
IGRAPH 456
B Notices 459
Указатель 461
xix
Обзор 1
Новые возможности в версии 19
Линейные модели. Линейные модели предсказывают значения непрерывных целевых переменных,основываясь на взаимосвязи между целевой переменной и одним или несколькими предикторами. Линейные модели относительно просты и дают легко
интерпретируемую математическую формулу для скоринга.Свойства этих моделей хорошо понятны,и их обычно можно построить очень быстро,по сравнению с моделями других типов(такими как нейронные сети или деревья решений)на том же наборе данных.Эта процедура доступна в дополнительном модулеStatistics Base.
Обобщенные линейные смешанные моделиОбобщенные линейные смешанные модели обобщают линейные модели таким образом,что: целевая переменная линейно связана с факторами и ковариатами с помощью специальной функции связи;целевая переменная может не быть нормально распределенной;и наблюдения могут быть коррелированными.
Обобщенные линейные смешанные модели включают широкий набор моделей,начиная от простой линейной регрессии и кончая сложными многоуровневыми моделями для не нормально распределенных данных с повторными измерениями. Эта процедура доступна в дополнительном модулеAdvanced Statistics.
Облегченные таблицы. Облегченные таблицы формируются значительно быстрее,чем мобильные таблицы с полным набором функций. Хотя им недостает возможностей редактирования,присущих мобильным таблицам,они легко могут быть преобразованы в мобильные таблицы со всеми функциями редактирования. Дополнительную информацию см.данная тема Параметры мобильных таблиц в Данная глава17на стр. 357.
Конструктор скоринга. Новый конструктор скоринга позволяет легко применять прогнозные модели для скоринга данных,и для скоринга теперь не требуетсяIBM®
SPSS® Statistics Server. Дополнительную информацию см. данная тема Скоринг данных с использованием прогнозных моделей в Данная глава15на стр. 321.
Улучшенный тип измерений по умолчанию. Для данных,считанных из внешних источников,и новых переменных,созданных в течение сеанса работы,усовершенствован метод задания типа измерений по умолчанию,который для принятия решения теперь рассматривает больше условий,чем просто число различных значений. Так как тип измерений влияет на результаты работы многих процедур,назначение правильного типа измерений часто оказывается важным. Дополнительную информацию см. данная тема Параметры данных в Данная глава17на стр. 348.
© Copyright SPSS Inc. 1989, 2010 1
“Умные” выходные результатыПроцедуры в дополнительном модулеDirect Marketing теперь позволяют получать“умные”выходные результаты: простые,нетехнические объяснения,помогающие оценить полученные результаты.
Усовершенствования Редактора синтаксиса. Панель редактора можно разбить на две панели,расположенных одна над другой. Можно задавать отступ для блока синтаксиса или задавать автоматический отступ выделенного на основе формата вставленного синтаксиса.
Новая кнопка на панели инструментов позволяет разкомментировать текст,который был ранее закомментирован,а новый параметр позволяет вставлять синтаксис в то место, где находится курсор. Также появилась возможность перемещаться к следующей или предыдущей ошибке синтаксиса(например,к незакрытой кавычке),что облегчает поиск таких ошибок перед запуском синтаксиса.Дополнительную информацию см.данная тема Работа с Редактором синтаксиса в Данная глава13на стр. 297.
Драйверы доступа к данным для salesforce.com. Драйверы доступа к данным для salesforce.comпозволяют аналитику считывать данные сsalesforce.comточно так же,как и из баз данных. Теперь аналитики могут подключаться кsalesforce.com,считывать нужные данные и анализировать их.
Скомпилированные преобразования. При использовании скомпилированных преобразований, команды преобразований(напримерCOMPUTEилиRECODE)
компилируются в машинный код,что увеличивает производительность для наборов данных с большим количеством наблюдений. Чтобы воспользоваться этой функцией требуется SPSS Statistics Server.
Statistics portal. Statistics portal -это веб-интерфейс для пользователейIBM® SPSS®
Collaboration and Deployment Services,позволяющий им анализировать данные,используя SPSS Statistics. Они выполняют анализ при помощи настроенного пользовательского интерфейса,созданного вSPSS Statistics (в Конструкторе настраиваемых диалоговых окон)и хранящегося вIBM SPSS Collaboration and Deployment Services Repository.
Усовершенствования,относящиеся к авторам настраиваемого пользовательского интерфейсаStatistics portal,включают: поддержка фильтров(включенных для активного набора данных)для последовательно выполняемых процедур анализа;скрытие малых значений в таблицах,созданных при помощиCROSSTABS,OLAP CUBESиCTABLES;а также отображение наборов измерений строк и столбцов в качестве слоев таблиц в таблицах сопряженностиCROSSTABS.
Windows
ВIBM® SPSS® Statisticsесть несколько типов окон:
Редактор данных. В Редакторе данных отображается содержимое файла данных. С помощью Редактора данных Вы можете создавать новые файлы данных или изменять старые. Если у Вас открыто более одного файла данных,то для каждого файла существует отбельное окно Редактора данных.
Viewer.Все статистические результаты,таблицы и диаграммы отображаются воViewer.В можете редактировать вывод и сохранять его для дальнейшего использования.ОкноViewer открывается автоматически,когда выходные результаты создаются первый раз за сеанс.
Редактор мобильных таблиц. Результаты,отображаемые в виде мобильных таблиц,могут быть изменены с помощью Редактора мобильных таблиц. Вы можете редактировать текст, менять местами столбцы и строки,добавлять цвета,создавать многомерные таблицы, выборочно скрывать и показывать результаты.
Редактор диаграмм. Вы можете изменять диаграммы в окнах диаграмм. Вы можете изменить цвета,шрифты,поворачивать оси,вращать трехмерные диаграммы и даже изменять типы диаграмм.
Редактор текстового вывода.Текстовый вывод,отображаемый не в мобильных таблицах, может быть изменен с помощью Редактора текстового вывода. Вы можете редактировать вывод и изменять шрифты(начертание,стиль,цвет,размер).
Редактор синтаксиса. Вы можете вставить выбранные параметры статистических процедуры из диалоговых окон в окно синтаксиса,где они появятся в виде команд. После этого можно отредактировать синтаксис команды,чтобы использовать специальные возможности,которые недоступны через меню. Эти команды можно сохранить в файле для использования в последующих сеансах.
Рисунок 1-1
Редактор данных и Viewer
Отличие окна назначения от активного окна
Если Вы открыли более одного окнаViewer,результаты Вашей работы будут появляться в окненазначенияViewer.Если у Вас открыто более одного окна Редактора синтаксиса, команды так же будут вставляться в окно назначения. Окно назначения можно распознать по знаку плюс в значке в заголовке окна. Вы всегда можете изменить окно назначения.
Не следует путать окно назначения иактивное(выбранное в настоящий момент)окно.
Если на экране имеется несколько перекрывающих друг друга окон,активное всегда находится сверху.Если Вы откроете окно,оно автоматически становится активным окном и окном назначения.
Изменение окна назначения
E Сделайте окно,которое Вы собираетесь сделать окном назначения,активным(щелкните мышью в любом месте окна).
E Щелкните по кнопке“Сделать окном назначения”в панели инструментов(значок со знаком плюс).
либо
E Выберите в меню:
Cервис > Сделать окном назначения
Примечание: Если открыты несколько окон Редактора данных,активное окно Редактора данных определяет набор данных,который используется в последующих расчетах и анализе. Не существует окна“назначения”Редактора данных. Дополнительную информацию см. данная тема Основные операции с несколькими наборами данных в Данная глава6на стр. 106.
Строка состояния
В нижней части каждого окнаIBM® SPSS® Statisticsнаходится строка состояния, предоставляющая следующую информацию:
Статус команды. Для каждой запускаемой процедуры или команды счетчик наблюдений показывает количество обработанных наблюдений.Для статистических процедур,которые требуют итеративного выполнения,указывается количество итераций.
Состояние фильтра. Если Вы выбрали случайную выборку или подмножество
наблюдений,в строке состояния появляется текстФильтр включен,сообщающий о том,что некоторые наблюдения не включаются в анализ.
Состояние взвешивания. ТекстВзвешивание включено сообщает,что используется переменная весов.
Состояние расщепления файла. ТекстРасщепление файласообщает,что файл данных разделен для анализа на группы по значениям одной или более группирующих переменных.
Диалоговые окна
Большинство пунктов меню открывает диалоговые окна.Диалоговые окна используются для выбора переменных и параметров анализа.
У диалоговых окон статистических процедур,как правило,есть два основных элемента:
Список исходных переменных. Список переменных активного набора данных В списке исходных переменных находятся имена переменных только тех типов,которые могут быть использованы в данной процедуре. Использование коротких и длинных текстовых переменных ограничено во многих процедурах.
Список (списки) выбранных переменных. Один или несколько списков переменных, выбранных для анализа,например,списки зависимых и независимых переменных.
Имена и метки переменных в списках диалоговых окон
В списках переменных в диалоговых окнах можно отображать имена или метки
переменных. И можно управлять порядком отображения переменных с исходных списках переменных. Чтобы изменить отображение атрибутов переменных по умолчанию в исходных списках,выберите в меню«Правка»пунктПараметры. Дополнительную информацию см.данная тема Общие параметры в Данная глава17на стр. 344.
Также можно изменить атрибуты отображения списка переменных внутри диалоговых окон.Метод изменения атрибутов отображения зависит от диалогового окна:
Если диалоговое окно обеспечивает элементы управления сортировкой и отображением над списком исходных переменных,используйте эти элементы управления,чтобы изменить атрибуты отображения.
Если диалоговое окно не содержит элементов управления сортировкой над списком исходных переменных,щелкните правой кнопкой мыши на любую переменную в исходном списке и выберите атрибуты отображения из контекстного меню.
Можно отображать имена или метки переменных(имена отображаются для всех
переменных без меток). И можно отсортировать исходный список переменных в порядке файлов,в алфавитном порядке и по уровню измерения. (В диалоговых окнах с элементами управления сортировкой над списком исходных переменных,выбор по умолчаниюНет обеспечивает сортировку списка в порядке их расположения в файле.)
Изменение размеров диалоговых окон
Чтобы изменить размеры диалогового окна,щелкните и перетащите мышью границы или углы окна. Например,если растянуть окно по горизонтали,список переменных также станет шире.
Рисунок 1-2
Диалоговое окно с измененным размером
Управляющие элементы диалоговых окон
Во большинстве диалоговых окон есть пять стандартных кнопок:
OKилиВыполнить. Запускает выполнение процедуры. После того как Вы выберете все переменные и параметры для процедуры,щелкните поOK,чтобы запустить процедуру и закрыть диалоговое окно. Некоторые диалоговые окна снабжены кнопкойВыполнить вместо кнопкиOK.
Вставка.Генерирует команду синтаксиса на основе параметров,выбранных в диалоговом окне,и помещает ее текст в окно Редактора синтаксиса. После этого команду можно изменить и добавить в нее параметры,недоступные в диалоговых окнах.
Сброс.Все заданные в диалоговом окне параметры процедуры изменяются на параметры по умолчанию,списки выбранных переменных очищаются.
Отмена.Все изменения,сделанные в диалоговом окне при последнем обращении к нему, отменяются,а окно закрывается. В рамках одной сессии параметры,выбранные Вами в диалоговых окнах,не будут сбрасываться. Параметры и установки,выбранные Вами в диалоговом окне,будут сохраняться до тех пор,пока Вы не измените их.
Справка.Контекстно-зависимая справка.Эта кнопка открывает стандартное окно Справки, содержащее информацию о диалоговом окне.
Выбор переменных
Чтобы выделить одну переменную,просто щелкните по ней в списке исходных переменных, а затем перетащите ее на целевой список переменных. Для перемещения переменных между списками можно также использовать кнопку со стрелкой. Если список выбранных переменных только один,переменную можно выбрать,дважды щелкнув по ней.
Можно также выбрать сразу несколько переменных:
Чтобы выбрать группу переменных,которые расположены в списке последовательно друг за другом,щелкните мышью по первой,а затем,удерживая клавишу«Shift», щелкните по последней переменной.
Чтобы выбрать группу переменных,которые расположены в списке не последовательно, щелкните мышью по первой переменной,а затем,удерживая клавишу«Ctrl»,щелкните по следующей переменной и т.д. (Macintosh:щелчок с клавишей«Command»).
Значки типа данных, уровня измерения и списка переменных
Значки,которые отображаются рядом с переменными в списках диалоговых окон,дают информацию о типе переменной и уровне измерения.
Тип данных Шкала
измерений Числовой Текстовый Дата Время
Количественная
(непрерывная) (не задается)
Порядковая
Номинальная
Дополнительную информацию об уровнях измерений см. в разделеШкала измерения переменной. на стр. 82.
Дополнительная информацию по числовым и строковым типам данным,а также по типам данным даты и времени содержится в разделеТип переменной на стр. 83.
Получение информации о переменных в диалоговых окнах
Многие диалоговые окна предоставляют возможность получить дополнительную информацию о переменных,находящихся в списках переменных.
E Щелкните правой кнопкой мыши по переменной в списке исходных или выбранных переменных.
E ВыберитеИнформация о переменной
Рисунок 1-3
Информация о переменной
Основные шаги в анализе данных
Анализировать данные при помощиIBM® SPSS® Statisticsсовсем несложно. Все,что необходимо сделать,это:
Загрузить данные в SPSS Statistics. Можно открыть файл,сохраненный ранее вSPSS Statistics,считать файл электронной таблицы,базу данных или текстовый файл или ввести данные непосредственно в Редакторе данных.
Выбрать процедуру. Выбрать в меню процедуру для расчета статистик или создания диаграммы.
Выбрать переменные для анализа. Переменные в файле данных отображаются в диалоговом окне процедуры.
Запустить процедуру и посмотреть результат. Результаты выводятся в окнеViewer.
Репетитор по статистике
Если вы не знакомы сIBM® SPSS® Statisticsи с доступными в нем статистическими процедурами,Репетитор по статистике поможет начать работу,задавая простые вопросы, сформулированные нетехническим языком,и демонстрируя наглядные примеры,которые помогут выбрать статистические процедуры и диаграммы,наилучшим образом подходящие для проводимого анализа данных.
Чтобы запустить Репетитор по статистике,выберите в меню в любом окнеSPSS Statistics:
Справка > Репетитор по статистике
Репетитор по статистике охватывает только некоторые процедуры. Он разработан для помощи в работе с базовыми,наиболее часто используемыми статистическими методами.
Получение дополнительной информации
Более полный обзор основ работы находится в Учебнике.Выберите в любом менюIBM®
SPSS® Statistics:
Справка > Учебник