Слайд 12014 г.
Выполнила:
учитель информатики и Икт
Полюхина И. Ю.
Слайд 2SPSS является самой распространённой программой для обработки статистической информации.
Два студента Норман
Най (Norman Nie) и Дейл Вент (Dale Bent), специализировавшиеся в области политологии в 1965 году пытались отыскать в Стенфордском университете Сан-Франциско компьютерную программу, подходящую для анализа статистической информации.
Слайд 3Вскоре они разочаровались в своих попытках, так как имеющиеся программы оказывались
более или менее непригодными, неудачно построенными или не обеспечивали наглядность представления обработанной информации. К тому же принципы пользования менялись от программы к программе.
Слайд 4Так, не долго думая, они решили разработать собственную программу, со своей
концепцией и единым синтаксисом. В их распоряжении тогда был язык программирования FORTRAN и вычислительная машина типа IBM 7090.
Уже через год была разработана первая версия программы, которая, еще через год, в 1967, могла работать на IBM 360. К этому времени к группе разработчиков присоединился Хэдлай Халл (Hadlai Hull).
IBM 360
Слайд 5Как известно из истории развития информатики, программы тогда представляли собой пакеты
перфокарт. Как раз на это указывает и исходное название программы, которое авторы дали своему продукту: SPSS — это аббревиатура от Statistical Package for the Social Science.
В 1970 году работа над программой была продолжена в Чикагском университете, а Норман Най основал соответствующую фирму — к тому моменту уже было произведено шестьдесят инсталляций. Первое руководство для пользователей описывало одиннадцать различных процедур.
Слайд 6Спустя пять лет SPSS была уже инсталлирована шестьсот раз, причём под
разными операционными системами. С самого начала версиям программы присваивали соответствующие порядковые номера. В 1975 была разработана уже шестая версия (SPSS6). До 1981 последовали версии 7, 8 и 9.
Командный язык (синтаксис) SPSS в то время был ещё не так хорошо развит, как сейчас, и естественно ориентирован на перфокарты. Поэтому так называемые управляющие карты SPSS состояли из идентификационного поля (столбцы 1-15) и из поля параметров (столбцы 16-80).
Слайд 7В 1983 году командный язык SPSS был полностью переработан, синтаксис стал
значительно удобней. Что бы отметить этот факт, программа была переименована в SPSSX, где буква X должна была служить как номером версии в римскими числами, так и сокращением для extended (расширенный).
.
Слайд 8Так как применение перфокарт к этому моменту уже стало историей, то
программа SPSS и информация, подлежащая обработке, сохранялись в отдельных файлах на винчестерах больших ЭВМ, которые тогда использовались повсеместно. Год от года постоянно увеличивалось и количество процедур
Слайд 9С появлением персональных компьютеров была разработана также и PC-версия SPSS, с
1983 года появилась PC-версия SPSS\PC+. рассчитанная на MS-DOS. Позже, с момента основания в 1984 году европейского торгового представительства в Горинхеме в Нидерландах, SPSS стал широко применяться и в Европе. В настоящее время это самое распространённое программное обеспечение для статистического анализа во всём мире.
Слайд 10Для того, чтобы отразить возможность использования программы во всех областях, имеющих
отношение к статистическому анализу, буква X вновь была удалена из названия марки, а исходной аббревиатуре присвоено новое значение: Superior Performance Software System (система программного обеспечения высшей производительности).
Слайд 11Если PC версия SPSS/PC+ была чуть усовершенствованной версией для больших ЭВМ,
то SPSS для операционной системой Windows (SPSS for Windows) стала большим шагом вперёд.
Слайд 12Эта версия SPSS обладает всеми возможностями версии для больших ЭВМ. За
некоторыми немногочисленными исключениями, программой можно пользоваться без особых знаний в области прикладного программирования.Вызов необходимых процедур статистического анализа происходит при помощи стандартной техники, применяемой в Windows, то есть с помощью мыши и соответствующих диалоговых окон.
Слайд 13В сентябре 2012 г. вышла очередная версия пакета - IBM SPSS
Statistics 21, работающая под управлением ОС Windows, MacOsX и Linux.
Но на данном этапе во многих учебных заведениях пользуются версией SPSS 17.0.
Слайд 14Основу программы SPSS составляет SPSS Base (базовый модуль), предоставляющий разнообразные возможности
доступа к данным и управления данными. Он содержит методы анализа, которые применяются чаще всего.
Слайд 15
Традиционно вместе с SPSS Base (базовым модулем) поставляются ещё два модуля:
Advanced Models (продвинутые модели) и Regression Models (регрессионные модели). Эти три модуля охватывают тот спектр методов анализа, который входил в раннюю версию программы для больших ЭВМ.
Слайд 16SPSS Base входит в базовую поставку. Он включает все процедуры ввода,
отбора и корректировки данных, а также большинство предлагаемых в SPSS статистических методов. Наряду с простыми методиками статистического анализа, такими как частотный анализ, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, этот модуль включает t-тесты и большое количество других непараметрических тестов, а также усложненные методы, такие как многомерный линейный регрессионный анализ, дискриминантный анализ, факторный анализ, кластерный анализ, дисперсионный анализ, анализ пригодности (анализ надежности) и многомерное шкалирование.
Слайд 18Данный модуль включает в себя различные методы регрессионного анализа, такие как:
бинарная и мультиномиальная логистическая регрессия, нелинейная регрессия и пробит-анализ.
Слайд 19В этот модуль входят различные методы дисперсионного анализа (многомерный, с учетом
повторных измерений), общая линейная модель, анализ выживания, включая метод Каплана-Майера и регрессию Кокса, логлинейные, а также логитлоглинсйные модели.
Слайд 20Модуль Tables служит для создания презентационных таблиц. Здесь предоставляются более широкие
возможности по сравнению со упрощенными частотными таблицами и таблицами сопряженности, которые строятся в SPSS Base (базовом модуле).
Слайд 21Amos (Analysis of moment structures — анализ моментных структур) включает методы
анализа с помощью линейных структурных уравнений. Целью программы является проверка сложных теоретических связей между различными признаками случайного процесса и их описание при помощи подходящих коэффициентов. Проверка проводится в форме причинного анализа и анализа траектории. При этом пользователь в графическом виде должен задать теоретическую модель, в которую вместе с данными непосредственных наблюдений могут быть включены и так называемые скрытые элементы.
Слайд 22AnswerTree (дерево решений) включает четыре различных метода автоматизированного деления данных на
отдельные группы (сегменты). Деление проводится таким образом, что частотные распределения целевой (зависимой) переменной в различных сегментах значимо различаются. Типичным примером применения данною метода является создание характерных профилей покупателей при исследовании потребительского рынка. AnswerTree является преемницей программы СНАШ (Chi squared interaction Detector — детектор взаимодействий на основе хи-квадрата).
Слайд 23Модуль содержит различные методы для анализа категориальных данных, а именно: анализ
соответствий и три различных метода оптимального шкалирования (анализ однородности, нелинейный анализ главных компонент, нелинейный канонический корреляционный анализ).
Слайд 24Clementine — это программа для data mining (добычи знаний), в которой
пользователю предлагаются многочисленные подходы к построению моделей, к примеру, нейронные сети, деревья решений, различные виды регрессионного анализа. Clementine представляет собой "верстак" аналитика, при помощи которого можно визуализировать процесс моделирования, перепроверять модели, сравнивать их между собой. Для удобства пользования программой имеется вспомогательная среда внедрения результатов.
Слайд 25Совместный анализ применяется при исследовании рынка для изучения потребительских свойств продуктов
на предмет их привлекательности. При этом опрашиваемые респонденты по своему усмотрению должны расположить предлагаемые наборы потребительских свойств продуктов в порядке предпочтения, на основании которого можно затем вывести так называемые детализированные показатели полезности отдельных категорий каждого потребительских свойства.
Слайд 26Программа Data Entry предназначена для быстрого составления вопросников, а также ввода
и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.
Слайд 27Данный модуль служит для вычисления точного значения вероятности ошибки (величины р)
в условиях ограниченности данных при проверке по критерию х2 (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).
Слайд 28 При помощи SamplePower может быть определён оптимальный размер выборки для большинства
методов статистического анализа, реализованных в SPSS.
Слайд 29Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченных зависимых и
независимых переменных.
Слайд 30Данный модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные
значения. Он предоставляет различные варианты замены недостающих значений.
Слайд 31Программа содержит специальную регрессионную модель для регрессионного анализа упорядоченн Модуль Trends
содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.
Слайд 33Данные могут быть введены непосредственно в SPSS или могут быть импортированы
из текстовых файлов, файлов формата EXCEL, ACCESS и т.д. Пусть нашем случае имеется файл данных в формате EXCEL (рис 1.1). Приступим к импорту данных в файл SPSS.
Слайд 34Рис.1.1. Файл исходных данных в формате EXCEL
Слайд 35После запуска программы SPSS и появления на экране пустого файла SPSS,
подобного изображенному на Рис. 1.2, выберите в строке меню Файл-Открыть-Данные и задайте имя EXCEL файла с вашими данными, его тип, после чего нажмите кнопку OPEN (Рис. 1.3).
Слайд 36Рис. 1.2. Окно редактора данных в SPSS.
Слайд 382. В новом диалоговом окне (Рис.1.4) задайте диапазон ячеек (например,
А1:F17). Если в первой строке EXCEL файла находятся имена переменных, то установить флажок Читать имена переменных из первой строки данных. Щелкните на кнопке ОК.
Слайд 403. На экране вы увидите импортированные данные в формате SPSS (Рис.
1.5).
Слайд 41
Рис.1.5. Данные задачи представлены в формате SPSS.