Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

POSSIBILITIES OF SPSS PROGRAM IN DATA PROCESSING MASS TEST

Davydova M.A. 1 Usataya I.E. 1
1 Don State Technical University
In recent times a wide spread in education has received information technology. To obtain quantitative indicators of the quality of preparedness of the subjects you want to process large amounts of data mass testing. For this purpose different software environments, among which a special place is occupied by the SPSS program - a universal system of statistical analysis and data management. The main modules of SPSS: the data editor; viewer; multidimensional pivot tables; high-quality; access to databases; data conversion; help system; command language. With the help of computer software SPSS enables accurate and fast processing of test results. SPSS is an efficient tool for practical work in the field of sociological and pedagogical analysis provides fast and accurate data processing.
monitoring
information technology
final assessment
systematic analysis
the technology of mass testing
training
evaluation
the latent characteristic
the program spss
frequency analysis
education
non-parametric methods
factor analysis
suitability analysis
mass centralized testing
blanks testing
computer testing
teletesting
the unified state exam.

В последнее время широкое распространение в системе образования получили информационные технологии. Они применяются для обучения, контроля, проведения итоговой аттестации выпускников, самообучения, самоконтроля и др. Важнейшим условием повышения качества обучения становится систематический анализ объективных данных независимого контроля учебных достижений, осуществление мониторинга и диагностики подготовленности обучающихся для получения результатов, соответствующих их возможностям и потребностям. Все большее внимание исследователей для решения различных задач образования и самоуправления образовательной деятельностью привлекают возможности технологий массового тестирования [7].

Важную роль в развитии мониторинга результатов обучения должно играть системное и преемственное оценивание, обеспечивающее суждение о готовности студента к продолжению обучения и его участию в общественно-производственной деятельности. Трудность заключается в том, что требуются не только качественное обучение, но и качественное оценивание, качественные оценочные средства и процедуры, а также обеспечение мотивации при выполнении тестов, чтобы проявление латентных характеристик испытуемых было максимальным [3]. Поэтому оценка должна проводиться как специфически целенаправленный и упорядоченный процесс определения набора и достигнутого уровня подготовленности, а результаты выражать количественно, независимо от того, насколько просто или сложно они поддаются оцениванию.

Для получения количественных показателей о качестве подготовленности испытуемых требуется обработка больших объемов данных массового тестирования. Для этого применяются различные программные среды, среди которых особое место занимает программа SPSS Statistics («Statistical Package for the Social Sciences») — это «статистический пакет для социальных наук. Он является  лидером рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных и педагогических науках. SPSS - универсальная система статистического анализа и управления данными. Эта аббревиатура первоначально означала Statistical Package for the Social Science (статистический пакет для социальных наук). Затем исходной аббревиатуре было дано новое толкование: Superior Performance Software System (система программного обеспечения высшей производительности).

В начале 1970-х годов Норман Най (Norman Nie), Дейл Бент (Dale Bent) и Хэдлай Халл (Hadlai Hull) зарегистрировали торговый знак SPSSR statistical software. Компания с одноименным названием была создана ими в 1968 г. В 1975 г. компания была преобразована в корпорацию с главным офисом в Чикаго (Chicago, IL USA). За годы существования корпорацией было разработано множество программных продуктов, в том числе и SPSS/PC+TM, первая версия которого появилась в 1984 г. В 2009 г. пакет стал называться PASW Statistics (Predictive Analytics SoftWare – интеллектуальное аналитическое программное обеспечение). С июля 2009 г. пакет сопровождается фирмой IBM (International Business Machines) под именем IBM SPSS Statisics. В 2013 г. вышла очередная версия пакета - IBM SPSS Statistics 22, работающей под управлением различных операционных систем Windows, MacOsX, Linux.

По всем параметрам SPSS является сложным и мощным статистическим пакетом. С помощью пакета SPSS можно проводить практически любой анализ данных, а последние версии программы находят применение в самых разных научных областях, в том числе в педагогических науках [4]. Сегодня SPSS – это программный продукт и одновременно защищенная торговая марка всемирно известной американской фирмы SPSS Inc., правление которой так и остается в Чикаго. Этот пакет занимает ведущее положение среди программ, предназначенных для статистической обработки информации в социальных и педагогических науках. Вместе со всем программным обеспечением указанного профиля он прошел большой путь эволюции: сначала от первых версий SPSS для больших ЭВМ, до версий, ориентированных на PC-DOS/MS-DOS, а затем до версий, работающих в среде Windows. SPSS представляет дружественный пользовательский интерфейс, который делает процесс ввода и статистического анализа доступным для начинающего и удобным для опытного пользователя. Редактор данных пакета позволяет удобно (табличным способом) вводить и корректировать входные данные. SPSS дает возможность получать множество высококачественных графиков и различных диаграмм. С помощью пакета, используя таблицы, простые меню и диалоговые окна, можно выполнять, во-первых, анализ огромных файлов данных с тысячами переменных, и, во-вторых, делать все это без строчной записи команд в языке программирования. С помощью программы SPSS можно: управлять данными; упорядочивать данные; преобразовывать данные, создавать новые переменные; анализировать данные.

Возможные области применения SPSS: хранение и анализ данных опросов, маркетинговых исследований и продаж, финансовый анализ и др. В социологии и педагогике пакет позволяет автоматизировать процесс создания баз данных разной информации, их хранение и обработку. Этапы аналитического процесса, реализуемого в SPSS: планирование; сбор данных; обеспечение доступа к данным; подготовка данных к анализу; выполнение анализа; формирование отчетов; представление и распространение результатов. В педагогике пакет позволяет автоматизировать обработку и интерпретацию результатов тестирования [6].

Первая версия SPSS для Windows имела порядковый номер 5.0. Затем последовали версии 6.0, 6.1, 7.0, 7.5, 8.0, 9.0 и, наконец, 10.0 и 11.5 и выше.   Начиная с SPSS версии 7.0, оболочкой служит минимум Windows95 (NT).

Наряду с использованием своего собственного типа данных, пакет SPSS, может считывать данные практически из любых типов файлов и использовать их для создания отчетов в форме таблиц, графиков и диаграмм, а также вычислять описательные статистики, производить сложный статистический анализ и моделирование.

Пакет имеет модульную структуру. Модули пакета представляют собой интегрированную совокупность программных продуктов, обеспечивающих комплексное исследование – от планирования до управления данными, выполнения анализа и представления результатов.

Основные модули SPSS:   IBM SPSS Statistics Base, IBM SPSS Decision Trees, IBM SPSS Advanced Statistics, IBM SPSS Direct Marketing, IBM SPSS Bootstrapping, IBM SPSS Exact Tests, IBM SPSS Categories, IBM SPSS Forecasting, IBM SPSS Complex Samples, IBM SPSS Missing Values, IBM SPSS Conjoint, IBM SPSS Neural Networks,IBM SPSS Custom Tables, IBM SPSS Regression, IBM SPSS Data Preparation. Состав модулей зависит от варианта поставки.

Основные блоки SPSS:

Редактор данных - гибкая система, внешне похожая электронную таблицу, для определения, ввода, редактирования и просмотра данных.

Средство просмотра - упрощает просмотр результатов, позволяя показывать и скрывать отдельные элементы вывода, изменять порядок вывода результатов, перемещать готовые к презентации таблицы и диаграммы в другие приложения и получать их из приложений.

Многомерные мобильные таблицы – служат для отображения результатов анализа. Можно исследовать таблицы, перемещая строки, столбцы и слои и, таким образом, выявлять важные моменты, которые могут потеряться в стандартных отчетах. Также можно сравнивать группы, расщепляя таблицы так, чтобы каждый раз выводилась только одна группа.

Высококачественные графика – средство формирования полноцветных диаграмм с высоким разрешением: круговые и линейчатые диаграммы, гистограммы, диаграммы рассеяния, объемные диаграммы и многие другие.

Доступ к базам данных - конструктор чтения баз данных, позволяющий загрузить данные из любого источника с помощью нескольких нажатий кнопки мыши.

Преобразование данных - средство преобразования данных, помогает готовить данные к анализу. Можно с легкостью выделять подмножества в данных, объединять категории, добавлять, агрегировать, сливать, расщеплять и транспонировать файлы, а также проводить другие преобразования.

Справочная система:

- электронный учебник, предлагающий детальный обзор;

- контекстная справка в диалоговых окнах помогает разобраться в конкретных задачах;

- всплывающие определения в мобильных таблицах объясняют статистические термины;

- репетитор по статистике помогает в поиске необходимой процедуры, - примеры анализа помогают в интерпретации результатов.

Командный язык. Несмотря на то, что многие задачи могут быть выполнены при помощи мыши и диалоговых окон, в SPSS также есть мощный командный язык, позволяющий сохранять и автоматизировать многие повторяющиеся задачи. Командный язык также позволяет пользоваться некоторыми функциональными возможностями, недоступными через меню и диалоговые окна. Полная документация по командному языку интегрирована в справочную систему и доступна в виде отдельного документа PDF Руководство по синтаксису, который можно вызвать в меню «Справка» [3].

Структура пакета включает в себя команды определения данных, преобразования данных, команды выбора объектов. В нем реализованы следующие методы статистической обработки информации:

  • суммарные статистики по отдельным переменным;
  • частоты, суммарные статистики и графики для произвольного числа переменных;
  • построение N-мерных таблиц сопряженности и получение мер связи; средние, стандартные отклонения и суммы по группам;
  • дисперсионный анализ и множественные сравнения;
  • корреляционный анализ; дискриминантный анализ; однофакторный дисперсионный анализ;
  • общая линейная модель дисперсионного анализа (GLM);
  • факторный анализ;
  • кластерный анализ;
  • иерархический кластерный анализ;
  • иерархический лог-линейный анализ;
  • многомерный дисперсионный анализ; непараметрические тесты; множественная регрессия;
  • методы оптимального шкалирования и т.д.

Кроме того, пакет позволяет получать разнообразные графики – столбиковые и круговые, ящичковые диаграммы, поля рассеяния и гистограммы и др. [1].

До недавнего времени обучение и контроль качества в сфере образования проводились традиционными методами в основном силами тех, кто проводит образовательный процесс, что с точки зрения теории менеджмента не способствует его повышению. На сегодняшний день обработка данных массового тестирования проводится автоматически с помощью многочисленных компьютерных программ. Одна из таких программ SPSS , она позволяет эффективно, точно и с экономией времени провести количественную обработку результатов массового тестирования по какому-либо предмету.

Частотный анализ позволяет определить: частоту каждого из вариантов ответа на вопрос из теста; процентную частоту ответа к общему количеству респондентов (доля правильных ответов на данный вопрос, взятая в процентах от общего количества ответов); допустимое процентное значение (отсутствующие значения исключаются); накопленные процентные значения (это сумма процентов допустимых значений).

В SPSS имеется большое количество разнообразных процедур, при помощи которых можно произвести анализ связи между двумя переменными. Связь между переменными, относящимися к номинальной шкале или к порядковой шкале с не очень большим количеством категорий, лучше всего представить в форме таблиц сопряженности. Для этой цели в SPSS реализован тест хи-квадрат, по которому проверяется, есть ли значимое различие между наблюдаемыми и ожидаемыми частотами. Кроме того, существует возможность расчета различных мер связанности.

Преимущество непараметрических методов наиболее заметно, когда в данных имеются выбросы (экстремально большие или малые значения). SPSS предоставляет в распоряжение пользователей немалое количество непараметрических тестов.

Наиболее часто применяемыми тестами являются тесты для сравнения двух и более независимых или зависимых выборок. Это U-тест Манна-Уитни, Н-тест Крускала-Уоллиса, тест Уилкоксона и тест Фридмана. Важную роль также играет тест Колмогорова-Смирнова для одной выборки, который может применяться для проверки наличия нормального распределения. Непараметрические тесты могут, конечно, применяться и в случае нормального распределения значений. Но в этом случае они будут иметь лишь 95 % эффективность по сравнению с параметрическими тестами. Если Вы хотите, к примеру, произвести множественное сравнение средних значений двух независимых выборок, причем выборки частично подчиняются нормальному распределению, а частично — нет, то рекомендуется всегда применять U-тест Манна и Уитни.

Факторный анализ это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводит к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой. Таким образом, целью факторного анализа является нахождение таких комплексных факторов, которые как можно более полно объясняют наблюдаемые связи между переменными, имеющимися в наличии.

Факторный анализ возможен, если выполняется ряд критериев. Нельзя факторизовать качественные данные. Переменные должны быть независимыми, а их распределение приближаться к нормальному. Связи между переменными должны быть приблизительно линейны, а в исходной корреляционной матрице несколько корреляций по модулю выше 0,3; выборка испытуемых должна быть достаточно большой.

Анализ пригодности (а также: анализ вопросов или анализ заданий) помогает подбирать вопросы (задания) для тестов. При помощи разнообразных критериев устанавливается, какие задания подходят для определённого теста, а какие нет. 

Для этой цели некоторой совокупности (выборке) респондентов предлагают предварительный вариант теста со всеми предполагаемыми заданиями и проводят анализ этих заданий. При помощи этого анализа исключают неподходящие задания, а оставшиеся включают в итоговую форму теста. Тесты подразделяются в зависимости от вида исследуемого личностного признака, а именно выделяются тест уровня образованности, тест способностей и личностный тест. Тестовое задание состоит преимущественно из двух частей: проблемы или вопроса и варианта решения проблемы или ответа.

С появлением массового централизованного тестирования в нашей стране появились формы независимой аттестации учащихся: бланочное и компьютерное тестирование, телетестинг, единый государственный экзамен. Отличительной особенностью такого контроля уровня подготовки учащихся является процедура, в основе которой лежит педагогический тест как средство измерения, обладающее определенными метрическими свойствами: точностью, надежностью, дифференцирующей способностью, валидностью и др.

Методы современного тестирования в настоящее время уже позволяют на достаточно высоком уровне проводить итоговую аттестацию выпускников на всей территории страны в одно и то же время одними и теми же по уровню трудности педагогическими измерителями или контрольно – измерительными материалами (КИМами), тестами нового поколения, с широким использованием информационных технологий.

 Кроме того, современная техника и программные продукты автоматизированной проверки результатов тестирования значительно повышают объективность и достоверность образовательной статистики, упрощают  работу проверяющим, обеспечивают возможности сравнения и сопоставления средних сертификационных баллов на любой территории и по любой выборке тестируемых, давая возможность анализировать уровень подготовки и причины, обеспечивающие его. С помощью компьютерной программы SPSS возможна точная и быстрая обработка результатов тестирования [2].

Достоверность данных обеспечивается путем подсчета значимых различий по Т-критерию Стьюдента при помощи компьютерной программы «SPSS 17 for Windows».

Вывод. Программа SPSS является эффективным инструментом для практической работы в области социологического и педагогического анализа, обеспечивает быструю и точную обработку данных. Основной особенностью этой программы служит то, что результаты анализа можно наглядно представлять в виде таблиц и диаграмм различных типов, распространять сетевым пользователям, внедрять полученные результаты в другие программные системы.