Социология: общий курс. Учебное пособие для студентов высших заведений образования Украины

ЧАСТЬ ЧЕТВЕРТАЯ.

 

МЕТОДОЛОГИЯ И МЕТОДЫ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

Раздел 10.

 

СТАТИСТИЧЕСКАЯ ОБРАБОТКА И АНАЛИЗ ЭМПИРИЧЕСКОЙ ИНФОРМАЦИИ

10.3. Обработка и анализ первичной информации

 

Сущность обработки первичной информации заключается в ее обобщении. Результаты обобщения называют социологической информации. Выбор методов обработки и анализа информации зависит от целей и задач исследования, а также от способов измерения показателей, используемых.

Измерение осуществляется с помощью различных шкал, которым соответствуют различные правила математического анализа данных. В социологических исследованиях применяются, как правило, шкалы трех основных типов: номинальная, порядковая (ранговая) и интервальная.

Номинальная шкала является простейшей,она фиксирует (отражает) дихотомическую ответ: "да" или "нет". С помощью порядковой шкалы возможно зафиксировать более определенное состояние, отражающее ранжированный распределение, например, определенного количества профессий. На шкале измерения престижа высокий уровень привлекательности профессий обозначим цифрой 1, низкий уровень привлекательности любым нечетным числом, например, 15. При этом от 0 до 1 идут (по возрастающей) положительные оценки, а от 0 до 15 - отрицательные (также по возрастающей). В результате выявляются профессии, занимающие разные места на шкале измерения. Если же мы точку замерзания, скажем, воды примем за нуль, а точку кипения (пар) - за 100 и расстояние между этими точками разделим на 10 равных интервалов, то получим интервальную шкалу.


Шкала престижа профессий

 

Номинальной шкале в анкете соответствуют вопросы, способствующие выявлению мнений, установок, объективных характеристик респондента (пол, возраст, образование и т. д.). Порядковій шкале (ранговой) соответствует основное число вопросов анкеты или бланка интервью. Варианты ответов в вопросе распределения в строгом порядке убывания или возрастания интенсивности признака. Интервальная шкала более детальная, глубокая. В социологическом исследовании с ее помощью измеряются те характеристики, которые можно выразить числами: возраст, образование, стаж работы и др. По этой шкале возможно вычислению различных величин. Она допускает обстоятельную математическую обработку информации.

Распространенной формой обобщения первичной социологической информации является группировка. На этом этапе выделяются существенные признаки или одна какая-то признак (например, пол, возраст, образование), и респондент зачисляется в ту или иную группу в соответствии с выбранным признаком. Когда суммируются ответы респондентов с учетом, например, пола, то осуществляется простая группировка. В данном случае будет две группы. Если возьмем в качестве признака уровень образования, то будет минимум три, а то и четыре, пять и более групп.

Выбор признака группировки обусловливается задачами и гипотезами социологического исследования. Ошибка в выборе признака группировки ведет к ошибкам при анализе характеристик групп, их сопоставлении и порівнюванні.

Социологическую информацию группируют по:

номинальному признаку (род занятий, национальность и т. д.);

признаками, которые соответствуют ранговым шкалам (например, по уровню активности: высокая, средняя, низкая);

количественному признаку (группы характеризуются числовым значением, они качественно сравнимыми между собой, например группировка по возрастным интервалам: 18 — 20 лет, 21 — 25 лет, 26 — 30 и т. д.).

Если изучение номинальных и ранговых групп ведется с использованием приемов математики, то группы, распределенные по количественному признаку, изучаются с помощью математической статистики.

Группировка респондентов по двум или более признакам (например, по полу, возрасту и образованию) называют перекрестным или комбинированным. В зависимости от исследовательских задач она может быть структурной, типологической, аналитической. Если, например, надо установить возрастной состав респондентов, то применяют структурная группировка по возрастным интервалом. Если же надо выделить из респондентов группы по такому, например, признаку, как "отношение к приватизации", тогда осуществляют типологическая группировка (выделяются соответствующие типы опрошенных). Аналитическая группировка производится по двум и более признакам и служит для выявления их взаимосвязи.

Как правило, респонденты делятся на несколько групп (по полу, возрасту, образованию и т. д.). Каждой группе соответствует определенное определенное число (n1, n2, пЗ,..., пх), которое характеризует количественный состав группы. Социологи называют такой ряд чисел, полученный в результате группирования, рядом распределения. Выделяют вариационный и атрибутивный ряды распределения. Вариационный ряд распределения основывается на количественных признаках явлений и процессов, изучаемых атрибутивный - отражает результаты группировка опрошенных по количественным признакам.

К каким бы статистических и математических методов анализа полученной информации мы не прибегали, решающая роль в интерпретации эмпирических данных принадлежит научной эрудиции исследователя, концепции самого исследования. В логику интерпретации социологических данных обязательно должна входить проверка ранее поставленных гипотез. При пилотажном исследовании гипотеза проверяется соотношением вообразимого утверждение полученной в результате исследования числовой величиной. При описательном и аналитическом исследованиях процедура проверки гипотез значительно усложняется. Здесь средние величины - лишь первые шаги на пути к истине. Надо сделать и второй и третий шаги, чтобы подойти ближе к ней. Для этого из всей опрошенной совокупности надо выделить однородные по социально-демографическим характеристикам подгруппы.

Проверка гипотезы о статистической связи между признаками чаще всего осуществляется по критерию "ХИ - квадрат"; для измерения тесноты связи применяются различные коэффициенты, выбор которых зависит от характера таблиц связывания признаков. Наиболее простыми являются двухмерные таблицы связывание; они широко используются социологами, поскольку являются наглядными и универсальными.

Для изучения линейных парных связей между количественными показателями используют корреляционный анализ. Однако чаще всего корреляция является результатом влияния каких-то более глубоких причин на оба показателя. Когда же связь между переменными носит нелинейный характер (а также для порядковых переменных), применяются коэффициенты ранговой корреляции.

Для описания структуры связей в некоторой системе показателей применяется матрица корреляций - квадратная таблица, в каждой ячейке которой помещают коэффициент корреляции для пары переменных. Для более строгого анализа используют разведывательный факторный или кластерный анализ. Последний применяется также для описания структуры объектов, составляющих выборку.

Для количественных зависимых переменных обычно используется регрессионный (если независимые переменные также являются количественными) или дисперсионный (если предикатори измеренные по номинальным или порядковым шкалам) анализ. В качественных (номинальных и порядковых) зависимых переменных в аналогичных ситуациях применяется дискриминантный или кластерный анализ.

Появление множественного классификационного анализа и метода индикаторных переменных позволила использовать в любых моделях как количественные, так и качественные предикатори. Именно это способствовало широкому распространению регрессионных и регресійноподібних моделей.