Тема 9. Корреляционные исследования в
психологии

 

Под корреляцией (от лат. соггеШіо —
“соотношение”) понимают реально установленный факт взаимосвязи определенного
состояния одной переменной с определенными значениями другого, когда изменение одной из них
сопровождается изменением другой. Иначе говоря, корреляция отражает факт
ковариации переменных.

Корреляции переменных х и у можно представить
на так называемой диаграмме рассеивания или кореляційному поле (рис. 4).

 

Рис. 4. Диаграмма рассеяния
(корреляционное поле) результатов измерения переменных х и у

 

Множество точек (результатов измерения х
и в) образует “облако”, по форме которой и судят о связи х и у. Чем большим
есть такая связь, тем более вытянутой будет “тучка”.

Виды корреляций различают,
во-первых, с особенностями сбора данных. При этом выделяют:

• аутохонні корреляции, которые представляют
собой корреляцию результатов измерения одной и той же переменной на одних и тех же
объектах — исследуемых в разное время, что дает возможность установить паттерн реакций
и, следовательно, открывает путь к исследованию структуры личности;

• синхронные корреляции, которые
устанавливают корреляции между различными переменными, которые были измерены одновременно (на
одном и том же этапе исследования);

• перекрестно-отсроченную корреляцию
между двумя переменными, которые измеряются в разный промежуток времени, например, одна —
на первом этапе исследования, вторая — на конечном этапе [5; 9].

Во-вторых, корреляции различают по
типом связи, при этом выделяют:

• линейную корреляцию, в которой
выделяют позитивную, когда повышение уровня одной переменной сопровождается
повышением другой, и отрицательную, когда рост уровня одной переменной
сопровождается уменьшением уровня другого;

• нулевую, когда связь между
переменными отсутствует;

• нелинейную корреляцию, когда
повышение уровня одной переменной сопровождается ростом другой к определенным
значений, а затем сопровождается ее уменьшением (рис. 5).

 

 

Рис. 5. Виды корреляций

(а и б — сильная и слабая положительные,
в — негативная, г — нулевая, д и е — нелинейные корреляции) [4]

 

Примером нелинейной корреляции может
быть известен закон Йеркса — Додсона, согласно которому до определенных показателей
рост мотивации способствует повышению эффективности обучения, а затем эффект супермотивації
снижает данную эффективность [3].

Статистической мерой корреляционной
связи является прежде всего выборочный коэффициент ковариации переменных х и у:

то есть среднее произведение отклонений
каждой переменной.

Следует заметить, что ковариация
переменной с самой собой является дисперсией переменной:

Чаще как статистическую меру связи
между данными используют коэффициент корреляции, который представляет собой отношение
полученной ковариации к максимально возможной:

Значение коэффициента г (который
называют коэффициентом Пирсона) тем больше, чем больше связь между переменными.
При этом значимость этой связи зависит от принятого уровня значимости и
величины выборки. Кроме коэффициента Пирсона, для данных, полученных по шкале
интервалов можно использовать коэффициент ранговой корреляции Спирмена г:

где
n — количество измерений переменных.

Для шкалы порядка с целью измерения
связей между переменными используют коэффициент Кендалла, который основывается на
подсчета разногласий в порядке ранжирования переменных х и у.

Для дихотомічної шкалы, которую иногда
отождествляют со шкалой наименований, используют так называемый
φ-коэффициент.

Например, результаты исследования
групп мужчин и женщин, которые проходили определенное исследование и добились (или не
достигли) успеха, можно представить следующим образом (табл. 15):

 

Таблица 15

Представление результатов
исследования по дихотомічною шкале

 

Группы

Успешные

Неуспешные

Вместе

Мужчины

а

Ь

а+Ь

Женщины

с

d

c+d

Вместе

а+с

Ь+d

a+Ь+c+d

 

Тогда коэффициент ф можно определить по
формуле

Отметим, что если переменная
представлена множеством
n-случаев со средним и М
стандартным отклонением
σ, ее значение можно преобразовать в
другое множество данных со стандартным отклонением, которое равно 1. Тогда новые
значения переменных будут непосредственно выражаться в отклонениях исходных значений
от среднего, измеренных в единицах стандартного отклонения. Это особенно
важно при необходимости сравнения результатов измерения переменных различной
размерности. Для этого “сырые” баллы переводятся в стандартные оценки z по
формуле

В этом случае коэффициент корреляции
будет определяться по
формуле

Следует заметить, что стандартную оценку
для переменной можно получить, если стандартную оценку переменной х умножить на
коэффициент корреляции между х и у:

В результате на диаграмме рассеивания
можно построить так называемую линию предвидения, которая сочетает средние оценки
исследуемой переменной и тем самым позволяет предвидеть ее значение по
оценкам переменной х (рис. 6)

ana»,»sans-serif»‘>Как видно из рис. 6, линия
предсказания проходит через пересечение точек zx = 0, zy = 0, которые являются средними значениями
соответствующих распределений.

Угол наклона линии предсказания
определяется величиной коэффициента корреляции. При этом значению коэффициента
корреляции, равный 0, соответствует горизонтальная линия, а значению
коэффициент корреляции, равный 1, соответствует линия предсказания под углом
наклона 45°.

Следует заметить, что предполагаемая
величина (
zв) ближе к средней распределения, чем
и величина, на основе которой делается предсказание (
zх),
поэтому говорят, что предсказания направляются (регрессируют) к среднему, а линия
предсказания также называется линией регрессии х на у.

 

 

Рис. 6. Линия предсказания значений
переменной у по значениям переменной х

(по Г. Готтсданкером) [3]

 

Чем выше значение коэффициента
корреляции, тем ниже регрессия предсказания. В случае полной корреляции регрессия
до средней отсутствует, тогда, например, если значение zх = 1,5, то и
значение zв = 1,5 и так для каждой пары значений переменных х и у.

Если корреляция между переменными
отсутствует, то линия предсказания будет горизонтальной, и все предполагаемые
значение в этом случае регрессируют к среднему.

Рассмотрена z-шкала является примером
линейного преобразования значений переменной, при которой сохраняется соотношение между
первичными и z-показателями, следовательно, сохраняются все свойства первичного
распределения [1; 3].

Вышеупомянутые соображения касаются
в тех случаях, когда форма распределения переменных х и в подобная. Если необходимо
сравнить данные, представленные делениями разной формы, используют
нелинейные преобразования. А. Анастази отмечает о необходимости для такого рода
вычислений перевести сначала “сырые” значения в процентили, а затем в
нормализованные стандартные показатели [1].

Поиск и анализ указанных статистических
мир связи используется, во-первых, как прием статистического анализа данных,
когда, например, оценивается надежность экспериментальных результатов,
валидность тестовых методик, или когда отсутствие корреляции позволяет отвергнуть
гипотезу о причинно-следственной связи между переменными. Невозможность отклонения
0-гипотезы в последнем случае обусловлена отсутствием ковариации независимого и
зависимой переменных, которая является существенным условием каузального вывода. Следовательно, коэффициент
корреляции как мера

связи,
может выполнять ту же роль, что и меры различий (например,
t-Стьюдента, дисперсионный анализ
и тому подобное).

Во-вторых, оценка статистической меры
связи является необходимой составляющей корреляционного исследования как средства эмпирической
проверки психологических гипотез о природных связях между переменными, уровни которых
активно не меняются, а только измеряются исследователем.

Итак, корреляционным исследованием, как
правило, называют наблюдаемое пассивно исследования, которое имеет целью
выявление статистической взаимосвязи между переменными и психологический прогноз на
основе определенных інтеркореляцій [9].

Такого рода исследования широко
используются в случае усложнения предмета, когда организация активных
экспериментальных действий невозможна, затруднена или нежелательна, поскольку процессы,
исследуются, могут потерять качественную специфику, если их искусственно изолировать.
Например, достаточно трудно, а из этических соображений и невозможно, исследовать каузальні
связи между разводом родителей и развитием определенных личностных характеристик
детей или, скажем, между
порядком рождаемости и интеллектом. Здесь
возможно установить только статистические связи.

Кроме того, корреляционное исследование,
в отличие от эксперимента, позволяет в большинстве случаев быстро провести
исследования, сэкономить деньги и время.

Следует заметить, что в случае
установления значимой связи между переменными остается возможной большая
количество объяснений (или теоретических гипотез) относительно характера и природы
такой связи.

В частности, зависимость, возможно, есть
каузальною, но направление связи может быть любым, при этом без
экспериментального контроля невозможно отдать предпочтение ни одному из них.

Так, например, исследования
взаимосвязи агрессивности и
просмотра телевизионных передач не дают
окончательного ответа относительно того, агрессивность побуждает к просмотру
телевизионных передач определенной направленности, или, наоборот, такие передачи
порождают агрессивное поведение [7].

Может оказаться, что переменные не будут
связанные каузальным связью, но входят в комплекс взаимодействия, что другие
каузальні зависимости порождают корреляцию между ними. Например, высокий уровень
развития интеллекта может порождать корреляции между успешностью обучения по
математики и истории и является в этом случае скрытой переменной.

В связи с этим целесообразно осуществить
проверку альтернативных объяснений относительно влияния “третьего скрытого фактора”
путем статистического изъятия “подозреваемых” факторов влияния.

Например, Л. Ірон и Г. Х’юсманн
обнаружили, что интенсивность просмотра фильмов со сценами насилия у 875
восьмилетних детей коррелировала с агрессивностью даже после статистического
изъятие наиболее очевидных третьих факторов (численности семьи, статуса,
образования родителей и тому подобное). Более того, когда они вновь исследовали этих самых детей в
19-летнем возрасте, оказалось, что просмотр жестоких боевиков в умеренной степени
определяет агрессивность в 19 лет, но агрессивность в 8 лет не определяет
увлечение жестокими боевиками в 19 лет. Это может означать, что не агрессивная
склонность обусловливает стремление смотреть “крутые” фильмы, а скорее всего, “крутые”
фильмы способны спровоцировать человека на насилие, задавая определенные модели поведения
[7].

Иногда корреляция может быть обусловлена
неоднородностью выборки. Например, когда в выборку были отобраны мужчины —
математике, а женщины — журналисты, можно установить корреляцию между полом и
екстравертованістю.

Может также случиться, что корреляция
между переменными обусловлена случаем и не имеет за собой опосредованного влияния
скрытых переменных или других причин.

Итак, в исследовании кореляційному
из-за отсутствия запланированного влияния на зависимую переменную используются те
характеристики, которые уже существуют, и это не дает возможности, как правило, установить
причинно-следственные зависимости между переменными.

В то же время в отдельных случаях и в
корреляционных исследованиях является возможным приблизиться к пониманию отношений между
переменными как причинно-следственных подобно тому, как гіпотетико-дедуктивный метод
рассуждений является характерным для собственно экспериментальных исследований и заключается в
выведении из системы теоретических положений таких следствий-гипотез, которые могут
быть проверены эмпирически с использованием
процедур экспериментального контроля.
Речь идет о возможности сравнения эмпирически выявленных корреляций с теми, что
теоретически допускают в формальных каузальных моделях связей между переменными,
как, например, в психогенетиці.

Планы корреляционных исследований часто
рассматривают как формы контроля при получении эмпирических данных, то есть как аналог
форм экспериментального контроля. Такие планы содержат:

• план измерения основных переменных;

• формы контроля диапазона их
проявлений;

• формы контроля побочных переменных,
которые обусловливают смешивание переменных.

Контроль побочных переменных в
кореляційному исследовании осуществляется через составление однородных групп, которые
выровненные по всем
параметрам, кроме одного, что интересует
исследователя.

Например, в известном исследовании
влияния порядка рождаемости на интеллект отличия, скажем, между 2 и 5
ребенком сравнивались в пределах однородных групп — семей, которые имели 5, 6, 7 и
больше детей. Это позволило избежать смешения исследуемых переменных с побочным
переменной — социально-экономическим положением семьи, поскольку семьи с низким
социально-экономическим статусом, имеют, как правило, больше детей и худшие условия
жизни, которые в целом могут негативно сказаться на уровне развития детей. И
действительно, в этом исследовании было показано, что если исследуются группы с разной
количеством детей в семьях, выявляется корреляционная связь между снижением
показателей интеллекта и увеличением численности семьи [3; 6].

Итак, составление однородных групп
представляет собой форму контроля в виде стабилизации всех уровней побочной переменной
таким образом, чтобы на каждом уровне независимой переменной они были представлены
равномерно. При этом количество однородных подгрупп равно количеству уровней
побочных переменных.

Например, в указанном исследовании
была выделена подгруппа с семьей из пяти детей и уже в середине этой группы
изучалось влияние
порядка рождения на интеллект [3].

Контроль побочных переменных с
небольшим количеством исследуемых может также осуществляться путем подбора пар
исследуемых, которые выровнены по побочной переменной, когда каждому индивиду одной
группы подбирается индивид второй группы с такими же побочными
характеристиками. При этом возникает угроза
нерепрезентативності выборки, поскольку чем больше побочных переменных, тем меньше
можно подобрать исследуемых с их равными значениями.

В целом контроль в корреляционных
исследованиях является статистическим, что означает, во-первых, более-менее полный охват в
выборке всех уровней случайных вариаций побочных переменных, во-вторых, рассмотрение
эмпирически полученного коэффициента корреляции между переменными как мера оценки
0-гипотезы (об отсутствии связи между двумя или более показателями выборки).

В то же время в отличие от
квазіекспериментальних схем “где и на ком проводить исследования”, в которых
устанавливается причинно-следственная связь между переменными на основе контроля
post factum (см. тему 8), в корреляционных исследованиях такой
контроль, как правило, отсутствует [5].

 

Список использованной и
рекомендуемой литературы

 

1. Анастази А., Урбина С. Психологическое
тестирование. — СПб.: Питер, 2001. — С. 65-83, 104-109.

2. Головина Г. М., Крылов В. Ю.,
Савченко Г. Н. Математические методы в современной психологии: статус,
разработка, применение. — М.: ИПРАН, 1995.

3. Готтсданкер Р. Основы психологического
эксперимента: Пер. с англ. — М.: Изд-во МГУ, 1982. — С. 378-424.

4. Дружинин В. Н. Экспериментальная
психология. — СПб.: Питер, 2000. — С. 140-168.

5. Кэмпбелл Д. Модели экспериментов
в социальной психологии и прикладных исследованиях. — СПб.: Соц.-психол. центр,
1996. — 392 с.

6. Корнилова Т. В. Введение в
психологический эксперимент. — 2-е изд. — М.: Изд-во МГУ; Изд-во ЧеРо, 2001. —
С. 198-229.

7. Практикум по общей,
экспериментальной и прикладной психологии /

В. Д. Балин, В. К. Айда, В. К.
Гербачевский и др.; Под общ. ред. А. А. Крылова, С. А. Маничева. — СПб.: Питер,
2000. — С. 5-32.

8. Психологическая диагностика / Под
ред. К. М. Гуревича, Е. М. Борисовой. — М.: Изд-во УРАО, 2001. — С. 232-280.

9. Фресс П. Экспериментальный метод
// Экспериментальная психология / Под ред. П. Фрессена, Же. Пиаже. — М.: Прогресс,
1966. — С. 148-155.

10. Шошин П. Бы. Психологическое
измерение. — М.: Изд-во МГУ, 1989. — Ч. 1. — 56 сек.