Тема 8. Лекция
Многие психологические черты, свойства, признаки не являются независимыми, а определенным образом взаимосвязаны между собой. Поэтому психологу часто приходится иметь дело с выявлением наличия и характера связи между этими признаками, свойствами, чертами. Это позволяет в известной степени минимизировать число изучаемых признаков, объединяя их в более крупные конгломераты, особенно в тех случаях, когда число таких признаков достаточно велико.
В математическом смысле задача состоит в нахождении связи между двумя рядами переменных (xi и yi), измеренных на одной и той же выборке испытуемых. О наличии связи (корреляции) между этими переменными можно говорить в тех случаях, когда изменение величины х ведет к закономерному изменению величины у, и если характер изменений является предсказуемым.
Представление данных
Данные о связи двух переменных могут быть представлены либо графически (в виде диаграмм рассеивания), либо путем вычисления коэффициентов корреляции по соответствующим формулам.
В графическом изображении каждый испытуемый может быть представлен точкой в координатах у = f (х), причем величины хi и уi соответствуют значениям двух исследуемых признаков. Выборка испытуемых в этих координатах представляет собой «облако рассеивания» точек, которое может иметь различную форму ( рис. 8.1).
При наличии прямой (положительной) связи между переменными облако рассеивания имеет более или менее уплощенную эллиптическую форму, длинная ось которого направлена вправо и вверх. Другими словами, при возрастании значения одной переменной имеется тенденция к увеличению другой переменной.
В случае отрицательной связи между переменными длинная ось облака рассеивания направлена вправо вниз, т. е., увеличение значений одной переменной соответствует закономерному снижению значений другой.
Наконец, если облако рассеивания имеет округлую форму, то можно предположить, что корреляция между переменными отсутствует или, по крайней мере, она весьма незначительна.
В психологии используется несколько различных мер связи (коэффициентов корреляции), выбор которых определяется в первую очередь типом шкалы, который формирует исследуемая переменная величина. Чаще всего коэффициенты корреляции представляют собой величины, стандартизованные таким образом, что они могут принимать значения от –1 (строгая обратная связь) до +1 (строгая прямая связь). Вычисление коэффициента корреляции предполагает также определение его статистической значимости (достоверности) по соответствующим формулам или таблицам. Достоверность коэффициента корреляции может быть определена для определенного уровня значимости (0,95, 0,99 и т. д.).
Коэффициент корреляции Фехнера
Коэффициент корреляции, предложенный во II–й половине XIX века Г. Т. Фехнером, является наиболее простой мерой связи между двумя переменными. Он основан на сопоставлении двух психологических признаков xi и yi, измеренных на одной и той же выборке, по сопоставлению знаков отклонений индивидуальных значений от среднего:
Пример
Пусть xi и yi – два признака, измеренные на одной и той же выборке испытуемых. Для вычисления коэффициента Фехнера необходимо вычислить средние значения для каждого признака, а также для каждого значения переменной – знак отклонения от среднего (табл. 8.1):
Таблица 8.1
| xi | yi | | | Обозначение |
| 16 15 19 12 9 20 18 14 15 17 | 20 17 16 22 18 12 15 18 16 18 | + - + - - + + - - + | + - - + + - - + - + | а a b b b b b b a a |
Среднее | 15,5 | 17,2 |
|
|
|
В таблице: а – совпадения знаков, b – несовпадения знаков; na – число совпадений, nb – число несовпадений (в данном случае na = 4, nb = 6).
Коэффициент корреляции Фехнера вычисляется по формуле:
В рассматриваемом случае:
Вывод
Между исследуемыми переменными существует слабая отрицательная связь.
Необходимо отметить, что коэффициент корреляции Фехнера не является достаточно строгим критерием, поэтому его можно использовать лишь на начальном этапе обработки данных и для формулировки предварительных выводов.
Коэффициент корреляции Пирсона
Исходный принцип коэффициента корреляции Пирсона – использование произведения моментов (отклонений значения переменной от среднего значения):
Если сумма произведений моментов велика и положительна, то х и у связаны прямой зависимостью; если сумма велика и отрицательна, то х и у сильно связаны обратной зависимостью; наконец, в случае отсутствия связи между x и у сумма произведений моментов близка к нулю.
Для того чтобы статистика не зависела от объема выборки, берется не сумма произведений моментов, а среднее значение. Однако деление производится не на объем выборки, а на число степеней свободы n - 1.
Величина
Во многих задачах естественных и технических наук ковариация является вполне удовлетворительной мерой связи. Ее недостатком является то, что диапазон ее значений не фиксирован, т. е. она может варьировать в неопределенных пределах.
Для того чтобы стандартизировать меру связи, необходимо избавить ковариацию от влияния стандартных отклонений. Для этого надо разделить Sxy на sx и sy:
где rxy - коэффициент корреляции, или произведение моментов Пирсона.
Общая формула для вычисления коэффициента корреляции выглядит следующим образом:
Влияние преобразования данных на rxy:
1. Линейные преобразования x и y типа bx + a и dy + c не изменят величину корреляции между x и y.
2. Линейные преобразования x и y при b < 0, d > 0, а также при b > 0 и d < 0 изменяют знак коэффициента корреляции, не меняя его величины.
Достоверность (или, иначе, статистическая значимость) коэффициента корреляции Пирсона может быть определена разными способами:
По таблицам критических значений коэффициентов корреляции Пирсона и Спирмена (см. табл.) Если полученное в расчетах значение rxy превышает критическое (табличное) значение для данной выборки, коэффициент Пирсона считается статистически значимым. Число степеней свободы в данном случае соответствует n – 2, где n – число пар сравниваемых значений (объем выборки).
По таблице XV Приложений, которая озаглавлена «Количество пар значений, необходимое для статистической значимости коэффициента корреляции». В данном случае необходимо ориентироваться на коэффициент корреляции, полученный в вычислениях. Он считается статистически значимым, если объем выборки равен или превышает табличное число пар значений для данного коэффициента.
По коэффициенту Стьюдента, который вычисляется как отношение коэффициента корреляции к его ошибке:
Ошибка коэффициента корреляции вычисляется по следующей формуле:
(8.6)
где mr - ошибка коэффициента корреляции, r - коэффициент корреляции; n - число сравниваемых пар.
Рассмотрим порядок вычислений и определение статистической значимости коэффициента корреляции Пирсона на примере решения следующей задачи.
Условие задачи
22 старшеклассника были протестированы по двум тестам: УСК (уровень субъективного контроля) и МкУ (мотивация к успеху). Получены следующие результаты (табл. 8.2):
Таблица 8.2
№№ | УСК (xi) | МкУ (yi) | №№ | УСК (xi) | МкУ (yi) |
1 2 3 4 5 6 7 8 9 10 11 | 27 24 27 30 25 18 28 31 31 30 18 | 18 19 16 13 17 13 19 19 10 24 13 | 12 13 14 15 16 17 18 19 20 21 22 | 24 27 25 37 35 25 22 26 34 25 31 | 12 15 15 23 24 20 14 21 24 17 17 |
Задание
Проверить гипотезу о том, что для людей с высоким уровнем интернальности (балл УСК) характерен высокий уровень мотивации к успеху.
Решение
1. Используем коэффициент корреляции Пирсона в следующей модификации (см. формулу 8.4):
Для удобства обработки данных на микрокалькуляторе (в случае отсутствия необходимой компьютерной программы) рекомендуется оформление промежуточной рабочей таблицы следующего вида (табл. 8.3):
Таблица 8.3
xi | yi | xi2 | yi2 | xiyi |
x1 x2 x3 . . . xn | y1 y2 y3 . . . yn | x12 x22 x32 . . . xn2 | y12 y22 y32 . . . yn2 | x1y1 x2y2 x3y3 . . . xnyn |
Σxi | Σyi | Σxi2 | Σyi2 | Σxiyi |
2. Проводим вычисления и подставляем значения в формулу:
3. Определяем статистическую значимость коэффициента корреляции Пирсона тремя способами:
1-й способ:
В табл. находим критические значения коэффициента для 1-го и 2-го уровней значимости: rкр. = 0,42; 0,54 (ν = n – 2 = 20).
Делаем вывод о том, rxy > rкр., т. е. корреляция является статистически значимой для обоих уровней.
2-й способ:
Воспользуемся табл., в которой определяем число пар значений (число испытуемых), достаточное для статистической значимости коэффициента корреляции Пирсона, равного 0,58: для 1-го, 2-го и 3-го уровней значимости оно составляет, соответственно, 12, 18 и 28.
Отсюда мы делаем вывод о том, что коэффициент корреляции является значимым для 1-го и 2-го уровня, но «не дотягивает» до 3-го уровня значимости.
3-й способ:
Вычисляем ошибку коэффициента корреляции и коэффициент Стьюдента как отношение коэффициента Пирсона к ошибке:
В табл. X находим стандартные значения коэффициента Стьюдента для 1-го, 2-го и 3-го уровней значимости при числе степеней свободы ν = n – 2 = 20: tкр. = 2,09; 2,85; 3,85.
Общий вывод
Корреляция между показателями тестов УСК и МкУ является статистически значимой для 1-го и 2-го уровней значимости.
Примечание:
При интерпретации коэффициента корреляции Пирсона необходимо учитывать следующие моменты:
1. Коэффициент Пирсона может использоваться для различных шкал (шкала отношений, интервальная или порядковая) за исключением дихотомической шкалы.
2. Корреляционная связь далеко не всегда означает связь причинно-следственную. Другими словами, если мы нашли, предположим, положительную корреляцию между ростом и весом у группы испытуемых, то это вовсе не означает, что рост зависит от веса или наоборот (оба этих признака зависят от третьей (внешней) переменной, каковая в данном случае связана с генетическими конституциональными особенностями человека).
3. rxu » 0 может наблюдаться не только при отсутствии связи между x и y, но и в случае сильной нелинейной связи (рис. 8.2 а). В данном случае отрицательная и положительная корреляции уравновешиваются и в результате создается иллюзия отсутствия связи.
4. rxy может быть достаточно мал, если сильная связь между х и у наблюдается в более узком диапазоне значений, чем исследуемый (рис. 8.2 б).
5. Объединение выборок с различными средними значениями может создавать иллюзию достаточно высокой корреляции (рис. 8.2 в).
Коэффициент ранговой корреляции Спирмена
Коэффициент корреляции Спирмена (rs) используется в тех случаях, когда оба ряда переменных представлены ранговыми (порядковыми) шкалами. Для вычисления коэффициента Спирмена можно пользоваться двумя разными формулами, которые дают, в принципе, один и тот же результат:
1)
2)
Коэффициент корреляции Спирмена, так же как и rxy, может варьировать от –1 до +1. rs = 1 только в том случае, когда ранги обоих признаков в точности совпадают по х и у.
При расчете коэффициента Спирмена вручную (на микрокалькуляторе) рекомендуется использовать рабочую таблицу для промежуточных вычислений, которая имеет следующий вид:
xi | yi | xi – yi | (xi – yi)2 | xiyi |
1 | 2 | 3 | 4 | 5 |
x1 x2 . . . xn | y1 y2 . . . yn | x1 – y1 x2 – y2 . . . xn – yn | (x1 – y1)2 (x2 – y2)2 . . . (xn – yn)2 | x1y1 x2y2 . . . xnyn |
Σxi | Σyi | Σ(xi – yi) | Σ(xi – yi)2 | Σxiyi |
В зависимости от выбора формулы можно использовать столбцы 1 ¸ 4 либо 1, 2, 5.
Если в рядах переменных (или хотя бы в одном из них) имеются связанные (повторяющиеся) ранги, то следует пользоваться формулой (8.7) с соответствующей поправкой на связанные ранги:
В нашем случае:
В табл. находятся критические значения коэффициента для данной выборки: τкр. = 0,45; 0,59. Эмпирически полученное значение сравнивается с табличным.
Вывод
τ = 0,55 > τкр. = 0,45. Корреляция статистически значима для 1-го уровня.
Примечание:
При необходимости (например, при отсутствии таблицы критических значений) статистическая значимость t Кендалла может быть определена по формуле следующего вида:
где S* = P – Q + 1, если P < Q, и S* = P – Q – 1, если P > Q.
Значения z для соответствующего уровня значимости соответствуют мере Пирсона и находятся по соответствующим таблицам (в приложение не включены. Для стандартных уровней значимости zкр = 1,96 (для β1 = 0,95) и 2,58 (для β2 = 0,99). Коэффициент корреляции Кендалла является статистически значимым, если z > zкр
В нашем случае S* = P – Q – 1 = 35 и z = 2,40, т. е. первоначальный вывод подтверждается: корреляция между признаками статистически достоверна для 1-го уровня значимости.
Дихотомический коэффициент корреляции (j)
Коэффициент j используется в качестве меры связи в тех случаях, когда признаки х и у измеряются в дихотомической шкале наименований и могут принимать значения 0 или 1. Рассмотрим способы вычислений коэффициента на пример задачи.
Условие
Проведен социологический опрос, касающийся отношения населения к религии. Было опрошено 250 респондентов (100 мужчин и 150 женщин). По результатам опроса оказалось, что среди мужчин 40 верующих и 60 атеистов, а среди женщин 85 оказались верующими и 65 – атеистами.
Задание
Определить, существует ли связь между полом и отношением к религии. Определить знак и статистическую значимость коэффициента корреляции.
Решение
Введем необходимые обозначения:
- шкала х – пол (1 – мужчины, 0 – женщины);
- шкала у – отношение к религии (1 – верующий, 0 – атеист).
Задачу можно решить двумя различными способами:
1-й способ:
1. Составляем матрицу сопряженности признаков следующего вида:
| Признак х | |||
1 | 0 | Σ | ||
Признак у | 1 | a | b | a + b |
0 | с | d | c + d | |
Σ | a + c | b + d |
|
2. Подставляем в матрицу полученные экспериментальные значения. В данном случае в качестве измеряемого признака служит число испытуемых, принимающее разные значения при сочетании шкал х и у. Так, в клетку а матрицы вносится число испытуемых, имеющих единицу по обеим шкалам, т. е число верующих мужчин; в клетку b – испытуемые, имеющие 0 по шкале х и 1 по шкале у (число верующих женщин) и т. д.
| Признак х | |||
1 | 0 | Σ | ||
Признак у | 1 | 40 | 85 | 125 |
0 | 60 | 65 | 125 | |
Σ | 100 | 150 |
|
3. Используем формулу дихотомического коэффициента корреляции:
4. Проводим вычисления:
Интерпретация знака коэффициента корреляции состоит в том, что если он положителен, то 1 по х коррелирует с 1 по у, 0 по х коррелирует с 0 по у. Отрицательный коэффициент (как в нашем случае) свидетельствует о том, что 1 по х коррелирует с 0 по у, 0 по х коррелирует с 1 по у. Другими словами, женщины являются более верующими, а мужчины – более атеистичными.
По таблице критических значений дихотомического коэффициента корреляции находим, что коэффициент является статистически значимым для 1-го уровня (φкр. = 0,13).
При отсутствии соответствующей таблицы можно воспользоваться следующим соотношением (для 1-го уровня значимости):
В нашем случае: z = 2,58 и χ2 = 6,64, т. е. вывод подтверждается.
Кроме того, в табл. можно определить статистическую значимость χ2 и для более высоких уровней (ν =1).
Вывод
Корреляция между полом и отношением к религии является статистически значимой, что можно констатировать с вероятностью 0,95.
2-й способ:
Обозначим: px – относительная доля испытуемых, имеющих единицу по х, qx = 1 – px – имеющих нуль по х; аналогично: py – доля испытуемых, имеющих единицу по у, qy = 1 – py – имеющих нуль по у; наконец, pxy - доля людей, имеющих единиц по x и по y.
Коэффициент j вычисляется по формуле:
В нашем примере: px = 100:250 = 0,40; qx = 1 – 0,40 = 0,60; py = 120:250 = 0,50; qy = 1 – 0,50 = 0,50; pxy = 40:250 = 0,16. Подставляя значения в формулу, получаем: φ = –0,163. Вывод подтверждается.
Точечный бисериальный коэффициент корреляции (rpb)
Точечный бисериальный коэффициент корреляции используется тогда, когда одна переменная формирует дихотомическую шкалу наименований, другая – шкалу интервалов или шкалу отношений. Порядок вычислений коэффициента рассмотрим на примере следующей задачи.
Условие задачи
В группе испытуемых, протестированных по тесту Айзенка, обнаружено 15 экстравертов, из них 8 с высоким уровнем нейротизма (холерики) и 7 – с низким нейротизмом (сангвиники). Тест Спилбергера обнаружил у тех и других следующий уровень личностной тревожности (УЛТ):
Таблица 8.7
Тип темперамента | Уровень личностной тревожности | |||||||
Холерики | 42 | 44 | 40 | 38 | 43 | 37 | 41 | 42 |
Сангвиники | 34 | 36 | 38 | 40 | 35 | 38 | 39 |
|
Задание
Определить уровень связи и ее статистическую значимость между типом темперамента и уровнем личностной тревожности.
Решение
1. Учитывая, что шкала типов темперамента дихотомическая, а шкала УЛТ – интервальная, используем формулу для вычисления точечно-бисериальный коэффициент корреляции:
где
2. Определяем промежуточные значения:
3. Проводим вычисления:
4. Определяем число степеней свободы: ν = (n1 – 1) + (n0 – 1) = 13.
5. В табл. находим критические значения коэффициента корреляции (специальной таблицы для rpb не существует): rкр. = 0,51 (β1 = 0,95) и 0,64 (β2 = 0,99). rpb > rкр.. В данном случае можно воспользоваться и табл. XV: как можно видеть, для статистической значимости коэффициента, равного 0,67, достаточно 9 испытуемых для 1-го и 13 – для 2-го уровня (в нашем примере n =15).
Вывод
Корреляция между типом темперамента и уровнем личностной тревожности статистически значима для 1-го и 2-го уровней.
Рангово-бисериальный коэффициент корреляции (rrb)
Рангово-бисериальный коэффициент корреляции используется в том случае, когда одна переменная измеряется в дихотомической шкале наименований, другая представлена порядковой шкалой. В качестве примера рассмотрим следующую задачу.
Условие задачи
10 подростков (из них 6 мальчиков и 4 девочки) были проранжированы на предмет внешних проявлений агрессивности по отношению к своим сверстникам. Ранги распределились следующим образом (табл. 8.8):
Таблица 8.8
Пол | Ранг агрессивности | |||||
Мальчики | 1 | 2 | 4 | 6 | 7 | 8 |
Девочки | 3 | 5 | 9 | 10 |
|
|
Задание
Определить, существует ли связь между полом и агрессивностью в группе исследуемых подростков.
Решение
1. Учитывая, что мы имеем дело с дихотомической и ранговой шкалами, используем рангово-бисериальный коэффициент корреляции:
где
2. Проводим вычисления:
ν = (n1 – 1) + (n0 – 1) = 8; rкр. = 0,63 (β1 = 0,95) и 0,77 (β2 = 0,99). rpb > rкр.
Вывод
Корреляция между полом и агрессивностью для данной выборки испытуемых не является статистически значимой.
Выбор меры связи
Для того, чтобы сделать адекватный выбор коэффициента корреляции для решения той или иной задачи, необходимо правильно определить тип шкалы, которым представлена та или иная переменная. Возможные сочетания различных типов шкал и соответствующие им коэффициенты корреляции представлены в табл. 8.9.
Таблица 8.9
Типы сравниваемых шкал |
Коэффициент корреляции | ||
1 | 2 | ||
Дихотомическая | Дихотомическая | Дихотомический (φ) | |
Дихотомическая | Порядковая (ранговая) | Рангово-бисериальный (rrb) | |
Дихотомическая | Интервальная | Точечно-бисериальный (rpb) | |
Ранговая | Ранговая | Коэффициент Пирсона (rxy) Коэффициент Спирмена (rs) Коэффициент Кендалла (τ) | |
Ранговая | Интервальная | Коэффициент Пирсона (rxy) | |
Интервальная | Интервальная | Коэффициент Пирсона (rxy) |
В некоторых случаях (как, правило, для упрощения обработки результатов) используют преобразования одной шкалы в другую. Тем не менее, эти преобразования могут быть сделаны только в одном направлении: интервальная → ранговая → дихотомическая шкала (но не наоборот). Порядок преобразования интервальной шкалы в ранговую был рассмотрен нами ранее (критерий Манна-Уитни, подраздел 7.3). В то же время напомним, что такое преобразование существенно обедняет информацию о поведении переменной и может использоваться лишь в случае необходимости.
Матрицы корреляций
Матрицы корреляций (иначе, корреляционные матрицы) используются в тех случаях, когда нам необходимо определить попарные связи между большим количеством переменных. Так, если мы имеем дело только с двумя переменными x и y, для определения связи между ними достаточно одного коэффициента связи (rxy). При наличии трех переменных (x, y, z) необходимо использовать уже 3 коэффициента: rxy, rxz и ryz. Определение связи между 4 переменными предполагает вычисление 6-и, между 5 переменными – 10-и коэффициентов корреляции и т. д. Корреляционные матрицы служат для упорядочивания и наглядного представления этих значений. Общий вид корреляционной матрицы при использовании 6 измеряемых признаков (обозначим их латинскими буквами от A до F) представлен в табл. 8.10.
Таблица 8.10
Переменные | A | B | C | D | E | F |
A | 1 |
|
|
|
|
|
B |
| 1 |
|
|
|
|
C |
|
| 1 |
|
|
|
D |
|
|
| 1 |
|
|
E |
|
|
|
| 1 |
|
F |
|
|
|
|
| 1 |
Надо ли заполнять всю площадь матрицы? Скорее всего, это необязательно. В данном случае необходимо руководствоваться двумя правилами:
1. rxx = 1. Другими словами, корреляция переменной сама с собой равна единице. Таким образом, главная диагональ матрицы автоматически будет представлена единицами и вычислений не требует.
2. rxy = ryx, т. е. левая нижняя и правая верхняя половины матрицы будут зеркально отражать друг друга (так, rAD = rDA и т. д.). Поэтому заполняется лишь одна (как правило, правая верхняя) половина матрицы.
Руководствуясь этими правилами, легко вычислить общее число коэффициентов корреляции для упорядочения переменных. Рассуждаем следующим образом: для N переменных общая площадь матрицы будет составлять N2; вычитая число значений главной диагонали матрицы N и деля оставшееся значение пополам, получаем (N2 – N)/2 = N(N – 1)/2. Так, если мы имеем 15 переменных, то число возможных связей между ними будет составлять 15·(15 – 1)/2 = 105.
При большом числе переменных также такие упорядоченные матрицы корреляций могут оказаться довольно громоздкими. Для наглядности представления рекомендуется пользоваться «редуцированными» матрицами, т. е. удалять из них все коэффициенты корреляции, не достигающие критического значения. Работа с такими матрицами более удобна и экономична.
- Тема 1. Лекция
- Тема 2. Лекция
- Тема 3. Лекция
- Тема 4. Лекция
- Тема 5. Лекция
- Тема 6. Лекция
- Непараметрический критерий q Розенбаума
- Алгоритм Подсчет критерия q Розенбаума
- Алгоритм Подсчет критерия u Манна-Уитни.
- Критерий Стьюдента
- Алгоритм Расчет критерия φ*
- Алгоритм Подсчет критерия н Крускала-Уоллиса
- Алгоритм Подсчет критерия s Джонкира
- Тема 7. Лекция
- Алгоритм Расчет критерия знаков g
- Алгоритм Подсчет критерия т Вилкоксона
- Критерий χ2r Фридмана
- Алгоритм Подсчет критерия χ2r Фридмана
- Алгоритм Подсчет критерия тенденций l Пейджа
- Тема 8. Лекция
- Тема 9. Лекция