Тема 9. Лекция
Напомним, что корреляционная связь между переменными не всегда означает связь причинно-следственную. Другими словами, если переменные связаны друг с другом, то на этом основании мы не можем сделать вывод о том, что одна из них зависит от другой. Так, например, на основании антропометрических измерений установлена положительная корреляция между ростом и весом субъектов в многочисленной выборке испытуемых. Однако мы не можем сказать на этот счет, что вес зависит от роста или, наоборот, рост зависит от веса. Скорее всего, и то и другое зависит от третьей переменной – в данном случае от конституциональных особенностей человека, задаваемых генетическими факторами. Совершенно аналогично, обнаружив корреляцию между уровнем нейротизма и личностной тревожности, мы не можем говорить, что они находятся в причинно-следственной зависимости друг от друга.
О зависимости [y = f (x)] можно говорить лишь в тех случаях, когда х – независимая переменная, принимающая фиксированные значения, которые, как правило, задаются экспериментатором, а у может принимать любые значения так, что каждому хi соответствует определенное уi.
Чаще всего с различными формами зависимости приходится иметь дело в психофизике. Так, сенсорные сигналы, предъявляемые экспериментатором, являются независимыми величинами, а ответы испытуемого (суждения, оценки) – зависимыми от физических характеристик сигнала. С разными типами зависимостей приходится сталкиваться и в возрастной, и в социальной, и в клинической психологии, а также в других областях.
Различают монотонные и немонотонные формы зависимости. Если функция y закономерно возрастает или убывает с увеличением значения аргумента x, то такую зависимость называют монотонной (рис. 9.1 а, б, в). В случае немонотонной зависимости имеется одна или несколько точек (экстремумов), в которых производная dy/dx меняет свой знак на обратный (рис. 9.1 г, д, е).
Как правило, в психологических исследованиях редко используются методы математического описания немонотонных форм зависимости (при необходимости для этой цели можно использовать дифференциальные уравнения). Обычно констатируется сам факт, что наблюдается именно такая форма зависимости. Например, зависимость числа ошибок при решении интеллектуальной задачи от уровня эмоциональной напряженности имеет приблизительно U-образный вид (рис. 9.1 д). В этом случае наименьшее число ошибок соответствует среднему уровню тревожности. Если же исследовать зависимость эффективности совместного решения проблемы (так называемый «мозговой штурм») от численности рабочей группы, то она, как правило, имеет вид инвертированной U-образной кривой (рис. 9.1 г) и т. д.
Если экспериментальная кривая имеет вид монотонной зависимости, то можно попытаться описать ее соответствующей математической функцией. Для этих целей в качестве предварительного метода можно использовать метод подбора координат. Этот метод позволяет в первом приближении установить, в какой системе координат исследуемая кривая является наиболее линейной. Так, например, логарифмическая зависимость y = k×log x примет вид линейной функции в полулогарифмических координатах y = f (log x), степенная функция y = k×x n становится линейной в двойных логарифмических координатах log y = f (log x) и т. д. Анализ же линейной зависимости и ее математическое описание достаточно просты и предполагают использование метода наименьших квадратов.
Поскольку экспериментальные точки (значения переменной, полученные в опыте) всегда имеют определенный разброс и почти никогда в точности не ложатся на прямую линию, отдать предпочтение той или иной математической функции иногда затруднительно. В таких случаях предпочтение отдается той форме зависимости, где сумма квадратов отклонений экспериментальных точек от теоретической функции минимальна.
Анализ линейной зависимости методом наименьших квадратов
Зависимость типа y = a + bx называется линейной. Для математического описания этой формы зависимости достаточно определить величину коэффициента b и свободного члена a в координатах y = f (x).
Рис. 9.2. Параметры линейной зависимости (объяснение в тексте)
В данном случае b – тангенс угла наклона функции b > 0, если функция возрастает и b < 0 в случае убывающей функции. Если же функция параллельна оси абсцисс, т.е. значения yi не зависят от аргумента, то b = 0.
a = y0 – ордината точки при x = 0. Величина свободного члена а положительна (a > 0), если точка пересечения функции с осью ординат лежит выше нуля; a < 0, если точка пересечения лежит ниже начала координат.
Метод наименьших квадратов основан на одном из свойств среднего арифметического значения: сумма квадратов отклонений от среднего меньше суммы квадратов отклонений от любой другой точки (см. 4. 3). Таким образом, вычисляя параметры a и b линейной функции, мы задаем такое положение линии, при котором сумма квадратов отклонений (расстояний) эмпирических (экспериментальных) точек от теоретически рассчитанной прямой минимальна.
Вычисление тангенса угла наклона функции (b)
Таким образом,
Другими словами, для вычисления тангенса угла наклона достаточно рассчитать две уже знакомые нам величины – дисперсию значений аргумента (Sxx) и ковариацию (Sxy).
Вычисление свободного члена (а) в уравнении линейной регрессии:
Кроме двух вышеуказанных показателей, при использовании метода наименьших квадратов часто вычисляют величину ошибки регрессии (s ). Ошибка регрессии по сути является аналогом стандартного отклонения. Она отражает степень точности определения положения линейной функции в данной системе координат.
Вычисление ошибки регрессии:
Величина ошибки регрессии может отражать:
а) величину разброса экспериментальных точек относительно теоретических значений функции, т.е. она тем больше, чем больше сумма квадратов отклонений от теоретической функции (при полном совпадении экспериментальных и теоретических значений s = 0);
б) нелинейность функции в данной системе координат (для определения нелинейности функции не следует пренебрегать ее графическим изображением и не следует пытаться описать уравнением линейной регрессии функцию, которая явно не является линейной).
Ошибка коэффициента уравнения линейной регрессии (тангенса угла наклона) определяется по формуле:
(9.5)
где σ – величина ошибки регрессии, m - число измерений для каждого y (при условии повторения эксперимента).
В тех случаях, когда возникает необходимость сравнить между собой две индивидуальные или усредненные функции на предмет достоверности их различий, можно использовать величины тангенса угла наклона с соответствующим доверительным интервалом: b1 ± t×sb и b2 ± t×sb. Вывод о достоверности различий делается в том случае, когда доверительные интервалы для двух испытуемых (или двух выборок) не перекрываются между собой (так же как и в случае определения достоверности различий между выборками по критерию Стьюдента (см. подраздел 7.4.)).
Для того чтобы приобрести определенный навык в расчетах подобного рода, рассмотрим задачу из области психофизики.
Условие задачи
В психофизических исследованиях субъективной оценки громкости (R) тонального звука, проведенных на 50 испытуемых, были получены следующие данные (табл. 9.1):
Таблица 9.1
I, дБ | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 |
R | 1,4 | 2,9 | 6,8 | 10,5 | 17,4 | 27,5 | 66,1 | 107,2 | 158,5 |
Задание
Принимая, что усредненные оценки громкости описываются степенной функцией Стивенса, с помощью метода наименьших квадратов рассчитать основные параметры психофизической функции субъективной оценки громкости.
Решение
Учитывая тот факт, что степенная функция Стивенса y = k·S n есть в то же время двойная логарифмическая функция типа log y = n·log S + C, и то, что шкала децибелов представляет собой логарифмическую шкалу (20 дБ = 1 лог. ед.), проводим следующие преобразования:
а) преобразуем физическую шкалу сенсорного стимула в логарифмические единицы по десятичному основанию по принципу х = I / 20.
б) логарифмируем значения субъективной шкалы по принципу y = lg R (табл. 9.2).
Таблица 9.2
x | 0,5 | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 | 4,0 | 4,5 |
y | 0,15 | 0,46 | 0,83 | 1,02 | 1,24 | 1,44 | 1,82 | 2,03 | 2,20 |
1. Вычисляем предварительные (рабочие) параметры:
2. Вычисляем основные параметры психофизической функции:
Вывод
Субъективная оценка громкости тонального звука для данной группы испытуемых описывается степенной функцией Стивенса следующего типа:
у = 0,51х – 0,032, или R = 1,076 I0,51 + C (антилогарифм 0,032 равен –1,076).
В некоторых случаях возникает задача сравнения между собой психофизических функций у двух или более испытуемых на предмет достоверности их различий. Попарное сравнение можно сделать, определяя тангенс угла наклона функции с доверительным интервалом. Так, различия можно считать статистически достоверными, если интервалы b1 ± tn-1·σb1 и b2 ± tn-1·σb2 не имеют области перекрытия.
Множественная регрессия
Предположим, что на величину исследуемого признака (y) оказывает влияние большое число разнообразных факторов:
y = a + b1x1 + b2x2 + ... + bmxm. (9.3)
где x1, x2, … xm – факторы, оказывающие влияние на переменную величину. Коэффиценты при факторах по сути представляют собой коэффициенты корреляции факторов с результирующим признаком. Для определения коэффициентов b1, b2, ..., bm (т. е. степени влияния факторов x1, x2, ..., xm на параметры функции), а также свободного члена уравнения а существуют специальные алгоритмы и компьютерные программы. Расчет множественной регрессии на калькуляторе чрезвычайно громоздок, поэтому, как правило, вычисления ведутся на компьютере.
Варианты контрольных заданий
Вариант №1
1. Раскройте особенности психологического измерения и его свойства. Опишите типы шкал.
2. Дайте классификацию критериев математической статистики психологических исследований.
3. Согласно концепции Г.Айзенка шкалы экстраверсии-интроверсии (ЭИ) и нейротизма-эмоциональной стабильности (Н) являются ортогональными, т.е. не связаны между собой корреляционной связью.
Проверить исходную предпосылку Айзенка, используя данные, полученные при тестировании 50 испытуемых.
№ | ЭИ | Н | № | ЭИ | Н | № | ЭИ | Н | № | ЭИ | Н | № | ЭИ | Н |
1 | -5 | 6 | 11 | -5 | 6 | 21 | 1 | -2 | 31 | 1 | 6 | 41 | -3 | -6 |
2 | 1 | 3 | 12 | -3 | -2 | 22 | 6 | 5 | 32 | 7 | -4 | 42 | -1 | -8 |
3 | 0 | 8 | 13 | -2 | 0 | 23 | -7 | -1 | 33 | -7 | -1 | 43 | 6 | 6 |
4 | 3 | -3 | 14 | -3 | 3 | 24 | 4 | 11 | 34 | -5 | 2 | 44 | 6 | -3 |
5 | 2 | 8 | 15 | -6 | 8 | 25 | 1 | 4 | 35 | -6 | -4 | 45 | 3 | 9 |
6 | 4 | 3 | 16 | 5 | 0 | 26 | 3 | 6 | 36 | -1 | -2 | 46 | -2 | -1 |
7 | -1 | 3 | 17 | 0 | -4 | 27 | -5 | -5 | 37 | 5 | -1 | 47 | -4 | -7 |
8 | -4 | 8 | 18 | -3 | 1 | 28 | 4 | 8 | 38 | -1 | 0 | 48 | 1 | 3 |
9 | -3 | 3 | 19 | 5 | -4 | 29 | 4 | -3 | 39 | -5 | 3 | 49 | 5 | 4 |
10 | 6 | -3 | 20 | -4 | 0 | 30 | 2 | -1 | 40 | 2 | -2 | 50 | 0 | 3 |
Вариант № 2
1. Дайте характеристику генеральной и выборочной совокупности. Раскройте основное свойство выборочной совокупности.
2. Перечислите способы и правила ранжирования данных, приведите пример.
3. В опытах на 100 испытуемых (50 мужчин и 50 женщин) регистрировалось время реакции на движущийся объект (РДО). Получены следующие результаты:
| Время реакции в секундах | |||||||
0,20-0,22 | 0,22-0,24 | 0,24-0,26 | 0,26-0,28 | 0,28-0,30 | 0,30-0,32 | 0,32-0,34 | ||
Частоты | М | 5 | 8 | 15 | 14 | 5 | 2 | 1 |
Ж | 4 | 7 | 13 | 16 | 4 | 4 | 2 |
Определить, достоверны ли различия по показателям времени РДО у мужчин и женщин.
Вариант № 3
1. Раскройте понятие уровней значимости и достоверности результатов исследования.
2. Рассмотрите два наиболее распространенных параметрических и непараметрических критерия достоверности различий между выборками, приведите примеры.
3. 30 студентов (14 юношей и 16 девушек) во время экзаменационной сессии были протестированы по опроснику Спилбергера на уровень реактивной тревожности (УРТ). Получены следующие результаты:
№п/п | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Юноши | 32 | 34 | 28 | 43 | 35 | 26 | 41 | 32 |
Девушки | 34 | 30 | 37 | 43 | 42 | 44 | 46 | 36 |
№п/п | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
Юноши | 40 | 39 | 42 | 38 | 44 | 33 |
|
|
девушки | 45 | 28 | 34 | 41 | 40 | 35 | 42 | 39 |
Определите, существуют ли различия по уровню реактивной тревожности у юношей и девушек.
Вариант № 4
1. Рассмотрите способы первичного описания данных.
2. Раскройте границы применения критерия Q Розенбаума, U-критерия Манна-Уитни, приведите примеры.
3. С помощью Цветового теста отношений (Е.Ф. Бажин, А.М. Эткинд) были исследованы семейные отношения у мужчин невротиков (38 человек). Оказалось, что 74% мужчин ассоциируют жену с одним из светлых цветов и лишь 26% - с темным. Себя ассоциируют со светлыми цветами лишь 31% мужчин, остальные 69% – с темными.
Можно ли на основании приведенных выше данных утверждать, что в восприятии семьи мужчинами-невротиками наблюдается выраженная асимметрия: качества активного, доминантного, «светлого» начала больные приписывают жене, а себе оставляют пассивную, страдательную роль?
Вариант № 5
1. Раскройте меры центральной тенденции (мода, медиана, среднее арифметическое).
2. Укажите, в каких случаях используются коэффициент корреляции Фехнера, коэффициент корреляции Пирсона, приведите примеры.
3. С помощью Цветового теста отношений протестированы 38 человек с депрессивными симптомами и 50 человек без каких-либо выраженных психиатрических симптомов. Оказалось, что свое настроение ассоциируют с яркими цветами (красный, желтый, зеленый) 40% здоровых и лишь 5% депрессивных испытуемых. Свое прошлое ассоциируют с красным цветом 14% больных против 22% здоровых.
Определить достоверность различий между данными группами испытуемых.
Вариант № 6
1. Охарактеризуйте параметрические и непараметрические меры изменчивости параметров (пределы разнообразия, размах вариаций, среднее и стандартное отклонения).
2. Раскройте область применения Т-критерия Вилкоксона и G-критерия знаков, приведите примеры.
3. Американский исследователь Стеннет исследовал связь между полом и количеством пропусков детского сада. Он получил следующие данные: более 20 дней в году пропускали 29% мальчиков и 27% девочек. Всего в его исследовании приняли участие 873 мальчика и 837 девочек.
Можно ли, исходя из данных Стеннета, считать, что мальчики пропускают детский сад чаще, чем девочки?
Вариант № 7
1. Раскройте особенности нормального распределения переменных величин.
2. Охарактеризуйте основные статистические понятия: степень свободы, статистические гипотезы, зависимые и независимые выборки.
3. По тесту Айзенка в группе испытуемых обнаружено 15 экстравертов, из них 8 с высоким уровнем нейротизма (холерики) и 7 – с низким нейротизмом (сангвиники).
Тест Спилбергера обнаружил у тех и других следующий уровень личностной тревожности (УЛТ).
Холерики | 42 | 44 | 40 | 38 | 43 | 37 | 41 | 42 |
Сангвиники | 34 | 36 | 38 | 40 | 35 | 38 | 39 |
|
Определить коэффициент корреляции и его статистическую значимость между типом темперамента и уровнем личностной тревожности.
Вариант № 8
Раскройте особенности распределения переменных величин (биномиальное распределение, равномерное распределение, распределение Пуассона).
2. Опишите границы применения t -критерия Стьюдента для зависимых и независимых выборок, и F-критерия Фишера, приведите примеры.
3. Опрос учащихся выпускных классов показал, что часть выпускников (60 человек, из них 36 девушек, 24 юноши) собираются после школы поступать на гуманитарные (24 девушки и 6 юношей) и коммерческо-экономические специальности вузов (12 девушек и 18 юношей).
Определить корреляцию и его достоверность между полом и склонностью к гуманитарному и коммерческо-экономическому образованию.
Вариант № 9
1. Опишите критерии проверки нормальности распределения (коэффициент асимметрии, критерий эксцесса).
2. Раскройте область применения коэффициента корреляции Спирмена (rs), и коэффициента τ (тау) Кендалла, приведите примеры.
3. 10 юношей и 10 девушек выпускного класса средней школы имеют следующий средний балл выпускного аттестата:
№п/п | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Юноши | 3,5 | 3,9 | 4,1 | 3,8 | 4,2 | 3,6 | 3,2 | 4,0 | 3,4 | 3,8 |
Девушки | 3,3 | 4,3 | 4,7 | 3,5 | 4,3 | 4,0 | 4,1 | 4,5 | 3,8 | 4,9 |
Определить коэффициент корреляции и его статистическую значимость между средним выпускным баллом и полом.
Вариант № 10
1. Раскройте область применения дихотомического коэффициента корреляции (φ), точечно-биссериального (rpb) и рангово-биссериального (rrb) коэффициентов корреляции, приведите примеры.
2. Укажите, в каких случаях используются критерий χ² и критерий Колмогорова (λ), приведите пример.
3. 12 учащихся были проранжированы одним экспертом по их открытой неприязни к преподавателю (х) и к другим учащимся (y). Ранг 1 присваивается учащемуся, который показал себя наиболее враждебным. Результаты экспертной оценки приведены в таблице:
Ранговая оценка неприязни | учащиеся | |||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | |
К учителю (х) | 2 | 8 | 12 | 3 | 1 | 6 | 7 | 10 | 4 | 9 | 11 | 5 |
К учащимся (у) | 6 | 5 | 10 | 7 | 3 | 4 | 9 | 8 | 1 | 11 | 12 | 2 |
Определить, есть ли связь между открытой неприязнью учащихся к преподавателю и к другим учащимся, если верить эксперту.
- Тема 1. Лекция
- Тема 2. Лекция
- Тема 3. Лекция
- Тема 4. Лекция
- Тема 5. Лекция
- Тема 6. Лекция
- Непараметрический критерий q Розенбаума
- Алгоритм Подсчет критерия q Розенбаума
- Алгоритм Подсчет критерия u Манна-Уитни.
- Критерий Стьюдента
- Алгоритм Расчет критерия φ*
- Алгоритм Подсчет критерия н Крускала-Уоллиса
- Алгоритм Подсчет критерия s Джонкира
- Тема 7. Лекция
- Алгоритм Расчет критерия знаков g
- Алгоритм Подсчет критерия т Вилкоксона
- Критерий χ2r Фридмана
- Алгоритм Подсчет критерия χ2r Фридмана
- Алгоритм Подсчет критерия тенденций l Пейджа
- Тема 8. Лекция
- Тема 9. Лекция