скачать doc
Корреляционные исследования 419 \
СТАТИСТИЧЕСКОЕ ПРИЛОЖЕНИЕ: КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ
Стандартные оценки
Самая простая формула для вычисления коэффициента корреляции между двумя выборками оценок задается с помощью стандартных оценок. Эта формула дает также наиболее ясное представление о значении коэффициента корреляции. Вот почему в этом приложении вводится понятие стандартной оценки. Кроме того, стандартные оценки, полученные в различных тестах, можно сравнить между собой. Так, если вы скажете кому-либо, что по истории вы получили тестовую оценку 38, а по английскому языку — 221, он мало что поймет. Однако этот «кто-то», если он читал данное приложение, получит точную информацию из сообщения, что ваша стандартная оценка по истории равна +2,1, а по английскому языку —1,3.
Вы уже знаете, что (первичная) тестовая оценка какого-либо испытуемого в группе обозначается через X. Тестовая же оценка данного конкретного испытуемого обозначается с помощью индекса. Так, например, тестовая оценка испытуемого 3 записывается как Хз. Вы также знакомы с отклонением оценки от среднего х=Х—Мх. Отклонение оценки испытуемого 3 записывается как Хз==Хз—Мх. Если отклонение оценки испытуемого разделить на стандартное отклонение стх распределения оценок, то оно преобразуется в стандартную оценку (или 2-оценку).
Допустим, что испытуемый 3 имеет (первичную) тестовую оценку 60. Средняя оценка для группы равна 49 и стандартное отклонение оценок равно 12, т. е. Хз= =60, Мх==49, о-х==12. Прежде всего=60—49=+11. Давайте теперь вычислим 2õ3, т. е. найдем стандартную оценку для испытуемого 3:
?х=^—. (9.1)
Корреляционные исследования 421
Тестовые оценки помещены в приводимой ниже таблице во втором столбце слева, а рабочие оценки—во втором столбце справа. Они обозначены как Х и ? соответственно
5 | х | х | ^ | ^ | ^ | у | V | 5 | ||||
1 | 223 | +38 +2,054 | +2 455 | | 1-1 195 | +190 | 1810 | 1 | ||||
2 | 184 | — 1 - | - ,054 | — | 109 | | -2 | 013 | +320 | 1940 | 2 | |
3 | 209 | +24 +1,297 | + | 898 | | | 692 | +110 | 1730 | 3 | ||
4 | 183 | —2 --,108 — | 061 | — | 566 | — 90 | 1530 | 4 | ||||
5 | 180 | — 5 - | - ,270 | — | 102 | + | 377 | + 60 | 1680 | 5 | ||
6 | 168 | —17 - | - ,919 | — | 810 | + | 881 | +140 | 1760 | 6 | ||
7 | 215 | +30 +1,622 | + | 102 | + | 063 | + 10 | 1630 | 7 | |||
8 | 172 | —13 - | - ,703 | + | 442 | | 629 | —100 | 1520 | 8 | ||
9 | 200 | +15 + ,811 — | 357 | — | 440 | — 70 | 1550 | 9 | ||||
10 | 191 | + 6 4 | ^ ,324 | — | 143 | — | 440 | — 70 | 1550 | 10 | ||
11 | 197 | +12 - | - ,649 | + | 653 | +1 | 006 | +160 | 1780 | 11 | ||
12 | 188 | + 3 4 | - ,162 | | 020 | | 126 | — 20 | 1600 | 12 | ||
13 | 174 | —11 - | - ,595 | — | 075 | + | 126 | + 20 | 1640 | 13 | ||
14 | 176 | — 9 - | - ,486 | — | 214 | + | 440 | + 70 | 1690 | 14 | ||
15 | 155 | —30 - | -1,622 | | | 714 | | 440 | — 70 | 1550 | 15 | |
16 | 165 | —20 - | -1,081 | | -2 | 720 | о | 516 | —400 | 1220 | 16 | |
17 | 163 | —22 - | -1,189 | | Ц | 346 | —' 1 | 132 | —180 | 1440 | 17 | |
М | 185 | | | | | | 1620 | | ||||
в | 18,5 | | | | | | 159 | |
2гу=+7,336;
г= +0,432.
1 нем столбце мы находим произведение 2х на 2у, которое равно +2,455.
Такие же вычисления, сделанные для остальных
16 испытуемых, заполняют всю остальную таблицу. Ни-
, же этих данных приведены величины средних и стан-
'; дартных отклонений. Еще ниже в центре дается сум-
1 ма по столбцу 2х2у, равная +7,336. Это число, делен-
1 ное на число испытуемых — 17, и дает величину (коэф-
1 фициента корреляции, равную +0,432.
1 В случае, если вам не хочется запоминать все эти
термины, вы можете обратиться к следующей формуле
1
1
420 Глава 9
; Следовательно, /
2 хз =+^-+0,92.
Поскольку стандартные оценки редко имеют величину больше +2 и меньше —2, то вы узнаете, что оценка именно этого испытуемого лежит примерно посередине между средней и наивысшей оценкой в группе.
Рабочие оценки, такие, например, как оценки качества работы контролеров, которые необходимо скоррелировать с тестовыми оценками, обычно обозначаются символом V вместо X. Тогда отклонение оценки обозначается через у, а стандартная рабочая оценка — гу. Итак, мы говорим о нахождении корреляции между Х и V тогда, когда каждый испытуемый в группе имеет оценку Х и оценку V. Коэффициент корреляции обозначается символом Гхт.
Вычисление гхт
Для вычисления коэффициента мы снова воспользуемся ранее приводившимися данными. Возьмем данные для условия А как тестовые оценки 17 испытуемых, а данные для условия Б как рабочие оценки для тех же испытуемых. Однако чтобы подчеркнуть относительный характер стандартных оценок, умножим каждое значение для условия Б на 10. К счастью, мы уже сделали много вычислений, необходимых для получения "ху - Для тестовых оценок мы просто используем .полученные ранее — среднее и стандартные отклонения. Для условия Б полученные — среднее и стандартные отклонения нужно просто умножить на 10.
Вы видите, что тестовая оценка (X) первого испытуемого 51 была 223, а его рабочая оценка —1810. Сдвинувшись по этой строке от обоих концов к середине, мы обнаружим, что х равно +38 (т. е. 223—185) и у равно +190 (т. е. 1810—1620). Далее, видим, что равно 2,054 (т. е. +38, деленное на 18,5), а г равно +1,195 (т. е. 190, деленное на 159). И, наконец, в сред-
422 Глава 9
для расчета коэффициента корреляции:
^Х'У 1о «^ ^ = —^— ^•^
или для наших данных
Диаграмма разброса (корреляционное поле)
На рис. 9.4 показана диаграмма разброса, каждая точка которой представляет одного испытуемого. Значения шкал даны в единицах стандартных оценок г.

Корреляционные исследования Д23
При таких осях наклон линии предсказывания прямо показывает величину Гху. В нашем случае ху равно +0,432. Это значение наклона линии: на каждое смешение на единицу вправо точки линии поднимаются вверх на 0,432 единицы. Так, если данный испытуемый имеем значение гх, равное +1, то предсказываемое значение 2х для него равно +0,432. Таким образом, предсказываемая величина значительно ближе к среднему распределения, чем та величина, на основе которой делалось предсказание. Поэтому говорят, что Предсказания стремятся (регрессируют) к среднему, и линия предсказания называется линией регрессии Х на V. Более точно, это предсказание 2у то гх.
Вы можете заметить, что линия предсказания проходит через пересечение точек 2х==0 и 2у===0. Обе эти точки представляют средние значения соответствующих распределению. Это справедливо, независимо от значения величины -ху. Если испытуемый оказывается в точке среднего по X, то наилучшим предсказанием всегда будет среднее до V. Далее видно, что если оценка будет выше среднего по Х (положительное значение х), то предсказываемая оценка будет также выше среднего по V (положительное значение г). Точно так же для Х ниже среднего значения предсказываемая оценка У будет ниже среднего значения по У.
И, наконец, чем выше величина Гху, тем меньше регрессия предсказания. В случае полной корреляции линия предсказания будет иметь наклон +1. Так, если, например, г-& равно +1,5, то предсказываемое гу тоже будет равно +1,5, а если х равно —0,8, то гу тоже будет равно —0,8. При полной корреляции регрессия к среднему отсутствует. С другой стороны, если корреляция равна 0, то линия будет иметь нулевой наклон, т. е. она будет представлять собой горизонтальную линию. Она будет проходить на уровне 2у=0, т. е. среднего значения по У. Поэтому, какая бы ни была величина 2х, наилучшее предсказание всегда будет гу=0. Следовательно, при нулевой корреляции все предсказываемые значения регрессируют к среднему.
414 ' Глава 9
Все это может быть представлено посредством следующей формулы:
2у==Гху2х- (9-3)
Эта формула доказывает, что стандартную оценку для выборки V можно получить, умножив стандартную оценку для выборки Х на .коэффициент корреляции между Х и V. Например, для испытуемого, имеющего стандартную оценку г-&, равную +0,50 с коэффициентом корреляции 0,70, получим
гу= 0,70 (+0,50)^ +0,35.
Задача: Вычислите гху для данных в задаче, приведенной в статистическом приложении к главе 6. Используйте условие В для Х и условие Г для У. Ответ: гхт= 0,576.