В каких производствах используется корреляции метод. Корреляционный метод. Сильная и слабая

Социальные психологи, как правило, стремятся не только описать социальное поведение. Цель социальной науки - понять отношения между переменными и быть в состоянии предсказать, когда и как будут себя вести люди в разных социальных ситуациях. Например, каковы взаимосвязи между порнографией, которую видят люди, и вероятностью их участия в актах насилия? Существует ли связь между количеством насилия, которое дети видят по телевизору, и их агрессивностью? Чтобы ответить на такие вопросы, исследователи часто используют другой подход - корреляционный метод.

Корреляционный метод (correlational method) - это техника, посредством которой систематически измеряются две или более переменные и отношения между ними. В корреляционном исследовании поведение людей и установки можно определить по-разному. Так же как и в методе наблюдения, исследователи иногда непосредственно наблюдают за человеческим поведением. Например, применив корреляцонный метод, психологи имеют возможность проверить взаимосвязь между детским агрессивным поведением и просмотром телевизионных передач с насилием. Они также могут наблюдать за детьми на игровой площадке, однако теперь стоит иная цель - оценить взаимозависимость, или корреляцию, между детской агрессивностью и другими факторами, как, например, их привычкой смотреть телевизор, что исследователи также измеряют.

Метод корреляции (correlational method) - техника, при помощи которой систематически измеряются две или более переменные и оценивается зависимость между ними (например, как можно, зная одну переменную, предсказать другую).

Исследователи проверяют наличие подобных взаимосвязей путем подсчета коэффициента корреляции, статистического показателя, оценивающего, насколько вы можете предсказывать одну переменную, зная другую, например, насколько вы можете предсказывать вес человека, зная его рост. Положительная корреляция означает, что увеличение значения одной переменной сопровождается повышением значения другой.

Высота и вес позитивно коррелируют между собой; чем человек выше, тем больше будет его вес. Отрицательная корреляция, наоборот, подразумевает, что увеличение показателей одной переменной связано с уменьшением показателей другой. Если бы высота и вес людей коррелировали отрицательно, мы бы выглядели очень смешно - коротышки, например, дети походили бы на пингвинов, а высонимно) об их поведении или отношениях. Опросы - наиболее удобный способ измерения отношений людей; например, людям можно позвонить по телефону и спросить, какого кандидата они будут поддерживать на приближающихся выборах или что они думают по поводу тех или иных социальных проблем. Исследователи нередко применяют корреляционный метод к результатам опросов, чтобы определить, насколько ответы испытуемых на одни вопросы предопределяют их ответы на другие. Политологи, например, могут быть заинтересованы в том, можно ли на основе мнений людей о какой-либо социальной проблеме, такой как регулирование торговли оружием, предсказывать, как они проголосуют. Психологи часто используют опросы для содействия пониманию социального поведения и отношений, например, рассматривая, связано ли то, что говорят люди о количестве читаемой ими порнографии, с их отношением к женщинам.

Опросы - исследования, в которых репрезентативной выборке людей задаются вопросы (часто анонимно) об их поведении или отношениях.

У опросов есть много преимуществ, в частности, они позволяют исследователям судить о взаимосвязях между труднонаблюдаемыми переменными, подобными тому, насколько часто люди занимаются безопасным сексом. Когда интересующие переменные нельзя легко пронаблюдать, исследователи полагаются на опросы, в которых людей спрашивают об их убеждениях, отношениях и поведении. Исследователь проверяет наличие взаимосвязей между полученными ответами, например, чаще ли кие люди, как игроки в баскетбол, были бы совсем тощими - «кожа и кости»! Возможно, конечно, что две переменные совершенно не коррелируют, так что исследователь не сможет предсказать одну переменную, зная другую.

Коэффициент корреляции (correlation coefficient) - статистическая величина, которая оценивает, насколько хорошо вы можете предсказать одну переменную, зная другую; скажем, насколько вы можете предсказать вес людей, зная их рост.

Коэффициент корреляции выражается числом от -1,00 до +1,00. Корреляция 1,00 означает, что две переменные полностью коррелируют в позитивном направлении; таким образом, зная один показатель у человека, исследователь может точно определить второй. В повседневной жизни полные корреляции, конечно, встречаются редко. Например, в одном исследовании было выявлено, что корреляция между ростом и весом составляет 0,47 для выборки мужчин в возрасте 18-24 лет (Freedman, Pisani, Purves & Adhikari, 1991). Это означает, что в среднем более высокие люди тяжелее низкорослых, но есть и исключения. Корреляция -1,00 означает полную отрицательную корреляцию, а нулевая корреляция означает, что две переменные не коррелируют.

Корреляция - это степень, в которой события или личные характеристики человека зависят друг от друга. Корреляционный метод - процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?

Корреляция - степень зависимости друг от друга событий или характеристик.

Корреляционный метод - процедура исследований, которая используется для определения того, насколько события или характеристики зависят друг от друга.

Чтобы ответить на этот вопрос, исследователи подсчитывают баллы жизненного стресса (например, количество угрожающих событий, переживаемых человеком в определенный период времени) и баллы депрессии (например, баллы в опросниках по депрессии). Как правило, исследователи обнаруживают, что эти переменные увеличиваются или уменьшаются вместе (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To есть чем больше количество баллов стресса в жизни определенного человека, тем выше его или ее сумма баллов по депрессии. Корреляции такого рода имеют позитивную направленность и их называют позитивной корреляцией.

Корреляция может иметь и негативную, а не позитивную направленность. При негативной корреляции, когда значение одной переменной возрастает, значение другой уменьшается. Исследователи обнаружили, например, негативную корреляцию между депрессией и уровнем активности. Чем больше депрессия человека, тем меньше его занятость.

Существует еще и третья взаимосвязь в корреляционном исследовании. Две переменные могут быть не взаимосвязаны, то есть между ними не существует последовательной взаимосвязи. Когда число одной переменной возрастает, показатели другой переменной иногда возрастают, иногда уменьшаются. Исследования обнаружили, например, что депрессия и интеллект не зависят друг от друга.

Кроме знания направленности корреляции исследователям нужно знать ее величину или силу. То есть насколько близко эти две переменные соотносятся между собой. Действительно ли одна переменная всегда зависит от другой или их взаимосвязь менее определенна? Когда обнаруживается тесная взаимосвязь двух переменных у многих испытуемых, то говорят, что корреляция - высокая или устойчивая.

Направленность и величина корреляции часто имеет численное значение и выражается в статистическом понятии - коэффициенте корреляции ( r ). Коэффициент корреляции может варьироваться от +1.00, показывающего полную позитивную корреляцию между двумя переменными, и до -1.00 - этот коэффициент указывает на полную негативную корреляцию. Знак коэффициента (+ или -) обозначает направленность корреляции; число представляет ее величину. Чем ближе коэффициент к 0, тем слабее корреляция и меньше ее величина. Так корреляции +0.75 и -0.75 имеют одинаковые величины, а корреляция +.25 слабее и той и другой корреляции.

Коэффициент корреляции ( r ) - статистический термин, указывающий направленность и величину корреляции, колеблющийся от -1.00 до +1.00.

Поведение людей меняется, и многие человеческие реакции можно оценивать лишь приблизительно. Поэтому в психологических исследованиях корреляции не достигают величины полной позитивной или полной негативной корреляции. В одном исследовании стресса и депрессии, проводившемся с 68 взрослыми, корреляция между двумя переменными составила +0.53 (Miller et al., 1976). Несмотря на то, что эту корреляцию едва ли можно назвать абсолютной, ее величина в психологическом исследовании считается большой.

Статистический анализ корреляционных данных

Ученые должны решить, действительно ли корреляция, обнаруженная ими в данной группе испытуемых, точно отражает подлинную корреляцию в общем населении. Может ли наблюдаемая корреляция возникать только случайно? Ученые могут протестировать свои выводы при помощи статистического анализа данных, применив принципы вероятности. В сущности, они задаются вопросом, насколько вероятно, что данные отдельного исследования были получены случайно. Если статистический анализ указывает на очень малую вероятность того, что обнаруженная корреляция была получена случайно, то исследователи называют корреляцию статистически значимой и делают вывод, что их данные отражают подлинную корреляцию, встречающуюся повсеместно.

Преимущества и недостатки корреляционного метода

У корреляционного метода есть некоторые преимущества по сравнению с изучением отдельных случаев болезни. Поскольку исследователи получают свои переменные, основываясь на многочисленных примерах, и применяют статистический анализ, то они лучше могут обобщить данные о людях, которых изучали. Исследователи также могут повторить корреляционные исследования на новых испытуемых, чтобы проверить результаты своих изысканий.

Несмотря на то, что корреляционные исследования позволяют исследователям описать взаимосвязь между двумя переменными, они не объясняют эту взаимосвязь. Когда мы взглянем на позитивную корреляцию, обнаруживающуюся при исследовании разных жизненных стрессов, у нас может возникнуть искушение сделать вывод, что усиление стресса приводит к более сильной депрессии. На самом деле, однако, эти две переменные могли коррелировать по одной из трех причин: 1) жизненный стресс может приводить к депрессии; 2) депрессия может заставить людей перенести более сильный стресс (например, депрессивный подход к жизни приводит к тому, что люди будут неправильно распоряжаться деньгами или депрессия негативно скажется на их социальных взаимоотношениях); 3) депрессия и жизненный стресс могут быть обусловлены третьей переменной, такой как бедность. Вопросы причинности требуют применения экспериментального метода.

<Вопросы для размышления. Как бы вы объяснили значительную корреляцию между жизненным стрессом и депрессией? Какая из интерпретаций, по вашему мнению, наиболее точна?>

Особые формы корреляционного исследования

Клиницисты широко используют два типа корреляционных исследований - эпидемиологические исследования и долгосрочные (лонгитюдные) исследования. В ходе эпидемиологических исследований обнаруживается общее число случаев и распространенность определенного расстройства среди указанной части населения (Weissman, 1995). Число случаев - это количество новых случаев расстройств, возникших за данный период времени. Распространенность - общее число случаев среди населения в данный период времени; распространенность расстройства или заболевания включает как уже существующие, так и новые случаи.

За прошедшие двадцать лет клиницисты в США разработали самое обширное эпидемиологическое исследование, которое когда-либо проводилось, и назвали его Районным эпидемиологическим исследованием. Они взяли интервью более чем у 20 000 людей в пяти городах, чтобы выяснить преобладание разных психических расстройств и то, какие программы применялись для их лечения (Regier et al., 1993). Это исследование сравнивалось в эпидемиологическими исследованиями в других странах, чтобы проверить, как уровни психических расстройств и программы лечения варьируются в разных странах мира (Weissman, 1995).

<Близнецы, корреляция и наследственность. Корреляционные исследования многих пар близнецов позволяют сделать вывод о возможной взаимосвязи между генетическими факторами и некоторыми психическими расстройствами. Идентичные близнецы (близнецы, которые, как и изображенные здесь, обладают идентичными генами) проявляют высокую степень корреляции при некоторых расстройствах, и эта корреляция выше, чем у неидентичных близнецов (с неидентичными генами).>

Такие эпидемиологические исследования помогают психологам выделить группы риска, предрасположенные к определенным расстройствам. Оказывается, что среди женщин превалирует уровень расстройств, связанных с тревожным состоянием и депрессией, в отличие от мужчин, среди которых преобладает более высокий уровень алкоголизма, чем у женщин. У пожилых людей уровень суицида выше, чем у людей помоложе. У людей в некоторых не западных странах (например, в Тайване) уровень психической дисфункции выше, чем на Западе. Эти тенденции приводят исследователей к предположению, что какие-то особые факторы и среда провоцируют определенные типы расстройств (Rogers & Holloway, 1990). Так, ухудшение здоровья у пожилых людей с большей вероятностью приводит их к самоубийству; культурные прессы или установки, распространенные в одной стране, приводят к определенному уровню психических дисфункций, отличающемуся от уровня тех же дисфункций в другой стране.

Эпидемиологическое исследование - исследование, которое определяет число случаев заболевания и его распространенность среди данного слоя населения.

Число случаев заболевания - количество новых случаев расстройства, возникающих в данном слое населения в определенный период времени.

Распространенность - общее число случаев расстройств, возникающих в данном слое населения за определенный период времени.

Проводя долгосрочные исследования, психологи наблюдают тех же самых испытуемых в разных ситуациях на протяжении длительного периода времени. В одном таком опыте ученые наблюдали в течение многих лет развитие нормально функционирующих детей, чьи отец или мать страдали от шизофрении (Parnas, 1988; Mednick, 1971). Исследователи обнаружили среди прочего, что дети родителей с тяжелыми формами шизофрении чаще обнаруживали психические отклонения и совершали преступления на поздних стадиях своего развития.

Долгосрочное (лонгитюдное) исследование - исследование, в котором те же самые испытуемые наблюдаются в течение длительного периода времени.

Корреляционные методы (correlation methods)

К. м., получившие свое назв. благодаря тому, что основываются на «со-отношении» («co-relation») переменных, представляют собой статистические методы, начало к-рым было положено в работах Карла Пирсона примерно в конце XIX в. Они тесно связаны с понятием регрессии, еще раньше сформулированным сэром Фрэнсисом Гальтоном, к-рый первым начал статистически изучать связь между ростом отцов и сыновей. Именно Гальтон нанял Пирсона в качестве статистика для обработки рез-тов исслед., к-рые он и его отец, находясь под влиянием идей своих родственников - Дарвинов, проводили с целью определения вклада наследственности в развитие челов. качеств. Благодаря этому сотрудничеству между Гальтоном и Пирсоном и более ранним открытиям первого в области регрессионного анализа символ «r» (первая буква слова regression) исторически закрепился в качестве маркера К. м.

Корреляция как произведение моментов

Пирсон определял коэффициент корреляции как «среднее произведение Z-оценок». С этих пор r известен всем как коэффициент произведения моментов:

r = (aZxZy) / N.

Его обоснованное вычисление предполагает, что: а) две коррелируемые переменные непрерывны и нормально распределены; б) линии наилучшего соответствия для совместного двумерного распределения яв-ся прямыми; в) одинаковая вариабельность сохраняется по всей широте совместного распределения переменных. Простая формула для вычисления коэффициента корреляции произведения моментов Пирсона по «сырым» (нестандартизованным) данным выглядит следующим образом:

Бисериальная корреляция

Разновидностью коэффициента корреляции произведения моментов яв-ся бисериальный коэффициент корреляции, тж разраб. Пирсоном. В тех случаях, когда только одна из переменных непрерывна и имеет приемлемо нормальное распределение, а др. искусственно дихотомизирована (предполагается, что она тоже непрерывна и нормально распределена, но представлена в бинарной форме, напр.: «справился/не справился»), связь между этими двумя переменными тж можно выразить при помощи r. В этом случае коэффициент корреляции обозначается через rbis. Как и коэффициент произведения моментов r, он изменяется в диапазоне от +1,00 (прямая функциональная связь) через 0,00 (отсутствие связи) до -1,00 (обратная функциональная связь). Метод бисериальной корреляции оказался весьма полезным в процедурах анализа заданий, т. к. он измеряет связь между рез-тами выполнения каждого задания теста, выраженными в бинарной форме («справился/не справился»), и общей оценкой по данному тесту.

Точечно-бисериальная корреляция

Последующая модификация коэффициента корреляции произведения моментов получила отражение в точечно бисериальном r. Эта стат. показывает связь между двумя переменными, одна из к-рых предположительно непрерывна и нормально распределена, а др. яв-ся дискретной в точном смысле слова. Точечно-бисериальный коэффициент корреляции обозначается через rpbis Поскольку в rpbis дихотомия отражает подлинную природу дискретной переменной, а не яв-ся искусственной, как в случае rbis, его знак определяется произвольно. Поэтому для всех практ. целей rpbis рассматривается в диапазоне от 0,00 до +1,00.

Существует и такой случай, когда две переменные считаются непрерывными и нормально распределенными, но обе искусственно дихотомизированы, как в случае бисериальной корреляции. Для оценки связи между такими переменными применяется тетрахорический коэффициент корреляции rtet, к-рый был тж выведен Пирсоном. Осн. (точные) формулы и процедуры для вычисления rtet достаточно сложны. Поэтому при практ. применении этого метода используются приближения rtet, получаемые на основе сокращенных процедур и таблиц.

Ранговая корреляция

Непараметрический аналог параметрических методов корреляции существует в форме коэффициента ранговой корреляции, обозначаемого греческой буквой ρ(ро). Он применяется для определения степени связи между двумя переменными, значения к-рых представлены рангами, а не «сырыми» или стандартизованными оценками. Логическое обоснование вывода коэффициента ρ не требует соблюдения строго определенного набора допущений, и потому ρ является непараметрической стат. Его формула, получаемая из формулы произведения моментов Пирсона путем замены интервальных данных на ранжированные, приводится к виду:

ρ = 1 - (6Σd2) / N(N2 - 1), где d - ранговая разность, а N - число пар вариантов.

Множественная корреляция

Методы корреляции произведения моментов Пирсона и линейного регрессионного анализа Гальтона были обобщены и расширены в 1897 г. Джорджем Эдни Юлом до модели множественной линейной регрессии, предполагающей использование многомерного нормального распределения. Методы множественной корреляции позволяют оценить связь между множеством непрерывных независимых переменных и одной зависимой непрерывной переменной. Коэффициент множественной корреляции обозначается через R0.123...p Его вычисление требует решения совместной системы линейных уравнений. Число линейных уравнений равно числу независимых переменных.

Иногда необходимо исключить эффект третьей переменной, с тем чтобы определить «чистую» связь между любой парой переменных. Частный (парциальный) коэффициент корреляции выражает связь между двумя переменными при исключенном (элиминированном) влиянии еще одной или неск. др. переменных. В простейшем случае частный коэффициент корреляции вычисляется как функция парных корреляций (произведений моментов) между Y, X1 и Х2:

Если требуется исключить влияние двух переменных, скажем, Х2 и Х3, то формула принимает вид:

Каноническая корреляция

Множественная корреляция, позволяющая оценивать тесноту связи между множеством независимых переменных и одной из множества зависимых переменных, представляет собой частный случай более общего метода - канонической корреляции. Этот метод был разраб. в 1935 г. Гарольдом Хотеллингом. Коэффициенты канонической корреляции (RCi) определяются на двух множествах переменных. Чтобы показать связи, существующие между этими двумя множествами непрерывных переменных, вычисляется неск. канонических коэффициентов; их число определяется по числу переменных в меньшем множестве (если число переменных в них не одинаково). При канонической корреляции в обоих множествах (по отдельности) отыскиваются линейные комбинации входящих в них переменных, позволяющие определить (новые) координатные оси в пространстве каждого множества. Каждая такая линейная комбинация наз. канонической величиной (или канонической переменной). Канонические переменные отличаются друг от друга весами, к-рые они придают первичным переменным в соотв. множестве. Каноническая корреляция - это корреляция произведения моментов между парой канонических переменных, по одной из каждого множества. Т. о., каждый коэффициент канонической корреляции является мерой тесноты линейной связи между двумя координатными осями соотв. множеств переменных. Каноническая корреляция яв-ся методом многомерного статистического анализа.

Не со всеми проблемами можно справиться экспериментальным методом. Существует множество ситуаций, когда исследователь не может контролировать, какие испытуемые попадают в те или иные условия. Например, если надо проверить гипотезу, что люди с анорексией более чувствительны к изменениям вкуса, чем люди с нормальным весом, то не можем же мы собрать группу испытуемых с нормальным весом и потребовать, чтобы у половины из них появилась анорексия! На самом деле нам придется отобрать людей, уже страдающих анорексией, и тех, у кого вес в норме, и проверить, различаются ли они также по вкусовой чувствительности. Вообще говоря, можно использовать метод корреляций, чтобы определить связана ли некоторая переменная, которую мы не можем контролировать, с другой интересующей нас переменной, или, иначе говоря, коррелируют ли они между собой.

В вышеприведенном примере у переменной веса есть только два значения -- нормальный и анорексичный. Чаще случается, что каждая из переменных может принимать много значений, и тогда надо определить, насколько величины одной и другой переменной коррелируют между собой. Определить это может статистический параметр, называемый коэффициентом корреляции и обозначаемый буквой r. Коэффициент корреляции позволяет оценить, насколько связаны две переменные, и выражается числом от -1 до +1. Ноль означает отсутствие связи; полная связь выражается единицей (+1, если отношение положительное, и -1, если оно отрицательное). По мере увеличения r от 0 до 1 сила связи возрастает.

Рис.6.

Эти гипотетические данные принадлежат 10 пациентам, каждый из которых имеет некоторое повреждение участков мозга, ответственных, насколько известно, за узнавание лиц. На рис. 6а пациенты располагаются вдоль горизонтали соответственно объему повреждения мозга, причем самая левая точка показывает пациента с наименьшим повреждением (10%), а самая правая точка показывает пациента с наибольшим повреждением (55%). Каждая точка на графике отражает показатель для отдельного пациента в тесте на узнавание лиц. Корреляция положительная и равна 0,90. На рис. 6б изображены те же самые данные, но теперь они показывают долю правильных ответов, а не ошибок. Здесь корреляция отрицательная, равная -0,90. На рис..6в успехи пациентов в тесте на распознавание отображены в зависимости от их роста. Здесь корреляция равна нулю.

Суть коэффициента корреляции можно пояснить на примере графического представления данных гипотетического исследования. Как показано на рис. 6а, в исследовании участвуют пациенты, о которых заранее известно, что у них поврежден мозг, и это вызвало разной степени трудности в узнавании лиц (прозопагнозия). Предстоит выяснить, возрастает ли трудность, или ошибка узнавания лиц, с увеличением процента поврежденной мозговой ткани. Каждая точка на графике 6а показывает результат для отдельного пациента при его тестировании на узнавание лиц. Например, пациент с 10%-ным повреждением ошибался в тесте на распознавание лиц в 15% случаев, а пациент с 55%-ным повреждением делал ошибки в 95% случаев. Если бы ошибка узнавания лиц постоянно возрастала с увеличением процента повреждения мозга, точки на графике располагались бы все время выше при движении слева направо; если бы они размещались на диагонали рисунка, коэффициент корреляции был бы r = 1,0. Однако несколько точек расположены по разные стороны этой линии, поэтому корреляция составляет около 90%. Корреляция 90% означает очень сильную связь между объемом поврежденного мозга и ошибками узнавания лиц. Корреляция на рис. 6а -- положительная, поскольку большее повреждение мозга вызывает больше ошибок.

Если бы вместо ошибок мы решили отобразить долю правильных ответов в тесте на распознавание, то получили бы график, изображенный на рис. 6б. Здесь корреляция отрицательная (равная примерно -0,90), поскольку с увеличением повреждения мозга доля правильных ответов уменьшается. Диагональ на рис. 6б -- это просто инверсный вариант той, что на предыдущем рисунке.

Наконец, обратимся к графику на рис. 6в. Здесь отображена доля ошибок пациентов в тесте на распознавание лиц в зависимости от их роста. Разумеется, нет оснований считать, что доля узнанных лиц связана с ростом пациента, и график подтверждает это. При движении слева направо точки не проявляют согласованного движения ни вниз, ни вверх, а разбросаны вокруг горизонтальной линии. Корреляция равна нулю.

Числовой метод вычисления коэффициента корреляции описан в Приложении II. Сейчас, однако, мы сформулируем несколько элементарных правил, которые помогут вам разобраться с коэффициентом корреляции, когда вы встретитесь с ним в последующих главах.

Корреляция бывает положительной (+) и отрицательной (-). Знак корреляции показывает, связаны ли две переменные положительной корреляцией (величина обеих переменных растет или уменьшается одновременно) или отрицательной корреляцией (одна переменная растет при уменьшении другой). Предположим, например, что количество пропусков занятий студентом имеет корреляцию -0,40 с баллами в конце семестра (чем больше пропусков, тем меньше баллов). С другой стороны, корреляция между полученными баллами и количеством посещенных занятий будет +0,40. Прочность связи одна и та же, но знак ее зависит от того, считаем ли мы пропущенные или посещенные занятия.

По мере усиления связи двух переменных r увеличивается от 0 до 1. Чтобы лучше это представить, рассмотрим несколько известных положительных коэффициентов корреляции:

Коэффициент корреляции между баллами, полученными в первый год обучения в колледже, и баллами, полученными на втором году, составляет около 0,75.

Корреляция между показателями геста на интеллект в возрасте 7 лет и при повторном тестировании в 18 лет составляет примерно 0,70.

Корреляция между ростом одного из родителей и ростом ребенка во взрослом возрасте, составляет около 0,50.

Корреляция между результатами теста на способность к обучению, полученными в школе и в колледже, равна примерно 0,40.

Корреляция между баллами, полученными индивидуумами в бланковых тестах, и суждением психолога-эксперта об их личностных качествах составляет около 0,25.

В психологических исследованиях коэффициент корреляции 0,60 и выше считается достаточно высоким. Корреляция в диапазоне от 0,20 до 0,60 имеет практическую и теоретическую ценность и полезна при выдвижении предсказаний. К корреляции от 0 до 0,20 следует относиться осторожно, при выдвижении предсказаний ее польза минимальна.

Тесты. Знакомый пример использования корреляционного метода -- тесты по измерению некоторых способностей, достижений и других психологических качеств. При тестировании группе людей, различающихся по какому-нибудь качеству (например, математическим способностям, ловкости рук или агрессивности), предъявляют некоторую стандартную ситуацию. Затем можно вычислить корреляцию между изменениями показателей данного теста и изменением другой переменной. Например, можно установить корреляцию между показателями группы студентов в тесте на математические способности и их оценками по математике при дальнейшем обучении в колледже; если корреляция значительная, то на основе результатов этого теста можно решить, кого из нового набора студентов можно перевести в группу с повышенными требованиями.

Тестирование -- важный инструмент психологических исследований. Оно позволяет психологам получать большое количество данных о людях с минимальным отрывом их от повседневных дел и без применения сложного лабораторного оборудования. Построение тестов включает множество этапов, которые мы подробно рассмотрим в последующих главах.

Корреляция и причинно-следственные связи. Между экспериментальными и корреляционными исследованиями есть важное различие. Как правило, в экспериментальном исследовании систематически манипулируют одной переменной (независимой) с целью определить ее причинное воздействие на некоторые другие переменные (зависимые). Такие причинно-следственные связи нельзя вывести из корреляционных исследований. Ошибочное понимание корреляции как причинно-следственного отношения можно проиллюстрировать на следующих примерах. Может существовать корреляция между мягкостью асфальта на улицах города и количеством солнечных ударов, случившихся за день, но отсюда не следует, что размягченный асфальт выделяет какой-то яд, приводящий людей на больничную койку. На самом деле изменение обеих этих переменных -- мягкости асфальта и числа солнечных ударов -- вызывается третьим фактором -- солнечным теплом. Еще один простой пример -- высокая положительная корреляция между большим количеством аистов, гнездящихся во французских деревнях, и высокой рождаемостью, зарегистрированной там же. Предоставим изобретательным читателям самим догадываться о возможных причинах такой корреляции, не прибегая к постулированию причинно-следственной связи между аистами и младенцами. Эти примеры служат достаточным предостережением от понимания корреляции как причинно-следственного отношения. Если между двумя переменными есть корреляция, изменение одной может вызывать изменения другой, но без специальных экспериментов такой вывод будет неоправданным.

При наличии двух рядов значений, подвергающихся ранжированию, рационально рассчитывать ранговую корреляцию Спирмена.

Такие ряды могут представляться:

  • парой признаков, определяемых в одной и той же группе исследуемых объектов;
  • парой индивидуальных соподчиненных признаков, определяемых у 2 исследуемых объектов по одинаковому набору признаков;
  • парой групповых соподчиненных признаков;
  • индивидуальной и групповой соподчиненностью признаков.

Метод предполагает проведение ранжирования показателей в отдельности для каждого из признаков.

Наименьшее значение имеет наименьший ранг.

Этот метод относится к непараметрическому статистическому методу, предназначенному для установления существования связи изучаемых явлений:

  • определение фактической степени параллелизма между двумя рядами количественных данных;
  • оценка тесноты выявленной связи, выражаемой количественно.

Корреляционный анализ

Статистический метод, предназначенный для выявления существования зависимости между 2 и более случайными величинами (переменными), а также ее силы, получил название корреляционного анализа.

Получил свое название от correlatio (лат.) – соотношение.

При его использовании возможны варианты развития событий:

  • наличие корреляции (положительная либо отрицательная);
  • отсутствие корреляции (нулевая).

В случае установления зависимости между переменными речь идет об их коррелировании. Иными словами, можно сказать, что при изменении значения Х, обязательно будет наблюдаться пропорциональное изменение значения У.

В качестве инструментов используются различные меры связи (коэффициенты).

На их выбор оказывает влияние:

  • способ измерения случайных чисел;
  • характер связи между случайными числами.

Существование корреляционной связи может отображаться графически (графики) и с помощью коэффициента (числовое отображение).

Корреляционная связь характеризуется такими признаками:

  • сила связи (при коэффициенте корреляции от ±0,7 до ±1 – сильная; от ±0,3 до ±0,699 – средняя; от 0 до ±0,299 – слабая);
  • направление связи (прямая или обратная).

Цели корреляционного анализа

Корреляционный анализ не позволяет установить причинную зависимость между исследуемыми переменными.

Он проводится с целью:

  • установления зависимости между переменными;
  • получения определенной информации о переменной на основе другой переменной;
  • определения тесноты (связи) этой зависимости;
  • определение направления установленной связи.

Методы корреляционного анализа


Данный анализ может выполняться с использованием:

  • метода квадратов или Пирсона;
  • рангового метода или Спирмена.

Метод Пирсона применим для расчетов требующих точного определения силы, существующей между переменными. Изучаемые с его помощью признаки должны выражаться только количественно.

Для применения метода Спирмена или ранговой корреляции нет жестких требований в выражении признаков – оно может быть, как количественным, так и атрибутивным. Благодаря этому методу получается информация не о точном установлении силы связи, а имеющая ориентировочный характер.

В рядах переменных могут содержаться открытые варианты. Например, когда стаж работы выражается такими значениями, как до 1 года, более 5 лет и т.д.

Коэффициент корреляции

Статистическая величина характеризующая характер изменения двух переменных получила название коэффициента корреляции либо парного коэффициента корреляции. В количественном выражении он колеблется в пределах от -1 до +1.

Наиболее распространены коэффициенты:

  • Пирсона – применим для переменных принадлежащих к интервально шкале;
  • Спирмена – для переменных порядковой шкалы.

Ограничения использования коэффициента корреляции

Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:

  • в распоряжении имеется достаточное количество значений переменной (25-100 пар наблюдений);
  • между изучаемыми переменными установлено, например, квадратичное соотношение, а не линейное;
  • в каждом случае данные содержат больше одного наблюдения;
  • наличие аномальных значений (выбросов) переменных;
  • исследуемые данные состоят из четко выделяемых подгрупп наблюдений;
  • наличие корреляционной связи не позволяет установить какая из переменных может рассматриваться в качестве причины, а какая – в качестве следствия.

Проверка значимости корреляции

Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.

Наиболее распространенным методом определения значимости корреляции является определение критерия Стьюдента.

Его значение сравнивается с табличным, количество степенней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.

При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).

Ранги Спирмена

Коэффициент ранговой корреляции Спирмена позволяет статистически установить наличие связи между явлениями. Его расчет предполагает установление для каждого признака порядкового номера – ранга. Ранг может быть возрастающим либо убывающим.

Количество признаков, подвергаемых ранжированию, может быть любым. Это достаточно трудоемкий процесс, ограничивающий их количество. Затруднения начинаются при достижении 20 признаков.

Для расчета коэффициента Спирмена пользуются формулой:

в которой:

n – отображает количество ранжируемых признаков;

d – не что иное как разность между рангами по двум переменным;

а ∑(d2) – сумма квадратов разностей рангов.

Применение корреляционного анализа в психологии

Статистическое сопровождение психологических исследований позволяет сделать их более объективными и высоко репрезентативными. Статистическая обработка данных полученных в ходе психологических экспериментов способствует извлечению максимума полезной информации.

Наиболее широкое применение в обработке их результатов получил корреляционный анализ.

Уместным является проведение корреляционного анализа результатов, полученных при проведении исследований:

  • тревожности (по тестам R. Temml, M. Dorca, V. Amen);
  • семейных взаимоотношений («Анализ семейных взаимоотношений» (АСВ) опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • уровня интернальности-экстернальности (опросник Е.Ф. Бажина, Е.А. Голынкиной и А.М. Эткинда);
  • уровня эмоционального выгорания у педагогов (опросник В.В. Бойко);
  • связи элементов вербального интеллекта учащихся при разно профильном обучении (методика К.М. Гуревича и др.);
  • связи уровня эмпатии (методика В.В. Бойко) и удовлетворенностью браком (опросник В.В. Столина, Т.Л. Романовой, Г.П. Бутенко);
  • связи между социометрическим статусом подростков (тест Jacob L. Moreno) и особенностями стиля семейного воспитания (опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • структуры жизненных целей подростков, воспитанных в полных и неполных семьях (опросник Edward L. Deci, Richard M. Ryan Ryan).

Краткая инструкция к проведению корреляционного анализа по критерию Спирмена

Проведение корреляционного анализа с использованием метода Спирмена выполняется по следующему алгоритму:

  • парные сопоставимые признаки располагаются в 2 ряда, один из которых обозначается с помощью Х, а другой У;
  • значения ряда Х располагаются в порядке возрастания либо убывания;
  • последовательность расположения значений ряда У определяется их соответствием значений ряда Х;
  • для каждого значения в ряду Х определить ранг — присвоить порядковый номер от минимального значения к максимальному;
  • для каждого из значений в ряду У также определить ранг (от минимального к максимальному);
  • вычислить разницу (D) между рангами Х и У, прибегнув к формуле D=Х-У;
  • полученные значения разницы возводятся в квадрат;
  • выполнить суммирование квадратов разниц рангов;
  • выполнить расчеты по формуле:

Пример корреляции Спирмена

Необходимо установить наличие корреляционной связи между рабочим стажем и показателем травматизма при наличии следующих данных:

Наиболее подходящим методом анализа является ранговый метод, т.к. один из признаков представлен в виде открытых вариантов: рабочий стаж до 1 года и рабочий стаж 7 и более лет.

Решение задачи начинается с ранжирования данных, которые сводятся в рабочую таблицу и могут быть выполнены вручную, т.к. их объем не велик:

Рабочий стаж Число травм Порядковые номера (ранги) Разность рангов Квадрат разности рангов
d(х-у)
до 1 года 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 и более 6 5 1 +4 16
Σ d2 = 38,5

Появление дробных рангов в колонке связано с тем, что в случае появления вариант одинаковых по величине находится среднее арифметическое значение ранга. В данном примере показатель травматизма 12 встречается дважды и ему присваиваются ранги 2 и 3, находим среднее арифметическое этих рангов (2+3)/2= 2,5 и помещаем это значение в рабочую таблицу для 2 показателей.
Выполнив подстановку полученных значений в рабочую формулу и произведя несложные расчёты получаем коэффициент Спирмена равный -0,92

Отрицательное значение коэффициента свидетельствует о наличии обратной связи между признаками и позволяет утверждать, что небольшой стаж работы сопровождается большим числом травм. Причем, сила связи этих показателей достаточно большая.
Следующим этапом расчётов является определение достоверности полученного коэффициента:
рассчитывается его ошибка и критерий Стьюдента