загрузка...
загрузка...
Рангова кореляція - Статистика PDF Друк e-mail
Статистика - Статистика - Герасименко С. С., Головач А. В., Єріна А. М.

7.4. Рангова кореляція

Взаємозв’язок між ознаками, які можна зранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Рангами називають числа натурального ряду, які згідно зі значеннями ознаки надаються елементам сукупності і певним чином упорядковують її. Ранжування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній — найбільшому або навпаки. Кількість рангів дорівнює обсягу сукупності. Очевидно, зі збільшенням обсягу сукупності ступінь «розпізнаваності» елементів зменшується. З огляду на те, що рангова кореляція не потребує додержання будь-яких математичних передумов щодо розподілу ознак, зокрема вимоги нормальності розподілу, рангові оцінки щільності зв’язку доцільно використовувати для сукупностей невеликого обсягу.

Ранги, надані елементам сукупності за ознаками х і у , позначають відповідно Rx j та Ry j . Залежно від ступеня зв’язку між ознаками певним чином співвідносяться й ранги. При прямому функціональному зв’язку Rx j = Ry j , тобто відхилення між рангами d j Rx j –  Ry j = 0, отже, і сума квадратів відхилень . При зворотному функціональному зв’язку  де n
число рангів. Якщо зв’язок між ознаками відсутній,  являє собою середню арифметичну цих крайніх значень:

,

а отже,

.

Спираючись на зазначену математичну тотожність, К. Спір­мен запропонував формулу для коефіцієнта рангової кореляції:

.

Цей коефіцієнт має такі самі властивості, як і лінійний коефіцієнт кореляції: змінюється в межах від – 1 до + 1, водночас оцінює щільність зв’язку та вказує на його напрям.

Визначимо коефіцієнт рангової кореляції за даними експертних оцінок ефективності економіки та ступеня політичного ризику для семи країн з перехідною економікою (табл. 7.7). Оскільки експертні оцінки представлені балами, необхідно провести ранжування країн. За оцінками ефективності економіки країні з найбільшим балом надається ранг 1, з найменшим — ранг n = 7. За оцінками ступеня політичного ризику, навпаки, ранг 1 надається країні з найменшим ризиком, а ранг 7 — країні з найбільшим ризиком.

Таблиця 7.7

ДО РОЗРАХУНКУ КОЕФІЦІЄНТА РАНГОВОЇ КОРЕЛЯЦІЇ


з/п

Експертні оцінки, балів

Ранги

d j = Rx j – Ry j

Ефективність економіки (mах = 10)

Ступінь політичного ризику (mах = 100)

Rx j

Ry j

1

6,6

64,5

1

7

–6

36

2

5,8

57,8

2

6

–4

16

3

2,9

23,6

6

1

5

25

4

3,4

36,2

5

4

1

1

5

4,5

45,3

3

5

–2

4

6

2,7

28,4

7

2

5

25

7

4,2

32,7

4

3

1

1

Разом

´

´

´

´

´

108

Сума квадратів відхилень рангів , а коефіцієнт рангової кореляції

.

Значення коефіцієнта рангової кореляції свідчить про наявність зворотного і досить високого рівня зв’язку між ефективністю економіки і ступенем політичного ризику. Критичне значення коефіцієнта рангової кореляції (табл. 7.8) для рівня істотності a = 0,05 і n = 7  Отже, з імовірністю 0,95 істотність зв’язку доведено.

Таблиця 7.8

КРИТИЧНІ ЗНАЧЕННЯ КОЕФІЦІЄНТА
РАНГОВОЇ КОРЕЛЯЦІЇ СПІРМЕНА ПРИ  = 0,05

Обсяг вибірки n

5

6

7

8

9

10

11

12

0,90

0,83

0,71

0,64

0,60

0,56

0,53

0,50

Якщо два і більше елементів сукупності мають однакові значення ознаки, їм надається середній ранг. Нехай, наприклад, друге за розміром значення ознаки мають три елементи сукупності (№ 2, 3, 4), тоді всім їм надається ранг  а щільність зв’язку можна оцінити за формулою лінійного коефіцієнта кореляції.

7.5. Оцінка узгодженості
варіації атрибутивних ознак

Взаємозв’язки між атрибутивними ознаками аналізуються на підставі таблиць взаємної спряженості (співзалежності). Як приклад розглянемо табл. 7.9, в якій наведено результати соціологічного опитування населення щодо намірів прилучитися до ринку цінних паперів. Тих, хто не боїться ризикувати, класифікували як ризикованих інвесторів, тих, хто не уявляє ризику без гарантій, — обережними, а хто ризику уникає взагалі, — неризикованими.

Частоти комбінаційного розподілу респондентів за віком і схильністю до ризику концентруються навколо діагоналі з верхнього лівого кута в нижній правий. Серед молодих більшість готова ризикувати на ринку цінних паперів, у середній віковій групі готовий ризикувати один з п’яти, а половина не уявляє ризику без гарантій, у третій віковій групі на одного обережного припадають два неризиковані.

Таблиця 7.9

РОЗПОДІЛ РЕСПОНДЕНТІВ ЗА ВІКОМ І СХИЛЬНІСТЮ ДО РИЗИКУ

Вік х , років

Тип інвестора у

Разом f i 0

Ризикований

Обережний

Неризикований

16—30

24

12

4

40

31—50

20

50

30

100

51 і більше

6

18

36

60

Разом f 0 j

50

80

70

200

Характер розподілу частот, концентрація їх уздовж головної діагоналі свідчать про наявність стохастичного зв’язку між віком і схильністю до ризику.

Оцінка щільності стохастичного зв’язку ґрунтується на відхиленнях частот (часток) умовного та безумовного розподілів, тобто на відхиленнях фактичних частот f ij від теоретичних F ij , пропорційних до підсумкових:

,

де f i 0 — підсумкові частоти за ознакою x ; f 0 j — підсумкові частоти за ознакою ;  — обсяг сукупності .

Якби схильність до ризику не залежала від віку, то кількість ризикованих серед молоді становила б

,

обережних у другій віковій групі

,

неризикованих у третій віковій групі

.

Абсолютну величину відхилень фактичних частот f ij від пропорційних F ij характеризує квадратична спряженість c 2 Пірсона:

.

За відсутності стохастичного зв’язку c 2 = 0. На основі розподілу ймовірностей c 2 перевіряється істотність зв’язку. Критичні значення c 2 для a = 0,05 і числа ступенів свободи k = ( m x – 1)
( m y – 1) наведено в табл. 7.10. Так, для k = (3 – 1) (3 – 1) = 4 критичне значення  Фактичне значення

що значно перевищує критичне, а отже, з імовірністю 0,95 істотність зв’язку між віком і схильністю до ризику доведено.

Відносною мірою щільності стохастичного зв’язку слугує коефіцієнт взаємної спряженості (співзалежності). За умови, що m x m y використовують формулу Чупрова:

,

де m x — число груп за ознакою x ; m y — число груп за ознакою y . Оскільки за відсутності зв’язку між ознаками c 2 = 0, то і С = 0. При функціональному зв’язку C ® 1. У разі, коли m x ¹ m x , віддають перевагу коефіцієнту спряженості Крамера:

,

де m min — мінімальне число груп ( m x або m y ).

У нашому прикладі m x = m y = 3, а тому наведені формули коефіцієнта взаємної спряженості тотожні:

,

що свідчить про наявність зв’язку.

Таблиця 7.10

КРИТИЧНІ ЗНАЧЕННЯ

k

1

2

3

4

5

6

7

8

3,84

5,99

7,81

9,49

11,07

12,59

14,07

15,51

Якщо обидві взаємозв’язані ознаки альтернативні, тобто кількість груп m x = m y = 2, то за відсутності зв’язку добутки діагональних частот однакові: f 11 f 22 = f 12 f 21 . Саме на відхиленнях добут­ків частот ґрунтуються характеристики зв’язку:

,

.

У літературі зі статистики коефіцієнт  для 4-клітинкової таблиці називається коефіцієнтом контингенції або асоціації . Очевидно, що за змістом він ідентичний коефіцієнту взаємної спряженості, а з c 2 пов’язаний функціонально: c 2 = nC 2 .

За допомогою коефіцієнта контингенції оцінимо щільність зв’язку між шкідливою звичкою палити і хворобами легенів (табл. 7.11).

Таблиця 7.11

РОЗПОДІЛ ПАЦІЄНТІВ КЛІНІКИ ЗА РЕЗУЛЬТАТАМИ ЛЕГЕНЕВИХ ПРОБ

Наявність звички палити

Результати легеневих проб

Разом

Аномальні

Нормальні

Палить

20

5

25

Не палить

10

15

25

Разом

30

20

50

.

Значення  перевищує критичне . Істотність зв’язку доведено з імовірністю 0,95.

Корисною мірою при аналізі 4-клітинкових таблиць взаємної спряженості є відношення перехресних добутків або відношення шансів

Відношення шансів характеризує міру відносного ризику.
У нашому прикладі

.

Отже, імовірність легеневих хвороб у тих, хто палить, у 6 разів вища порівняно з тими, хто не палить.

Зауважимо, що методи аналізу таблиць взаємної спряженості можна використати і для кількісних ознак. Будь-які технічні перешкоди відсутні. Проте слід пам’ятати, що коефіцієнт спряженості оцінює лише узгодженість фактичного розподілу з пропорційним. При переставлянні рядків чи стовпців значення коефіцієнта С не зміниться. Міри щільності кореляційного зв’язку — коефіцієнт детермінації R 2 і кореляційне відношення h 2 — оцінюють не лише узгодженість частот, а й порядок, послідовність, в якій поєднуються різні значення ознак. Отже, ці характеристики зв’язку більш потужні. А загалом вибір методу вимірювання зв’язку і характеристик його щільності має ґрунтуватись на попередньому теоретичному аналізі суті явищ, характеру взаємозв’язків, наявній інформації.

завдання для самоконтролю

1. Зазначте, які з наведених залежностей соціально-економічних явищ є функціональними, а які — стохастичними:

  • попит на легкові автомобілі від наявності їх на ринку і цін;
  • акціонерний капітал компанії від кількості проданих акцій та їх ринкової ціни;
  • урожайність картоплі від якості ґрунту та кількості опадів за рік.

2. У наведених парах ознак визначіть факторні і результативні:

а) розмір податку; розмір прибутку;

б) сукупний дохід сім’ї; заощадження.

3. Як виявляється кореляційний зв’язок? Поясніть його співвідношення зі стохастичним зв’язком.

4. Як визначити ефекти впливу фактора на результат за даними аналітичного групування?

5. Аналітичне групування 36 комерційних банків характеризує зв’язок між розміром капіталу та рівнем його прибутковості. Загальна дисперсія прибутковості капіталу — 25, міжгрупова — 16, кількість груп — 4.

Визначте кореляційне відношення. Поясніть його економічний зміст, перевірте істотність зв’язку з імовірністю 0,95, зробіть висновки.

6. Які функції в аналізі взаємозв’язків виконує рівняння регресії?

7. Зв’язок між процентною ставкою на міжбанківський кредит, %, та терміном надання кредиту, днів, описується рівнянням регресії Y = 18 + 0,5 х . Поясніть зміст параметрів рівняння. Визначіть процентну ставку на 30-денний кредит.

8. Що характеризує коефіцієнт регресії? Чим відрізняється коефіцієнт еластичності від коефіцієнта регресії?

9. Зв’язок між потужністю вугільного пласта, см, і видобутком вугілля на одного робітника очисного вибою за зміну, т, описується рівнянням регресії Y = – 3,6 + 0,15 х. Залишкова дисперсія видобутку вугілля становить 1,2, загальна — 5,4.

Визначіть коефіцієнт детермінації, поясніть його зміст. Перевірте істотність зв’язку з імовірністю 0,95.

10. Лінійний коефіцієнт кореляції між рівнем механізації виробничих процесів і продуктивністю праці становить 0,7. Яка частка варіації продуктивності праці залежить від варіації рівня механізації виробничих процесів?

11. Як оцінити щільність нелінійного зв’язку? Чи можна вважати коефіцієнт детермінації універсальною мірою щільності кореляційного зв’язку? Будь-яку відповідь обґрунтуйте.

12. За допомогою коефіцієнта рангової кореляції оцініть ступінь узгодженості оцінок двох груп експертів на конкурсі професійної майстерності модельєрів. Висновок зробіть з імовірністю 0,95.

Модельєр

Ранг, наданий експертами

художниками

промисловцями

А

5

4

В

1

3

С

6

5

D

3

2

F

2

1

K

4

6

N

7

7

13. Результати вибіркового опитування споживачів щодо сприйняття ними реклами товарів такі:

Враження
від реклами

Кількість опитаних, що

Разом

придбали товар

не придбали товар

Запам’ятали

10

30

40

Не запам’ятали

2

28

30

Разом

12

58

70

Оцініть результативність реклами за допомогою відношення шансів, поясніть його економічний зміст.

14. Усі характеристики щільності зв’язку мають спільні риси. Поясність, які саме.

15. Чим зумовлена необхідність перевірки істотності зв’язку? Як формулюється нульова гіпотеза? За яких умов вона приймається, а за яких — відхиляється?

16. За результатами психодіагностичного тестування дітей частина з них за емоційним станом потребує уваги психологів.

Сімейний стан

Емоційний стан дитини

Разом

у нормі

відхилення від норми

Повна сім’я

90

10

100

Неповна сім’я

60

20

80

Разом

150

30

180

За допомогою коефіцієнта контингенції визначіть ступінь залежності емоційних відхилень у дітей від сімейного стану. Висновок зробіть з імовірністю 0,95.

 

Бібліотека онлайн Lection.com.ua створена для студентів та учнів, які прагнуть вчитися і пізнавати нове. Наша онлайн бібліотека підручників має близько 25 книг, ми намагаємося оновлювати нашу базу підручників кожен місяць. Сподіваємося наш сайт вам подобається. З повагою адміністрація.