Контакти

Рангові кореляції спірмена та кендала. Коефіцієнти рангової кореляції кендала та спірмена. Дивитись що таке "кендала коефіцієнт рангової кореляції" в інших словниках

Коефіцієнт кореляції Кендала використовується у разі, коли змінні представлені двома порядковими шкалами за умови, що пов'язані ранги відсутні. Обчислення коефіцієнта Кендал пов'язане з підрахунком числа збігів та інверсій. Розглянемо цю процедуру з прикладу попереднього завдання.

Алгоритм розв'язання задачі наступний:

    Переоформлюємо дані табл. 8.5 таким чином, щоб один з рядів (у даному випадку ряд x i) виявився ранжованим. Іншими словами, ми переставляємо пари xі y у потрібному порядку та вносимо дані до стовпців 1 і 2 табл. 8.6.

Таблиця 8.6

x i

y i

2. Визначаємо «ступінь ранжованості» 2-го ряду ( y i). Ця процедура проводиться у наступній послідовності:

а) беремо перше значення неранжованого ряду "3". Підраховуємо кількість рангів нижчеданого числа, які більшепорівнюваного значення. Таких значень 9 (числа 6, 7, 4, 9, 5, 11, 8, 12 та 10). Заносимо число 9 у стовпець «збігу». Потім підраховуємо кількість значень, які меншетрьох. Таких значень 2 (ранги 1 та 2); вносимо число 2 до графи «інверсії».

б) відкидаємо число 3 (ми з ним уже попрацювали) і повторюємо процедуру для наступного значення «6»: кількість збігів дорівнює 6 (ранги 7, 9, 11, 8, 12 та 10), число інверсій – 4 (ранги 1, 2 , 4 та 5). Вносимо число 6 до графи «збігу», а число 4 – до графи «інверсії».

в) аналогічно процедура повторюється до кінця ряду; при цьому слід пам'ятати, що кожне відпрацьоване значення виключається з подальшого розгляду (підраховуються тільки ранги, які лежать нижче даного числа).

Примітка

Для того щоб не робити помилок у підрахунках, слід мати на увазі, що з кожним кроком сума збігів та інверсій зменшується на одиницю; це зрозуміло, якщо врахувати, що кожного разу одне значення виключається із розгляду.

3. Підраховується сума збігів (Р)та сума інверсій (Q); дані вносяться в одну і три взаємозамінні формули коефіцієнта Кендалла (8.10). Проводяться відповідні обчислення.

t (8.10)

У нашому випадку:

У табл. XIV Додатків є критичні значення коефіцієнта для даної вибірки: τ кр. = 0,45; 0,59. Емпірично набуте значення порівнюється з табличним.

Висновок

τ = 0,55 > τ кр. = 0,45. Кореляція статистично значуща для 1-го рівня.

Примітка:

За потреби (наприклад, за відсутності таблиці критичних значень) статистична значимість tКендала може бути визначена за формулою наступного виду:

(8.11)

де S * = P - Q+ 1, якщо P< Q , і S * = P - Q - 1, якщо P > Q.

Значення zдля відповідного рівня значимості відповідають мірі Пірсона і знаходяться за відповідними таблицями (додаток не включені. Для стандартних рівнів значимості zкр = 1,96 (для β 1 = 0,95) та 2,58 (для β 2 = 0,99). Коефіцієнт кореляції Кендал є статистично значущим, якщо z > zкр

У нашому випадку S * = P - Q- 1 = 35 і z= 2,40, т. е. початковий висновок підтверджується: кореляція між ознаками статистично достовірна 1-го рівня значимості.

Застосовується виявлення взаємозв'язку між кількісними чи якісними показниками, якщо їх можна ранжировать. Значення показника X виставляють у порядку зростання та надають їм ранги. Ранжують значення показника Y і розраховують коефіцієнт кореляції Кендала:

де S = PQ.

P великимзначенням рангів Y.

Q- сумарна кількість спостережень, наступних за поточними спостереженнями меншимзначенням рангів Y. (Рівні ранги не враховуються!)

Якщо досліджувані дані повторюються (мають однакові ранги), то розрахунках використовується скоригований коефіцієнт кореляції Кендалла:

t- число пов'язаних рангів у ряді X та Y відповідно.

19.З чого слід виходити, визначаючи тему, об'єкт, предмет, мету, завдання та гіпотезу дослідження?

Програма дослідження, як правило, має два розділи: методологічний та процедурний. Перший включає обґрунтування актуальності теми, формулювання проблеми, визначення об'єкта та предмета, цілей та завдань дослідження, формулювання основних понять (категоріального апарату), попередній системний аналіз об'єкта дослідження та висування робочої гіпотези. У другому розділі розкривається стратегічний план дослідження, а також план та основні процедури збирання та аналізу первинних даних.

Насамперед при виборі теми дослідження треба виходити з актуальності. Обґрунтування актуальностівключає вказівку на необхідність та своєчасність вивчення та вирішення проблеми для подальшого розвитку теорії та практики навчання та виховання. Актуальні дослідження дають у відповідь найбільш гострі нині питання, відбивають соціальне замовлення суспільства педагогічної науці, виявляють найважливіші протиріччя, які мають місце у практиці. Критерій актуальності динамічний, рухливий, залежить від часу, урахування конкретних та специфічних обставин. У найзагальнішому вигляді актуальність характеризує ступінь розбіжності між попитом наукові ідеї та практичні рекомендації (для задоволення тієї чи іншої потреби) та пропозиціями, які може дати наука та практика в даний час.

Найбільш переконливим підставою, визначальним тему дослідження, є соціальне замовлення, що відбиває найгостріші, суспільно значущі проблеми, потребують невідкладного рішення. Соціальне замовлення потребує обґрунтування конкретної теми. Зазвичай це аналіз ступеня розробленості питання науці.

Якщо соціальне замовлення випливає з аналізу педагогічної практики, то сама наукова проблемазнаходиться в іншій площині. Вона висловлює основне протиріччя, що має бути дозволено засобами науки. Вирішення проблеми зазвичай і складає мета дослідження.Мета – переформульована проблема.

Формулювання проблеми тягне за собою вибір об'єктадослідження. Їм може бути педагогічний процес, галузь педагогічної дійсності або якесь педагогічне ставлення, що містить у собі протиріччя. Іншими словами, об'єктом може бути все те, що явно чи неявно містить у собі протиріччя та породжує проблемну ситуацію. Об'єкт - те, потім спрямований процес пізнання. Предмет дослідження -частина, бік об'єкта. Це найбільш значущі з практичної чи теоретичної погляду властивості, боку, особливості об'єкта, які підлягають безпосередньому вивченню.

Відповідно до мети, об'єкту та предмету дослідження визначаються дослідні завдання,які, як правило, спрямовані на перевірку гіпотези.Остання є сукупністю теоретично обґрунтованих припущень, істинність яких підлягає перевірці.

Критерій наукової новизнизастосовується для оцінки якості завершених досліджень. Він характеризує нові теоретичні та практичні висновки, закономірності освіти, його структуру та механізми, зміст, принципи та технології, які на даний час не були відомі і не зафіксовані в педагогічній літературі. Новизна дослідження може мати як теоретичне, і практичне значення. Теоретичне значення дослідження полягає у створенні концепції, отриманні гіпотези, закономірності, методу, моделі виявлення проблеми, тенденції, напряму. Практична значущість дослідження полягає у підготовці пропозицій, рекомендацій тощо. Критерії новизни, теоретичної та практичної значимості змінюються залежно від типу дослідження, вони також залежать від часу отримання нового знання.

Одним із факторів, що обмежують застосування критеріїв, заснованих на припущенні нормальності, є обсяг вибірки. До тих пір, поки вибірка досить велика (наприклад, 100 або більше спостережень), можна вважати, що вибірковий розподіл є нормальним, навіть якщо ви не впевнені, що розподіл змінної в популяції є нормальним. Проте, якщо вибірка мала, ці критерії слід використовувати лише за наявності впевненості, що змінна справді має нормальний розподіл. Однак немає способу перевірити це припущення на малій вибірці.

Використання критеріїв, що ґрунтуються на припущенні нормальності, крім того, обмежене шкалою вимірювань (див. розділ Елементарні поняття аналізу даних). Такі статистичні методи, як t-критерій, регресія і т. д. припускають, що вихідні дані є безперервними. Однак є ситуації, коли дані, швидше, просто ранжовані (виміряні в порядковій шкалі), ніж точно виміряні.

Типовий приклад дають рейтинги сайтів в Інтернет: першу позицію займає сайт з максимальною кількістю відвідувачів, другу позицію займає сайт з максимальною кількістю відвідувачів серед сайтів, що залишилися (серед сайтів, з яких видалений перший сайт) і т. д. Знаючи рейтинги, ми можемо сказати, що кількість відвідувачів одного сайту більша за кількість відвідувачів іншого, але наскільки більше, сказати вже не можна. Уявіть, що ви маєте 5 сайтів: А, В, С, D, Е, які розташовуються на 5 перших місць. Нехай у поточному місяці ми мали таку розстановку: А, В, С, D, E, а в попередньому місяці: D, E, А, В, С. Запитують, чи відбулися істотні зміни в рейтингах сайтів чи ні? У даній ситуації, очевидно, ми не можемо використовувати t-критерій, щоб порівняти ці дві групи даних, і переходимо в область специфічних ймовірнісних обчислень (а будь-який статистичний критерій містить ймовірну калькуляцію!). Ми міркуємо приблизно так: наскільки велика ймовірність того, що відмінність у двох розстановках сайтів викликана суто випадковими причинами або ця відмінність занадто велика і не може бути пояснена за рахунок чистої випадковості. У цих міркуваннях ми використовуємо лише ранги або перестановки сайтів і не використовуємо конкретний вид розподілу кількості відвідувачів на них.

Для аналізу малих вибірок і даних, виміряних у бідних шкалах, застосовують непараметричні методи.

Короткий огляд непараметричних процедур

По суті, для кожного параметричного критерію є принаймні одна непараметрична альтернатива.

Загалом, ці процедури потрапляють до однієї з наступних категорій:

  • критерії розходження для незалежних вибірок;
  • критерії відмінності залежних вибірок;
  • оцінка ступеня залежності між змінними.

Взагалі підхід до статистичних критеріїв в аналізі даних має бути прагматичним і не обтяжений зайвими теоретичними міркуваннями. Маючи у своєму розпорядженні комп'ютер із системою STATISTICA, ви легко застосуєте до своїх даних кілька критеріїв. Знаючи про деякі підводні камені методів, ви шляхом експериментування оберете правильне рішення. Розвиток сюжету досить природний: якщо потрібно порівняти значення двох змінних, то ви використовуєте t-критерій. Однак слід пам'ятати, що він заснований на припущенні нормальності та рівності дисперсій у кожній групі. Звільнення від цих припущень призводить до непараметричних тестів, що особливо корисні для малих вибірок.

Розвиток t-критерію призводить до дисперсійного аналізу, який використовується, коли число порівнюваних груп більше двох. Відповідний розвиток непараметричних процедур призводить до непараметричного дисперсійного аналізу, щоправда, значно біднішому, ніж класичний дисперсійний аналіз.

Для оцінки залежності, або, висловлюючись дещо пишномовно, ступеня тісноти зв'язку, обчислюють коефіцієнт кореляції Пірсона. Строго кажучи, його застосування має обмеження, пов'язані, наприклад, з типом шкали, в якій виміряні дані, і нелінійністю залежності, тому як альтернатива використовуються також непараметричні, або так звані рангові, коефіцієнти кореляції, що застосовуються, наприклад, для ранжованих даних. Якщо дані виміряні в номінальній шкалі, їх природно представляти у таблицях спряженості, у яких використовується критерій хи-квадрат Пірсона з різними варіаціями і поправками на точність.

Отже, по суті є лише кілька типів критеріїв та процедур, які потрібно знати та вміти використовувати залежно від специфіки даних. Вам потрібно визначити, який критерій слід застосовувати у конкретній ситуації.

Непараметричні методи є найбільш прийнятними, коли обсяг вибірок малий. Якщо даних багато (наприклад, n >100), часто немає сенсу використовувати непараметричну статистику.

Якщо розмір вибірки дуже малий (наприклад, n = 10 або менше), то рівні значущості тих непараметричних критеріїв, які використовують нормальне наближення, можна розглядати лише як грубі оцінки.

Відмінності між незалежними групами. Якщо є дві вибірки (наприклад, чоловіки та жінки), які потрібно порівняти щодо деякого середнього значення, наприклад, середнього тиску або кількості лейкоцитів у крові, можна використовувати t-тест для незалежних вибірок.

Непараметричними альтернативами цьому тесту є критерій серій Вал'да-Вол'фовіца, Манна-Уітні)/n, де x i - i-е значення, n - число спостережень. Якщо змінна містить негативні значення або нуль (0), геометричне середнє не можна обчислити.

Гармонічне середнє

Гармонійне середнє іноді використовують для усереднення частот. Гармонічне середнє обчислюється за такою формулою: ГС = n/S(1/х i) де ГС - гармонійне середнє, n - число спостережень, х i - значення спостереження з номером i. Якщо змінна містить нуль (0), гармонійне середнє не можна обчислити.

Дисперсія та стандартне відхилення

Вибіркова дисперсія та стандартне відхилення - найчастіше вживані заходи мінливості (варіації) даних. Дисперсія обчислюється як сума квадратів відхилень значень змінної від вибіркового середнього, поділена на п-1 (але не п). Стандартне відхилення обчислюється як квадратний корінь з оцінки дисперсії.

Розмах

Розмах змінної є показником мінливості, що обчислюється як максимум мінус мінімум.

Квартильний розмах

Квартальний розмах, за визначенням, дорівнює верхня квартиль мінус нижня квартиль (75% процентиль мінус 25% процентиль). Так як 75% процентиль (верхня квартиль) - це значення, ліворуч від якого знаходяться 75% спостережень, а 25% процентиль (нижня квартиль) - це значення, ліворуч від якого знаходиться 25% спостереженні, то квартильний розмах являє собою інтервал навколо медіани, який містить 50% спостережень (значення змінної).

Асиметрія

Асиметрія – це характеристика форми розподілу. Розподіл скошений ліворуч, якщо значення асиметрії є негативним. Розподіл скошено праворуч, якщо асиметрія позитивна. Асиметрія стандартного нормального розподілу дорівнює 0. Асиметрія пов'язана з третім моментом і визначається як: асиметрія = n × М 3 /[(n-1) × (n-2) × s 3 ], де М 3 дорівнює: (х i -xсереднє x) 3 s 3 - стандартне відхилення, зведене в третій ступінь, n - число спостережень.

Ексцес

Ексцес - це характеристика форми розподілу, саме міра гостроти його піку (щодо нормального розподілу, ексцес якого дорівнює 0). Як правило, розподіли з гострішим піком, ніж у нормального, мають позитивний ексцес; розподіли, пік яких менш гострий ніж пік нормального розподілу, мають негативний ексцес. Ексцес пов'язаний з четвертим моментом та визначається формулою:

ексцес = /[(n-1) × (n-2) × (n-3) × s 4 ], де M j дорівнює: (х-хсереднє x , s 4 - стандартне відхилення в четвертому ступені, n - число спостережень .

КЕНДАЛУ КОЕФІЦІЄНТ РАНГОВОЇ КОРРЕЛЯЦІЇ

Один із вибіркових заходів залежності двох випадкових величин (ознак) Xі Y,заснована на ранжируванні елементів вибірки (X 1 , Y x), .. ., (Х п, Y n). К. к. н. до. відноситься, таким чином, до рангові статистикита визначається формулою

де r i- У, що належить тій парі ( X, Y), для до-рій Xравен i, S = 2N-(п-1)/2, N-число елементів вибірки, для яких брало одночасно j>i і r j >r i. Завжди В якості вибіркового заходу залежності К. к. н. к. широко використовувався М. Кендалл (М. Kendall, див.).

К. к. н. застосовується для перевірки гіпотези незалежності випадкових величин. Якщо гіпотеза незалежності правильна, то E t =0 і D t =2(2n+5)/9n(n-1). При невеликому обсязі вибірки перевірка статистич. гіпотези незалежності виробляється з допомогою спеціальних таблиць (див. ). При n>10 мають нормальне наближення для розподілу т: якщо

то гіпотеза про незалежність відкидається, інакше приймається. Тут a . - Рівень значимості, u a /2 є відсоткова точка нормального розподілу. К. к. н. к., як і будь-яка , може використовуватися виявлення залежності двох якісних ознак, якщо тільки елементи вибірки можна впорядкувати щодо цих ознак. Якщо X, Yмають спільне нормальне з коефіцієнтом кореляції р, то зв'язок між К. до. і має вигляд:

Див. також Спірмена рангової кореляції, ранговий критерій.

Літ.: Кенделл М., Рангові кореляції, пров. з англ., М., 1975; Ван дер Варден Б. Л., Математична, пров. з ньому., М., 1960; Більшов Л. Н., Смирнов Н. Ст, Таблиці математичної статистики, М., 1965.

А. В. Прохоров.


Математична енциклопедія. - М: Радянська енциклопедія. І. М. Виноградов. 1977-1985.

Дивитись що таке "КЕНДАЛА КОЕФІЦІЄНТ РАНГОВОЇ КОРРЕЛЯЦІЇ" в інших словниках:

    Англ. з ефективним, rank correlation Kendall; ньому. Kendalls Rangkorrelationskoeffizient. Коефіцієнт кореляції, що визначає ступінь відповідності впорядкування всіх пар об'єктів за двома змінними. Антіназі. Енциклопедія соціології, 2009 … Енциклопедія соціології

    КОЕФІЦІЄНТ РАНГОВОЇ КОРРЕЛЯЦІЇ КЕНДАЛУ- англ. соеficient, rank correlation Kendall; ньому. Kendalls Rangkorrelationskoeffizient. Коефіцієнт кореляції, що визначає ступінь відповідності впорядкування всіх пар об'єктів за двома змінними … Тлумачний словник з соціології

    Міра залежності двох випадкових величин (ознак) Xі Y, заснована на ранжируванні незалежних результатів спостережень (X1, Y1), . . ., (Xn, Yn). Якщо ранги значень X розташовані у природному порядку i=1, . . ., п,a Ri ранг Y, відповідний… … Математична енциклопедія

    Коефіцієнт кореляції- (Correlation coefficient) Коефіцієнт кореляції це статистичний показник залежності двох випадкових величин Визначення коефіцієнта кореляції, види коефіцієнтів кореляції, властивості коефіцієнта кореляції, обчислення та застосування. Енциклопедія інвестора

    Залежність між випадковими величинами, яка має, взагалі кажучи, строго функціонального характеру. На відміну від функціональної залежності До., як правило, розглядається тоді, коли одна з величин залежить не тільки від цієї іншої, але і ... Математична енциклопедія

    Кореляція (кореляційна залежність) статистична взаємозв'язок двох чи кількох випадкових величин (чи величин, які можна з деякою допустимою мірою точності вважати такими). При цьому зміни значень однієї або ... Вікіпедія

    Кореляція- (Correlation) Кореляція це статистичний взаємозв'язок двох або кількох випадкових величин Поняття кореляції, види кореляції, коефіцієнт кореляції, кореляційний аналіз, кореляція цін, кореляція валютних пар на Форекс. Енциклопедія інвестора

    Вважають, що початок С. м. в. або, як її часто називають, статистиці «малих п», було покладено в першому десятилітті XX століття публікацією роботи У. Госсета, в якій він помістив t розподіл, постульований отримав трохи пізніше світову ... Психологічна енциклопедія

    Моріс Кендалл Sir Maurice George Kendall Дата народження: 6 вересня 1907(1907 09 06) Місце народження: Кеттерінг, Великобританія Дата смерті … Вікіпедія

    Прогноз- (Forecast) Визначення прогнозу, завдання та принципи прогнозування Визначення прогнозу, завдання та принципи прогнозування, методи прогнозування Зміст Зміст Визначення Основні поняття прогностики Завдання та принципи прогнозування… Енциклопедія інвестора



Сподобалася стаття? Поділіться їй