Вимоги цих типів питань вражають мене як трохи химерним. Ось математичне поняття / формула, але я хочу поговорити про це в якомусь контексті, повністю позбавленому математичних символів. Я також думаю, що слід констатувати, що фактична алгебра, необхідна для розуміння формул, я думаю, повинна навчатися більшості людей до вищої освіти (розуміння матричної алгебри не потрібно, достатньо просто простої алгебри).
Отже, спочатку замість того, щоб повністю ігнорувати формулу і говорити про неї у деяких магічних та евристичних типах аналогій, давайте просто подивитися формулу і спробувати пояснити окремі компоненти невеликими кроками. Різниця в термінах коваріації та кореляції при перегляді формул повинна стати зрозумілою. Якщо говорити з точки зору аналогій та евристики, я підозрюю, що у багатьох ситуаціях затьмариться дві відносно прості концепції та їх відмінності.
Отже, давайте почнемо з формули коваріації вибірки (це я щойно взяв і прийняв із вікіпедії);
1n - 1∑нi = 1( хi- х¯) ( уi- у¯)
Щоб швидше досягти всіх, давайте чітко визначити всі елементи та операції у формулі.
- y iхi та це кожне вимірювання двох окремих ознак одного спостереженняуi
- ˉ yх¯ і - це засоби (або середні значення) кожного атрибутау¯
- Для , скажімо, це означає, що ми ділимо кінцевий результат на . n-11n - 1n - 1
- i n∑нi = 1 для деяких може бути іноземним символом, тому, ймовірно, було б корисно пояснити цю операцію. Це просто сума всіх розділіть спостереження і є загальна кількість спостережень.iн
На цьому етапі я можу запропонувати простий приклад, щоб поставити обличчя на елементи та операції, так би мовити. Так, наприклад, давайте просто скласти таблицю, де кожен рядок відповідає спостереженню (а і позначені відповідним чином). Можливо, можна зробити ці приклади більш конкретними (наприклад, означає вік, а - вагу), але для нашого обговорення це не має значення.y x yхуху
x y
---
2 5
4 8
9 3
5 6
0 8
У цей момент, якщо ви вважаєте, що сума операції у формулі може бути не повністю зрозуміла, ви можете ввести її ще раз у набагато простішому контексті. Скажіть просто, що - це те саме, що говорити в цьому прикладі;∑нi = 1( хi)
x
--
2
4
9
5
+ 0
--
20
Тепер цей безлад слід очистити, і ми можемо пропрацювати другу частину формули . Тепер, припускаючи, що люди вже знають, що означають, та , і я б сказав, будучи лицемірними щодо моїх власних коментарів раніше у публікації, можна просто посилатися на середнє значення з точки зору проста евристика (наприклад, середина розподілу). Потім можна просто взяти цей процес по одній операції за раз. Заява( хi- х¯) ( уi- у¯)х¯y¯(xi−x¯)просто вивчає відхилення / відстань між кожним спостереженням та середнє значення всіх спостережень для даного атрибута. Отже, коли спостереження знаходиться далі від середнього значення, цій операції буде надано більше значення. Потім можна звернутися до наведеної приклади таблиці та просто продемонструвати операцію на векторі спостережень.x
x x_bar (x - x_bar)
2 4 -2
4 4 0
9 4 5
5 4 1
0 4 -4
Операція однакова для вектора, але тільки для підкріплення ви можете також представити цю операцію.y
y y_bar (y - y_bar)
5 6 -1
8 6 2
3 6 -3
6 6 0
8 6 2
Тепер умови та не повинні бути неоднозначними, і ми можемо перейти до наступної операції, ці результати разом, . Як зазначає Гунг у коментарях, це часто називають перехресним продуктом (можливо, корисним прикладом, щоб повернути, якщо вводити основну матричну алгебру для статистики).(xi−x¯)(yi−y¯)(xi−x¯)⋅(yi−y¯)
Візьміть до уваги, що відбувається при множенні, якщо два спостереження обидва - велика відстань вище середнього, то отримане спостереження матиме ще більше позитивне значення (те ж саме, якщо обидва спостереження знаходяться на великій відстані нижче середньої, як множення двох негативів дорівнює позитивному). Також зауважте, що якщо одне спостереження вище середнього, а інше значно нижче середнього, отримане значення буде великим (в абсолютних показниках) і від'ємним (як позитивний раз, від'ємник дорівнює негативному числу). Нарешті зауважте, що коли значення дуже близьке до середнього для будь-якого спостереження, множення двох значень призведе до невеликої кількості. Знову ми можемо просто представити цю операцію в таблиці.
(x - x_bar) (y - y_bar) (x - x_bar)*(y - y_bar)
-2 -1 2
0 2 0
5 -3 -15
1 0 0
-4 2 -8
Тепер, якщо в кімнаті є якісь статистики, вони повинні кипіти з очікуванням в цей момент. Ми можемо побачити всі окремі елементи, що таке коваріація, і як вона розраховується, вступають у гру. Тепер все, що нам потрібно зробити, це підбити підсумковий результат у попередній таблиці, розділити на і вуаля , коваріація вже не повинна бути містичною (усі з лише визначенням одного грецького символу).n−1
(x - x_bar)*(y - y_bar)
-----------------------
2
0
-15
0
+ -8
-----
-21
-21/(5-1) = -5.25
У цей момент ви можете підкріпити, звідки походить 5, але це має бути таким же простим, як повернення до таблиці та підрахунок кількості спостережень (давайте знову залишити різницю між вибіркою та кількістю населення в інший час).
Тепер коваріація сама по собі нам не дуже говорить (може, але в цьому моменті непотрібно вдаватися до будь-яких цікавих прикладів, не вдаючись до магічних, невизначених посилань на аудиторію). У хорошому випадку ви не будете реально продавати, чому нам байдуже, що таке коваріація, за інших обставин, ви можете просто сподіватися, що ваша аудиторія потрапить у полон, і візьмете на це слово. Але, продовжуючи розвивати різницю між тим, що таке коваріація, і тим, що відповідає, ми можемо просто повернутися до формули кореляції. Щоб запобігти фобії грецького символу, можливо, просто скажіть є загальним символом, який використовується для представлення кореляції.ρ
ρ=Cov(x,y)Var(x)Var(y)√
Знову повторю, чисельник у попередній формулі - це просто коваріація, як ми нещодавно визначили, а знаменник - квадратний корінь добутку дисперсії кожного окремого ряду. Якщо вам потрібно визначити саму дисперсію, ви можете просто сказати, що дисперсія - це те саме, що коваріація ряду з самим собою (тобто ). І всі ті самі поняття, які ви ввели з коваріацією, застосовуються (тобто, якщо серія має багато значень, далеких від її середнього, вона матиме велику дисперсію). Можливо, тут зауважте, що серія також не може мати негативну дисперсію (яка логічно повинна випливати з математики, представленої раніше).Cov(x,x)=Var(x)
Тож єдині нові компоненти, які ми ввели, знаходяться в знаменнику . Отже, ми ділимо щойно обчислену коваріацію на добуток дисперсій кожної серії. Можна звернутися до трактування того, чому поділ на завжди призведе до значення від -1 до 1, але я підозрюю, що нерівність Коші-Шварца слід залишити з порядку денного для ця дискусія. Отже, я знову лицемір і вдаюсь до деяких, прийміть моє слово , але в цей момент ми можемо представити всі причини, чому ми використовуємо коефіцієнт кореляції. Потім можна пов'язати ці уроки з математики назад до евристики, наведеної в інших твердженнях, таких як відповідь Пітера ФломаVar(x)Var(y)Var(x)Var(y)−−−−−−−−−−−√до одного з інших питань. Незважаючи на те, що це було піддано критиці за введення концепції в термінах причинно-наслідкових висловлювань, це заняття має бути на порядку денному також в якийсь момент.
Я розумію, що за деяких обставин такий рівень лікування не був би відповідним. Сенат потребує резюме виконавців . У цьому випадку добре ви можете посилатися на просту евристику, яку люди використовували в інших прикладах, але Рим не був побудований за день. А сенатові, котрий просить підвести підсумки, якщо у вас так мало часу, можливо, вам слід просто взяти моє слово на це і не обійтися формальностями аналогій і пунктів.