Нехай з допомогою мірного випадкового вектора, тобто сукупність фіксованого положення випадкових величин (вимірних дійсних функцій).до -x=(X1,...,Xj,...,Xk)k−
Розглянемо багато таких векторів, скажімо, та індексуємо ці вектори на , так, скажімоni=1,...,n
xi=(X1i,...,Xji,...,Xki)
і розглядаємо їх як колекцію під назвою "зразок", . Тоді ми називаємо кожен мірний вектор «спостереженням» (хоча він дійсно стає таким лише коли ми вимірюємо і записуємо реалізацію випадкових змінних).
S=(x1,...,xi,...,xn)k−
Спершу розглянемо випадок, коли існує або функція маси ймовірностей (PMF), або функція щільності ймовірності (PDF), а також об'єднаємо такі функції. Позначимо через спільний PMF або спільний PDF кожного випадкового вектора, і спільний PMF або спільний PDF всіх цих векторів разом. fi(xi),i=1,...,nf(x1,...,xi,...,xn)
Тоді вибірку називають "незалежною вибіркою", якщо виконується наступна математична рівність:S
f(x1,...,xi,...,xn)=∏i=1nfi(xi),∀(x1,...,xi,...,xn)∈DS
де - спільний домен, створений випадковими векторами / спостереженнями.DSn
Це означає, що "спостереження" є "спільно незалежними", (в статистичному сенсі, або "незалежними за вірогідністю", як це було колишньою приказкою, яку досі іноді можна побачити). Звичка просто називати їх "незалежними спостереженнями".
Зауважимо, що властивість статистичної незалежності тут знаходиться над показником , тобто між спостереженнями. Це не пов'язано з тим, які імовірнісні / статистичні співвідношення між випадковими змінними у кожному спостереженні (у загальному випадку ми розглядаємо тут, де кожне спостереження є багатовимірним).i
Зауважимо також, що у випадках, коли у нас є безперервні випадкові величини без щільності, вищесказане може бути виражене через функції розподілу.
Ось що означає "незалежні спостереження" . Це точно визначена властивість, виражена в математичному виразі. Давайте подивимося, з чого це випливає .
ДЕЯКІ НАСЛІДКИ ВІДБУДЖЕННЯ НЕЗАЛЕЖНИХ ЗАБЕЗПЕЧЕНЬ
A. Якщо два спостереження є частиною групи спільно незалежних спостережень, вони також є "парними незалежними" (статистично),
f(xi,xm)=fi(xi)fm(xm)∀i≠m,i,m=1,...,n
Це, в свою чергу, означає, що умовні файли PMF / PDF дорівнюють "граничним"
f(xi∣xm)=fi(xi)∀i≠m,i,m=1,...,n
Це, наприклад, узагальнює багато аргументів, обумовлених чи обумовлюючих
f(xi,xℓ∣xm)=f(xi,xℓ),f(xi∣xm,xℓ)=fi(xi)
тощо, якщо індекси зліва відрізняються від індексів праворуч від вертикальної лінії.
Це означає, що якщо ми реально спостерігаємо одне спостереження, ймовірності, що характеризують будь-яке інше спостереження вибірки, не змінюються. Що стосується прогнозування , незалежний зразок не є нашим найкращим другом. Ми вважаємо за краще мати залежність, щоб кожне спостереження могло допомогти нам сказати щось більше про будь-яке інше спостереження.
B. З іншого боку, незалежна вибірка має максимальний інформаційний зміст. Кожне спостереження, будучи незалежним, несе інформацію, про яку повністю або частково не можна зробити висновок будь-якого іншого спостереження у вибірці. Таким чином, загальна сума є максимальною, порівняно з будь-якою порівнянною вибіркою, де існує деяка статистична залежність між деякими спостереженнями. Але від чого корисна ця інформація, якщо вона не може допомогти нам покращити наші прогнози?
Ну, це непряма інформація про ймовірності, що характеризують випадкові змінні у вибірці. Чим більше цих спостережень мають загальні характеристики (загальний розподіл ймовірностей у нашому випадку), тим більше ми можемо розкрити їх, якщо наш зразок не залежить.
Іншими словами, якщо зразок є незалежним і "однаково розподілений", означає
fi(xi)=fm(xm)=f(x),i≠m
це найкращий можливий зразок, щоб отримати інформацію не тільки про спільний спільний розподіл ймовірностей , але і про граничні розподіли випадкових змінних, що складаються з кожного спостереження, скажімо, . f(x)fj(xji)
Отже, хоча , так нульова додаткова прогнозова сила щодо фактичної реалізації , з незалежним і однаково розподіленим зразком, ми в кращому випадку положення для розкриття функцій (або деяких його властивостей), тобто граничних розподілів.f(xi∣xm)=fi(xi)xi fi
Отже, що стосується оцінки (яка іноді використовується як загальний термін, але тут вона повинна відрізнятися від концепції прогнозування ), незалежний зразок є нашим "найкращим другом", якщо він поєднується з "ідентично розподіленим" "власність.
C. З цього випливає, що незалежна вибірка спостережень, де кожне характеризується абсолютно різним розподілом ймовірностей, без яких-небудь загальних характеристик, є настільки ж марним набором інформації, як і його можна отримати (звичайно, кожна інформація сама по собі є гідно, проблема полягає в тому, що разом їх не можна поєднувати, щоб запропонувати щось корисне). Уявіть зразок, що містить три спостереження: одне містить (кількісні характеристики) фрукти з Південної Америки, інше, що містить гори Європи, і третє, що містить одяг з Азії. Досить цікаві інформаційні фрагменти всіх трьох - але разом, як зразок, не можуть зробити нічого статистично корисного для нас.
По-іншому, необхідною і достатньою умовою, щоб незалежна вибірка була корисною, полягає в тому, що спостереження мають спільне деякі статистичні характеристики. Ось чому в статистиці слово "зразок" не є синонімом "збирання інформації" взагалі, а "збору інформації про суб'єкти, які мають деякі загальні характеристики".
ЗАСТОСУВАННЯ ДО ПРИКЛАДУ ДАНИХ ОП
Відповідаючи на запит користувача @gung, давайте розглянемо приклад ОП з урахуванням сказаного. Ми обгрунтовано припускаємо, що ми перебуваємо в школі з більш ніж двома вчителями та понад шести учнями. Отже, а) ми відбираємо вибірку як учень, так і вчителів; б) включаємо в наш набір даних оцінку, що відповідає кожній комбінації вчитель-учень.
А саме, оцінки не є "вибірками", вони є наслідком вибірки, яку ми робили для вчителів та учнів. Тому доцільно трактувати випадкову змінну (= оцінка) як "залежну змінну", тоді як учні ( ) та вчителі - "пояснювальні змінні" (не всі можливі пояснювальні змінні, лише деякі ). Наш зразок складається з шести спостережень, які ми чітко пишемо, якGPTS=(s1,...,s6)
s1=(T1,P1,G1)s2=(T1,P2,G2)s3=(T1,P3,G3)s3=(T2,P4,G4)s4=(T2,P5,G5)s5=(T2,P6,G6)
За висловленим припущенням "учні не впливають один на одного", ми можемо вважати змінні незалежно розподіленими. При невисловленому припущенні, що "всі інші фактори", які можуть впливати на Оцінку, не залежать один від одного, ми також можемо вважати змінні незалежними один від одного.
Нарешті, за невисловленим припущенням, що вчителі не впливають один на одного, ми можемо вважати змінні статистично незалежними між собою.PiT 1 , T 2Gi
T1,T2
Але незалежно від того, які причинно-конструктивні припущення ми зробимо стосовно відношення вчителів та учнів , залишається фактом, що спостереження містять однакову випадкову змінну ( ), тоді як спостереження також містить ту саму випадкову змінну ( ). T 1 s 4 , s 5 , s 6 T 2s1,s2,s3T1s4,s5,s6T2
Уважно зауважте різницю між "однаковою випадковою змінною" та "двома різними випадковими змінними, які мають однакові розподіли".
Тож навіть якщо припустити, що "вчителі НЕ впливають на учнів", то все-таки наш зразок, як визначено вище, не є самостійним зразком, тому що статистично залежать від , тоді як статистично залежать через . T 1 s 4 , s 5 , s 6 T 2s1,s2,s3T1s4,s5,s6T2
Припустимо, що ми виключаємо випадкову змінну "вчитель" з нашої вибірки. Чи є зразок (учень, клас) з шести спостережень, незалежним зразком?
Тут припущення, які ми зробимо, стосуються того, який структурний зв’язок між вчителями, учнями та класами має значення.
По-перше, чи впливають викладачі безпосередньо на випадкову змінну "Оцінка", можливо, через "ставлення / стилі оцінювання"? Наприклад, може бути "жорстким грейдером", а - ні. У такому випадку "не бачачи" змінну "Вчитель" не робить вибірку незалежною, оскільки тепер залежать, завдяки загальному джерелу впливу, (і аналогічно для інших трьох ). T 2 G 1 , G 2 , G 3 T 1T1T2G1,G2,G3T1
Але скажіть, що вчителі в цьому відношенні однакові. Тоді за висловленим припущенням "вчителі впливають на учнів" ми знову зазначимо, що перші три спостереження залежать одне від одного, тому що вчителі впливають на учнів, які впливають на оцінки, і ми досягаємо того самого результату, хоча і опосередковано в цьому випадку (як і для інші три). Отже, знову ж таки вибірка не є незалежною.
СЛУЧАЙ ГЕНДЕРУ
Тепер давайте зробимо зразок (шестикласник) шестимісних спостережень "умовно незалежним щодо вчителя" (див. Інші відповіді), припустивши, що всі шість учнів насправді є одним і тим же вчителем. Але додатково включимо до вибірки випадкову змінну " = стать", яка традиційно приймає два значення ( ), а останнім часом почала приймати більше. Наш знову тривимірний шість-спостережувальний зразок заразGeM,F
s1=(Ge1,P1,G1)s2=(Ge2,P2,G2)s3=(Ge3,P3,G3)s3=(Ge4,P4,G4)s4=(Ge5,P5,G5)s5=(Ge6,P6,G6)
Уважно зауважте, що те, що ми включили в опис вибірки щодо гендерної ознаки, - це не фактичне значення, яке воно бере для кожного учня, а випадкова змінна «Стать» . Погляньте на початок цієї дуже довгої відповіді: Зразок визначається не як сукупність чисел (або фіксованих числових чи взагалі не значень), а як сукупність випадкових змінних (тобто функцій).
Тепер, чи впливає стать одного учня (структурно чи статистично) на стать другого учня? Ми можемо справедливо стверджувати, що це не так. Отже, з цього погляду змінні не залежать. Чи впливає стать учня , якимось чином безпосередньо на іншого учня ( )? Хм, є бойові навчальні теорії, якщо я згадаю про це. Отже, якщо припустити, що це не так , то відключається це ще одне можливе джерело залежності між спостереженнями. Нарешті, чи впливає стать учня безпосередньо на оцінки іншого учня? якщо ми стверджуємо, що це не так, ми отримуємо незалежну вибірку 1 Г е 1 P 2 , P 3 , . . .Gei1Ge1P2,P3,... (за умови, що всі учні мають одного вчителя).