Запитання з тегом «non-independent»

Дані, події, процеси тощо не є незалежними, якщо знання 1 дає деяку інформацію про стан або значення іншого.

5
Про важливість припущення iid у статистичному навчанні
При статистичному навчанні неявно або явно завжди передбачається, що навчальний набір складається з кортежів введення / відповіді , які незалежно виводяться з того ж спільного розподілу зD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) і відносини, які ми намагаємося зафіксувати за допомогою …

5
Як перевірити нелінійну асоціацію?
Для сюжету 1 я можу перевірити асоціацію між x та y, зробивши просту кореляцію. Для сюжету 2, де зв'язок нелінійний, але чітке співвідношення між x та y є, як я можу перевірити асоціацію та позначити її природу?

5
Значення "позитивної залежності" як умови використання звичайного методу для контролю FDR
Бенджаміні та Хохберг розробили перший (і досі найбільш широко використовується, я думаю,) метод контролю швидкості виявлення помилок (FDR). Я хочу розпочати з купки значень P, кожне для іншого порівняння, і вирішити, які з них досить низькі, щоб їх можна було назвати "відкриттям", контролюючи FDR до заданого значення (скажімо, 10%). Одне …

7
Чи кореляція є рівнозначною асоціації?
Мій професор статистики стверджує, що слово "кореляція" застосовується строго до лінійних зв'язків між змінними, тоді як слово "асоціація" широко застосовується до будь-якого типу відносин. Іншими словами, він стверджує, що термін "нелінійна кореляція" є оксимороном. З того, що я можу зробити з цього розділу в статті Вікіпедії про " Кореляцію та …

1
Властивості PCA для залежних спостережень
Ми зазвичай використовуємо PCA як метод зменшення розмірності для даних, коли випадки вважаються ідентичними Запитання: Які типові нюанси у застосуванні PCA для залежних від неідентифікованих даних? Які приємні / корисні властивості PCA, які зберігаються для даних iid, поставлені під загрозу (або повністю втрачені)? Наприклад, дані можуть бути багатоваріантним часовим рядом, …

1
Зрозуміле мовне значення "залежних" та "незалежних" тестів у літературі з кількома порівняннями?
Як у літературі щодо рівня помилок (FWER), так і щодо помилкового виявлення (FDR), окремі методи контролю FWER або FDR вважаються відповідними залежним або незалежним тестам. Наприклад, у документі 1979 р. "Проста послідовно відхиляюча процедура багаторазового випробування" Холм писав, щоб протиставити його метод посилення Шідака проти його покрокового методу контролю Бонферроні: …

3
Для інтуїції, які приклади реального життя мають неспоріднені, але залежні випадкові величини?
Пояснюючи, чому некорельований не означає незалежних, є кілька прикладів, які передбачають купу випадкових змінних, але всі вони здаються такими абстрактними: 1 2 3 4 . Ця відповідь, здається, має сенс. Моя інтерпретація: Випадкова величина та її площа можуть бути неспорідненими (оскільки, мабуть, відсутність кореляції є чимось на зразок лінійної незалежності), …

1
Чому моделі змішаних ефектів вирішують залежність?
Скажіть, нас цікавить, як на оцінку студентських іспитів впливає кількість годин, які вивчають ці студенти. Щоб дослідити цей взаємозв'язок, ми могли б запустити таку лінійну регресію: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Але якщо ми відіб’ємо учнів з кількох різних шкіл, ми можемо очікувати, що учні …

1
Лінійне моделювання змішаних ефектів із даними дослідження побратимів
Припустимо, у мене є деяка змінна відповіді яка вимірювалася від ї побратимів у й сім'ї. Крім того, деякі дані поведінки були зібрані одночасно від кожного суб'єкта. Я намагаюся проаналізувати ситуацію за допомогою наступної лінійної моделі змішаних ефектів:yijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} де і …

1
Що таке довгострокова дисперсія?
Як визначається довгострокова дисперсія в області аналізу часових рядів? Я розумію, він використовується в тому випадку, якщо в даних є структура кореляції. Отже, наш стохастичний процес не був би сімейством iid випадкових змінних, а лише ідентично розподіленим?X1,X2…X1,X2…X_1, X_2 \dots Чи можу я мати стандартне посилання як вступ до концепції та …



5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
Яка різниця між лінійно залежними та лінійно корельованими?
Поясніть, будь ласка, у чому різниця між тим, якщо дві змінні є лінійно залежними або лінійно корельованими . Я подивився статтю у Вікіпедії, але не отримав належного прикладу. Будь ласка, поясніть це на прикладі.

6
Наскільки проблематичним є контроль за незалежними коваріатами в спостережному (тобто не рандомізованому) дослідженні?
Міллер і Чапман (2001) стверджують, що абсолютно не доцільно контролювати незалежні коваріати, які пов'язані як із незалежними, так і залежними змінними в спостережному (не рандомізованому) дослідженні, - хоча це звичайно робиться в соціальних науках. Наскільки проблематично це зробити? Як найкраще вирішити цю проблему? Якщо ви регулярно контролюєте незалежність коваріатів у …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.