Запитання з тегом «multivariate-analysis»

Аналізи, де є декілька змінних, що аналізуються разом, і ці змінні або залежні (відповіді), або єдині в аналізі. Це може протиставлятися "багаторазовому" або "багатоваріантному" аналізу, який передбачає більше однієї прогнозної (незалежної) змінної.

3
Який тест можна використати для порівняння укосів двох або більше регресійних моделей?
Я хотів би перевірити різницю у відповіді двох змінних на один предиктор. Ось мінімальний відтворюваний приклад. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

6
Змінна процедура вибору для двійкової класифікації
Який вибір змінної / ознак, який ви віддаєте перевагу для двійкової класифікації, коли в навчальному наборі є набагато більше змінних / ознак, ніж спостереження? Метою тут є обговорення того, яка процедура вибору ознак дозволяє зменшити найкращу помилку класифікації. Ми можемо виправити позначення на послідовність: для , нехай є навчальним набором …

5
Вимірювання "відстані" між двома багатоваріантними розподілами
Я шукаю хорошу термінологію, щоб описати те, що намагаюся зробити, щоб полегшити пошук ресурсів. Скажімо, у мене є два кластери точок A і B, кожне пов'язане з двома значеннями, X і Y, і я хочу виміряти "відстань" між A і B - тобто наскільки ймовірним є те, що вони були …

1
Чи може ступінь свободи бути цілим числом?
Коли я використовую GAM, це дає мені залишковий коефіцієнт DF (останній рядок у коді). Що це означає? Виходячи за приклад GAM, загалом, чи може число ступенів свободи бути нецілим числом?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

11
Книжкові рекомендації для багатоваріантного аналізу
Мені цікаво отримати кілька книжок про багатофакторний аналіз, і мені потрібні ваші рекомендації. Безкоштовні книги завжди вітаються, але якщо ви знаєте про чудову невільну книгу MVA, будь ласка, озвучте її.

4
Для чого корисні рейтинги змінної важливості?
Я став чимось нігілістом, коли справа стосується рейтингів різної важливості (в контексті багатоваріантних моделей усіх видів). Часто в процесі роботи мене просять або допомогти іншій команді створити рейтинг змінної важливості, або створити змінний рейтинг важливості з моєї власної роботи. У відповідь на ці запити я задаю наступні запитання Для чого …

2
Розподіл відстані махаланобіса на рівні спостереження
Якщо у мене є багатоваріантний нормальний зразок iid X1,…,Xn∼Np(μ,Σ)X1,…,Xn∼Np(μ,Σ)X_1, \ldots, X_n \sim N_p(\mu,\Sigma) , і визначити (яка є різновидом відстані махаланобіса [в квадраті] від вибіркової точки до вектора використовуючи матрицю для зважування), який розподіл (відстань махаланобіса до вибірки середнє значення використанням матриці коваріації вибірки )?a Ad2i(b,A)=(Xi−b)′A−1(Xi−b)di2(b,A)=(Xi−b)′A−1(Xi−b)d_i^2(b,A) = (X_i - b)' …

2
Випадкові ліси для багатоваріантної регресії
У мене проблема з виходів із вхідними функціями та виходами. Виходи мають складну нелінійну кореляційну структуру.dxdxd_xdydyd_y Я хотів би використати випадкові ліси, щоб зробити регресію. Наскільки я можу сказати, випадкові ліси для регресії працюють лише з одним виходом, тому мені доведеться тренувати випадкові ліси - по одному на кожен вихід. …

2
Що таке "регресія зниженого рангу"?
Я читав "Елементи статистичного навчання" і не міг зрозуміти, про що йдеться в розділі 3.7 "Багаторазове скорочення та вибір". Це говорить про RRR (регресія зі зниженим рангом), і я можу лише зрозуміти, що передумова стосується узагальненої багатовимірної лінійної моделі, де коефіцієнти невідомі (і підлягають оцінці), але, як відомо, не мають …

3
Що означає непозитивна визначена матриця коваріації про мої дані?
Я маю ряд багатоваріантних спостережень і хотів би оцінити щільність ймовірності для всіх змінних. Передбачається, що дані зазвичай розподіляються. При малій кількості змінних все працює так, як я очікував, але переміщення до більшої кількості призводить до того, що матриця коваріації стає не позитивно визначеною. Я звів проблему в Matlab до: …

4
Короткий підсумок результатів “Великого p, малого n”
Чи може хтось вказати мені на опитувальний документ на тему "Великі , малі n " результати? Мене цікавить, як ця проблема проявляється в різних контекстах дослідження, наприклад, регресія, класифікація, тест Готелінга тощо .pppннn

2
Що в назві: точність (зворотна дисперсія)
Інтуїтивно зрозумілим є середнє значення лише середнього рівня спостережень. Різниця полягає в тому, наскільки ці спостереження різняться від середнього значення. Мені хотілося б знати, чому інверсія дисперсії відома як точність. Яку інтуїцію ми можемо зробити з цього? І чому матриця точності настільки ж корисна, як матриця коваріації при багатоваріантному (нормальному) …

3
Як виконати ізометричне перетворення коефіцієнта журналу
У мене є дані про поведінку в русі (час, пробудений спати, сидячий та займаючись фізичними навантаженнями), який становить приблизно 24 (як у години на день). Я хочу створити змінну, яка фіксує відносний час, проведений у кожній з цих форм поведінки - мені сказали, що це може досягти ізометричне перетворення відношення …

1
Побудова розподілу Діріхле з розподілом Гамма
Нехай X1,…,Xk+1X1,…,Xk+1X_1,\dots,X_{k+1} - взаємно незалежні випадкові величини, кожна з яких має розподіл гами з параметрами αi,i=1,2,…,k+1αi,i=1,2,…,k+1\alpha_i,i=1,2,\dots,k+1 показують, що Yi=XiX1+⋯+Xk+1,i=1,…,kYi=XiX1+⋯+Xk+1,i=1,…,kY_i=\frac{X_i}{X_1+\cdots+X_{k+1}},i=1,\dots,k, мають спільний розподіл у виглядіDirichlet(α1,α2,…,αk;αk+1)Dirichlet(α1,α2,…,αk;αk+1)\text{Dirichlet}(\alpha_1,\alpha_2,\dots,\alpha_k;\alpha_{k+1}) Спільний pdf з (X1,…,Xk+1)=e−∑k+1i=1xixα1−11…xαk+1−1k+1Γ(α1)Γ(α2)…Γ(αk+1)(X1,…,Xk+1)=e−∑i=1k+1xix1α1−1…xk+1αk+1−1Γ(α1)Γ(α2)…Γ(αk+1)(X_1,\dots,X_{k+1})=\frac{e^{-\sum_{i=1}^{k+1}x_i}x_1^{\alpha_1-1}\dots x_{k+1}^{\alpha_{k+1}-1}}{\Gamma(\alpha_1)\Gamma(\alpha_2)\dots \Gamma(\alpha_{k+1})} Тоді, щоб знайти спільний pdf з(Y1,…,Yk+1)(Y1,…,Yk+1)(Y_1,\dots,Y_{k+1})я не можу знайти якобіан, тобтоJ(x1,…,xk+1y1,…,yk+1)J(x1,…,xk+1y1,…,yk+1)J(\frac{x_1,\dots,x_{k+1}}{y_1,\dots,y_{k+1}})

2
категоризація змінної перетворює її з незначної на значущу
У мене є числова змінна, яка виявляється несуттєвою в багатовимірній логістичній регресійній моделі. Однак, коли я класифікую його на групи, раптом він стає значущим. Для мене це дуже протиінтуїтивно: коли класифікуємо змінну, ми видаємо деяку інформацію. Як це може бути?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.