Запитання з тегом «multivariate-analysis»

Аналізи, де є декілька змінних, що аналізуються разом, і ці змінні або залежні (відповіді), або єдині в аналізі. Це може протиставлятися "багаторазовому" або "багатоваріантному" аналізу, який передбачає більше однієї прогнозної (незалежної) змінної.

1
Пакет GBM проти Caret з використанням GBM
Я налаштовував модель за допомогою caret, але потім повторно запустив модель за допомогою gbmпакета. Наскільки я розумію, що caretпакет використовує gbmі вихід повинен бути однаковим. Однак, лише швидкий тестовий пробіг із застосуванням data(iris)показує невідповідність моделі приблизно 5%, використовуючи RMSE і R ^ 2 в якості метрики оцінювання. Я хочу знайти …

2
Як перевірити, чи вибирають два багатовимірні розподіли від однієї базової сукупності?
Скажімо, вам дано два багатовимірні набори даних, скажімо, старий та новий, і що вони, як передбачається, були створені тим самим процесом (для якого у вас немає моделі), але, можливо, десь уздовж лінії збирання / створення дані, щось пішло не так. Ви не хочете використовувати нові дані як, скажімо, набір перевірки …

3
Як перевірити, чи змінилася матриця коваріації протягом двох часових точок?
Моє завдання - перевірити, чи є зміна матриці коваріації з 6 змінних. Значення 6 змінних вимірюються двічі від одних і тих же суб'єктів (3 роки між вимірюваннями). Як я можу це зробити? Більшу частину своєї роботи я робив за допомогою SAS.

2
Коли дані мають гаусовий розподіл, скільки зразків буде характеризувати їх?
Для гауссових даних, що поширюються в одному вимірі, потрібні два параметри для їх характеристики (середня величина, дисперсія), і подейкують, що для оцінювання цих параметрів з достатньо високою достовірністю зазвичай вистачає приблизно 30 випадково вибраних зразків. Але що відбувається, коли кількість розмірів збільшується? У двох вимірах (наприклад, висота, вага) потрібно 5 …

3
Які розподіли на позитивному k-мірному квадранті з параметризованою матрицею коваріації?
Після zzk «s питання про його проблеми з негативним моделюванням, я цікаво , що параметризрвані сімейства розподілів на позитивні к-мірної квадраті, , для яких ковариационной матриці Σ може бути безліч.Rк+R+k\mathbb{R}_+^kΣΣ\Sigma Як обговорювалося з zzk , виходячи з розподілу на Rк+R+k\mathbb{R}_+^k і застосовуючи лінійне перетворення Х⟶ Σ1 / 2( X- μ …

2
Split-Plot ANOVA: тести порівняння моделей в R
Як я можу перевірити ефекти в розділі ANOVA на розділеному ділянці, використовуючи відповідні порівняння моделі для використання з Xта Mаргументів anova.mlm()у R? Мені знайомий ?anova.mlmі Dalgaard (2007) [1]. На жаль, це лише щітки дизайну спліт-сюжетів. Робимо це в повністю рандомізованому дизайні з двома внутрішніми факторами: N <- 20 # 20 …

1
Що робити, коли матриця коваріації зразка не обернена?
Я працюю над деякими методами кластеризації, де для заданого кластера d-розмірних векторів я припускаю багатоваріантне нормальне розподіл і обчислюю вибірковий d-розмірний середній вектор та матрицю коваріації вибірки. Тоді, намагаючись вирішити, чи належить новий, невидимий, d-мірний вектор до цього кластеру, я перевіряю його відстань за допомогою цієї міри: (Xi−μ^X)′σ^−1X(Xi−μ^X)>B0.95(p2,−p2)(Xi−μ^X)′σ^X−1(Xi−μ^X)>B0.95(p2,−p2)\left(X_i-\hat{\mu}_X\right)'\hat{\sigma}_X^{-1}\left(X_i-\hat{\mu}_X\right)>B_{0.95}\left(\frac{p}{2},\frac{-p}{2}\right) Що вимагає …

1
Альтернатива блокувати завантажувальну систему для багатоваріантних часових рядів
В даний час я використовую наступний процес для завантаження багатовимірного часового ряду в R: Визначення розмірів блоків - запустіть функцію b.starв npпакеті, який створює розмір блоку для кожної серії Виберіть максимальний розмір блоку Запустити tsbootбудь-яку серію, використовуючи вибраний розмір блоку Використовуйте індекс від вихідного завантажувального інструменту для реконструкції багатовимірного часового …

1
Багатоваріантна лінійна регресія проти декількох одновимірних регресійних моделей
У налаштуваннях універсальної регресії ми намагаємося моделювати y=Xβ+noisey=Xβ+noisey = X\beta +noise де вектор спостережень і матриця проектування з провісниками. Рішення - .y∈Rny∈Rny \in \mathbb{R}^nnnnX∈Rn×mX∈Rn×mX \in \mathbb{R}^{n \times m}mmmβ0=(XTX)−1Xyβ0=(XTX)−1Xy\beta_0 = (X^TX)^{-1}Xy У налаштуваннях багатоваріантної регресії ми намагаємося моделювати Y=Xβ+noiseY=Xβ+noiseY = X\beta +noise де - матриця з спостережень та різних прихованих змінних. …

1
Вибірковий розподіл радіусу 2D нормального розподілу
Однорядне нормальне розподіл із середньою та коваріаційною матрицею можна переписати у полярні координати з радіусом та кутом . Моє запитання: Який розподіл вибірки , тобто відстані від точки до розрахункового центру даною вибірковою коваріаційною матрицею ?μμ\muΣΣ\Sigmarrrθθ\thetar^r^\hat{r}хxxx¯x¯\bar{x}SSS Передумови: Справжня відстань від точки до середньої слідує за розподілом Хойта . З власними …

4
MANOVA та кореляції між залежними змінними: наскільки сильна занадто сильна?
Залежні змінні в MANOVA не повинні "надто сильно співвідноситися". Але наскільки сильна кореляція занадто сильна? Цікаво було б отримати думку людей з цього приводу. Наприклад, ви б продовжували роботу з MANOVA в наступних ситуаціях? Y1 і Y2 співвідносяться з іr = 0,3r=0,3r=0.3р &lt; 0,005p&lt;0,005p<0.005 Y1 і Y2 співвідносяться з r …

3
Аналіз втручання за допомогою багатовимірних часових рядів
Я хотів би зробити аналіз втручання, щоб оцінити результати політичного рішення щодо продажу алкоголю з часом. Однак я досить новий в аналізі часових рядів, тому у мене є питання для початківців. Експертиза літератури свідчить про те, що інші дослідники використовували ARIMA для моделювання продажів алкоголю за часовими рядами, а манекенні …

1
R / mgcv: Чому тензорні вироби te () і ti () створюють різні поверхні?
У mgcvпакеті Rє дві функції для встановлення тензорних взаємодій між продуктами: te()і ti(). Я розумію основний розподіл праці між двома (встановлення нелінійної взаємодії проти декомпозиції цієї взаємодії на основні ефекти та взаємодію). Чого я не розумію, це чому te(x1, x2)і ti(x1) + ti(x2) + ti(x1, x2)може давати (трохи) різні результати. …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
М'яке порогове порівняно проти лассо пеналізації
Я намагаюсь узагальнити те, що я зрозумів до цього часу в пеналізованому багатоваріантному аналізі з великомірними наборами даних, і я все ще намагаюся отримати правильне визначення м'якої порогової оцінки проти Лассо (або ) пеналізації.L1L1L_1 Точніше, я використовував розріджену регресію PLS для аналізу 2-блокної структури даних, включаючи геномні дані ( одномолекулярні …

3
Чи можуть значення масштабування в лінійному дискримінантному аналізі (LDA) використовуватися для побудови пояснювальних змінних лінійних дискримінантів?
Використовуючи біплот значень, отриманих за допомогою аналізу основних компонентів, можна досліджувати пояснювальні змінні, що складають кожен компонент принципу. Чи можливо це також за допомогою лінійного дискримінаційного аналізу? Наведені приклади використання даних "Дані Іриса Едгара Андерсона" ( http://en.wikipedia.org/wiki/Iris_flower_data_set ). Ось дані райдужки : id SLength SWidth PLength PWidth species 1 5.1 …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.