Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

3
Як дізнатися, чи є часовий ряд стаціонарним чи нестаціонарним?
Я використовую R, я шукав на Google і з'ясував , що kpss.test(), PP.test()і adf.test()використовуються , щоб знати про стаціонарності часових рядів. Але я не статистик, який може інтерпретувати їх результати > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01 > …

3
Який хороший спосіб використовувати R, щоб зробити розсіювач, який розділяє дані обробкою?
Я взагалі новачок із R та статистикою взагалі, але мені потрібно зробити розсип, який, на мою думку, може перевищити його власні можливості. У мене є пара векторів спостережень, і я хочу зробити з ними розсип, і кожна пара потрапляє в одну з трьох категорій. Я хотів би зробити розсип, який …

3
Наскільки R масштабує завдання для класифікації тексту? [зачинено]
Я намагаюся досягти швидкості з R. Я врешті-решт хочу використовувати R-бібліотеки для класифікації тексту. Мені було просто цікаво, який досвід людей щодо масштабованості R, коли мова йде про класифікацію тексту. Я, швидше за все, зіткнувся з великими розмірними даними (~ 300k розмірів). Я дивлюся на використання SVM та Random Forest, …

6
Лінійний графік має занадто багато рядків, чи є краще рішення?
Я намагаюсь графікувати кількість дій користувачів (у даному випадку "лайків") протягом часу. Отже, у мене є "Кількість дій" як вісь y, моя вісь x - час (тижні), і кожен рядок представляє одного користувача. Моя проблема полягає в тому, що я хочу переглянути ці дані для набору з приблизно 100 користувачів. …

2
Інтерпретація біплотів в аналізі основних компонентів
Я натрапив на цей чудовий підручник: Посібник зі статистичних аналізів за допомогою Р. Глава 13. Аналіз основних компонентів: Олімпійський шестиборство про те, як робити PCA на мові R. Я не розумію тлумачення рисунка 13.3: Тому я будую перший власний вектор проти другого власного вектора. Що це означає? Припустимо, власне значення, …

1
Як центрування впливає на значення PCA (для розпаду SVD та власних властивостей)?
Яку різницю мають центрирування (або де-значення) ваших даних для PCA? Я чув, що це полегшує математику або що перешкоджає домінуванню на першому ПК засобами змінних, але я відчуваю, що ще не зміг зрозуміти цю концепцію. Наприклад, головна відповідь тут Як центрування даних позбавляється від перехоплення в регресії та PCA? описується, …
30 r  pca  svd  eigenvalues  centering 

3
Який коефіцієнт інфляції дисперсії я повинен використовувати:
Я намагаюся інтерпретувати дисперсії коефіцієнтів інфляції з використанням vifфункції в пакеті R car. Функція друкує як узагальнений і . Відповідно до файлу довідки , це останнє значенняVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Для коригування розмірності довірчого еліпсоїда функція також друкує GVIF ^ [1 / (2 * df)], де df - ступені свободи, пов'язані з терміном. …

5
Що означає глибина взаємодії в ГБМ?
У мене виникло питання про параметр глибини взаємодії в gbm в R. Це може бути питання noob, за яке я вибачаюся, але як параметр, який, на мою думку, позначає кількість кінцевих вузлів у дереві, в основному вказує X-шлях взаємодія між предикторами? Просто намагаюся зрозуміти, як це працює. Крім того, я …

4
Яка різниця між тестом МакНемара і тестом чи-квадрата, і як ви знаєте, коли їх використовувати?
Я спробував прочитати з різних джерел, але все ще не зрозуміло, який тест був би відповідним у моєму випадку. Є три різні питання, які я задаю про свій набір даних: Суб'єктів тестують на інфекції від Х у різний час. Хочу знати, чи пропорції додатного для X після пов'язані з часткою …

2
Інтерпретація сюжету (glm.model)
Чи може хто-небудь сказати мені, як інтерпретувати графіки "залишки та пристосованість", "нормальні q-q", "масштаб-розташування" та "залишки проти важеля"? Я встановлюю двочленний GLM, зберігаю його, а потім малюю його.

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

1
Вибір функцій та модель з glmnet за даними метилювання (p >> N)
Я хотів би використовувати GLM та Elastic Net для вибору відповідних функцій + побудувати лінійну регресійну модель (тобто як прогнозування, так і розуміння, тому краще було б залишитись із відносно малою кількістю параметрів). Вихід безперервний. Це генів на 50 випадків. Я читав про пакет, але не впевнений на 100% в …

1
Як обчислюються стандартні помилки для пристосованих значень з логістичної регресії?
Коли ви прогнозуєте відповідне значення з логістичної регресійної моделі, як обчислюються стандартні помилки? Я маю на увазі для пристосованих значень , а не для коефіцієнтів (що включає інформаційну матрицю Фішера). Я дізнався лише, як отримати числа за допомогою R(наприклад, тут на r-help або тут на переповнення стека), але не можу …

3
Який тест можна використати для порівняння укосів двох або більше регресійних моделей?
Я хотів би перевірити різницю у відповіді двох змінних на один предиктор. Ось мінімальний відтворюваний приклад. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

4
R пакети для моделювання теми / LDA: просто `topicmodels` та` lda` [закрито]
Мені здається, що лише два пакети R здатні виконувати приховане розподілення Діріхле : Один є ldaавтором Джонатана Чанга; а другий topicmodelsавтор - Беттіна Грюн та Курт Горник. Які відмінності між цими двома пакетами щодо продуктивності, деталей реалізації та розширюваності?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.