Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

1
Які залишки та відстань Кука використовуються для GLM?
Хтось знає, яка формула відстані Кука? Оригінальна формула відстані Кука використовує студизовані залишки, але чому R використовує std. Залишки Пірсона при обчисленні графіку відстані Кука для ГЛМ. Я знаю, що студизовані залишки не визначені для ГММ, але як виглядає формула для обчислення відстані Кука? Припустимо наступний приклад: numberofdrugs <- rcauchy(84, …

2
Пошук індексу стовпця за його назвою в R [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 6 років тому . У кадрі даних я хотів би отримати індекс стовпця за назвою. Наприклад: x <- data.frame(foo=c('a','b','c'),bar=c(4,5,6),quux=c(4,5,6)) Я хочу знати індекс стовпців для "bar". …
11 r 

1
Моделювання серії ARIMA (1,1,0)
Я встановив моделі ARIMA до оригінальних часових рядів, а найкраща модель - ARIMA (1,1,0). Тепер я хочу імітувати серію з цієї моделі. Я написав просту модель AR (1), але не зміг зрозуміти, як відрегулювати різницю в моделі ARI (1,1,0). Наступний код R для серії AR (1): phi= -0.7048 z=rep(0,100) e=rnorm(n=100,0,0.345) …
11 r  time-series  arima 

1
Як обчислити показники достовірності в регресії (з випадковими лісами / XGBoost) для кожного прогнозу в R?
Чи є спосіб отримати оцінку достовірності (ми можемо назвати це також достовірністю або ймовірністю) для кожного прогнозованого значення при використанні таких алгоритмів, як Random Forests або Extreme Gradient Boosting (XGBoost)? Скажімо, цей показник довіри варіюватиметься від 0 до 1 і показує, наскільки я впевнений у певному прогнозі . З того, …

1
Встановлення біноміального GLMM (glmer) на змінну відповіді, яка є пропорцією або дробом
Я сподіваюся, що хтось може допомогти у тому, що, на мою думку, є відносно простим питанням, і я думаю, що знаю відповідь, але без підтвердження це стало чимось, в чому я просто не можу бути впевненим. У мене є деякі дані підрахунку як змінної відповіді, і я хочу виміряти, як …

3
Як поводитися з попередженням "не цілочисельне" від негативного біноміального GLM?
Я намагаюся моделювати середню інтенсивність паразитів, що впливають на господаря в R, використовуючи негативну біноміальну модель. Я постійно отримую 50 або більше попереджень, які говорять: In dpois(y, mu, log = TRUE) : non-integer x = 251.529000 Як я можу впоратися з цим? Мій код виглядає приблизно так: mst.nb = glm.nb(Larvae+Nymphs+Adults~B.type+Month+Season, …

5
Статистика тесту Дурбіна Уотсона
Я застосував тест DW до моєї регресійної моделі в R, і я отримав статистику тесту DW 1,78 і p-значення 2,2e-16 = 0. Чи означає це, що між залишками не існує автокореляції, тому що stat близький до 2 з невеликим p-значенням чи це означає, хоча stat є близьким до 2, p-значення …

3
Чи можуть значення масштабування в лінійному дискримінантному аналізі (LDA) використовуватися для побудови пояснювальних змінних лінійних дискримінантів?
Використовуючи біплот значень, отриманих за допомогою аналізу основних компонентів, можна досліджувати пояснювальні змінні, що складають кожен компонент принципу. Чи можливо це також за допомогою лінійного дискримінаційного аналізу? Наведені приклади використання даних "Дані Іриса Едгара Андерсона" ( http://en.wikipedia.org/wiki/Iris_flower_data_set ). Ось дані райдужки : id SLength SWidth PLength PWidth species 1 5.1 …

2
Як моделювати ефекти місяця в місяць у щоденних даних часових рядів?
У мене є два часові ряди щоденних даних. Один є, sign-upsа другий terminationsпередплати. Я хотів би передбачити останнє, використовуючи інформацію, що міститься в обох змінних. Переглядаючи графік цих рядів, очевидно, що закінчення співвідносяться з кратними реєстраціями місяцями раніше. Тобто, сплеск підписок 10 травня призведе до збільшення термінів припинення в 10 …

3
Створення автокорельованих випадкових значень у R
Ми намагаємося створити автоматичні корельовані випадкові значення, які будуть використовуватися як часові сесії. У нас немає існуючих даних, на які ми посилаємось, і просто хочемо створити вектор з нуля. З одного боку, нам, звичайно, потрібен випадковий процес з розподілом та його SD. З іншого боку, має бути описана автокореляція, що …

1
Тест Фішера в R
Припустимо, у нас є такий набір даних: Men Women Dieting 10 30 Non-dieting 5 60 Якщо я проведу точний тест Фішера в R, то що означає alternative = greater(або менше)? Наприклад: mat = matrix(c(10,5,30,60), 2,2) fisher.test(mat, alternative="greater") Я отримую p-value = 0.01588і odds ratio = 3.943534. Крім того, коли я …

4
Що робити пояснень у часових рядах?
Працюючи в основному з даними поперечного перерізу і зовсім недавно переглядаючи, скануючи спотикання через купу вступної літератури часових рядів, мені цікаво, яку роль відіграють пояснювальні змінні в аналізі часових рядів. Я б хотів пояснити тенденцію, а не дерендувати. Більшість того, що я читаю як вступ, передбачає, що серія випливає з …

1
Інтерпретація декомпозиції часових рядів за допомогою TBATS з пакета прогнозу R
Я хотів би розкласти наступні дані часових рядів на сезонні, трендові та залишкові компоненти мереж. Дані - це погодинний профіль охолоджувальної енергії з комерційного будинку: TotalCoolingForDecompose.ts <- ts(TotalCoolingForDecompose, start=c(2012,3,18), freq=8765.81) plot(TotalCoolingForDecompose.ts) Очевидними є щоденні та щотижневі сезонні ефекти, тому ґрунтуючись на поради: Як розкласти часовий ряд з кількома сезонними компонентами? …

4
Чому тести гіпотез щодо повторно впорядкованих наборів даних занадто часто відкидають нуль?
tl; dr: Починаючи з набору даних, згенерованого під нуль, я перекомпонував випадки із заміною та провів перевірку гіпотез на кожному перекомпонованому наборі даних. Ці тести гіпотези відкидають нуль більше 5% часу. нижче, дуже просте моделювання, я набори даних за допомогою , і я підходжу просту модель OLS до кожного. Потім …

1
Чому я отримую різні передбачення щодо ручного розширення поліномів та використання функції R `poly`?
Чому я отримую різні прогнози щодо ручного розширення поліномів та використання функції R poly? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <- lm(y~.-1,data=x_exp) xp_exp <- data.frame(f1=xp,f2=xp^2) yp <- predict(fit,xp_exp) lines(xp,yp) # using poly …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.