Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

3
як інтерпретувати термін взаємодії у формулі lm в R?
У R, якщо я називаю lm()функцію таким чином: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) Це дає мені лінійну модель змінної відгуку з var1, var2і взаємодія між ними. Однак як саме ми чисельно інтерпретуємо термін взаємодії? У документації сказано , що це «хрест» між var1і …
9 r  regression 

1
Значення p-значення змінних логістичної регресійної моделі
Тож я працюю з логістичними регресійними моделями у Р. Хоча я ще новачок у статистиці, я відчуваю, що до цього часу я трохи розуміюсь щодо регресійних моделей, але все ще є щось, що мене турбує: Дивлячись на пов’язане зображення, ви бачите зведені R друку для прикладу створеної нами моделі. Модель …

2
Прогноз ARIMA з сезонністю та тенденцією, дивний результат
Коли я вступаю в прогнозування за допомогою моделей ARIMA, я намагаюся зрозуміти, як я можу покращити прогноз на основі підходу ARIMA із сезонністю та дрейфом. Мої дані - наступний часовий ряд (понад 3 роки, з чіткою тенденцією вгору та видимою сезонністю, яка, схоже, не підтримується автокореляцією з відставаннями 12, 24, …

1
Як вказати контрастну матрицю (в R) для різниці між рівнем і середнім рівнем інших?
У мене є регресійна модель, яка виглядає приблизно так: Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y = \beta_0+\beta_1X_1 + \beta_2X_2 + \beta_3X_3 +\beta_{12}X_1X_2+\beta_{13}X_1X_3+\beta_{123}X_1X_2X_3 ... або у позначенні R: y ~ x1 + x2 + x3 + x1:x2 + x1:x3 + x1:x2:x3 Скажімо X1X1X_1 і X2X2X_2 є категоричними змінними та X3X3X_3є числовим. Ускладнення полягає в томуX1X1X_1 має …
9 r  contrasts 

3
Вибір кластерів для k-означає: 1 випадок кластера
Хтось знає хороший метод визначити, чи кластеризація за допомогою kmeans навіть підходить? Тобто, що робити, якщо ваш зразок насправді однорідний? Я знаю, що щось на зразок моделі суміші (через mclust в R) надасть статистику відповідності для випадку кластеру 1: k, але, схоже, для всіх методів оцінки kmeans потрібні принаймні 2 …
9 r  clustering  k-means 

1
Моделювання даних для логістичної регресії з категоричною змінною
Я намагався створити деякі тестові дані для логістичної регресії, і я знайшов цей пост. Як імітувати штучні дані для логістичної регресії? Це хороша відповідь, але вона створює лише постійні змінні. Що з категоричною змінною x3 з 5 рівнями (ABCDE), пов'язаними з y, для того ж прикладу, що і у посиланні?

3
Обчислення коефіцієнта Жакарда або іншого асоціації для двійкових даних за допомогою множення матриць
Я хочу знати, чи є можливий спосіб обчислити коефіцієнт Жакарда за допомогою матричного множення. Я використав цей код jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | x[,j])) jaccard[j,i]=jaccard[i,j] …

1
Розрахунок невідомого значення p
Нещодавно я налагоджував сценарій R, і я знайшов щось дуже дивне, автор визначив власну функцію p-значення pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is …

2
Інтервальна цензурована модель Кокса, пропорційна небезпека в R
З огляду на часові витримки, які цензуровані в інтервалі, як я можу виконати інтервал цензурованої моделі Cox PH R? Пошук rseek виявляє пакет intcox, якого більше не існує у Rсховищі. Я майже впевнений, що coxphфункція в survivalпакеті не може обробляти дані про виживання в інтервалі. Крім того, я не хочу …

2
Як ви використовуєте прості експоненціальні згладжування в R?
Я початківець в R, чи не могли б ви пояснити, як використовувати ses в пакеті прогнозу R прогнозу ? Я хотів би вибрати кількість початкових періодів і постійну згладжування. d <- c(3,4,41,10,9,86,56,20,18,36,24,59,82,51,31,29,13,7,26,19,20,103,141,145,24,99,40,51,72,58,94,78,11,15,17,53,44,34,12,15,32,14,15,26,75,110,56,43,19,17,33,26,40,42,18,24,69,18,18,25,86,106,104,35,43,12,4,20,16,8) У мене 70 періодів, я хотів би використати 40 періодів для початкових і 30 для вибіркових. ses(d, h=30, …

4
Box Cox Трансформації для регресії
Я намагаюся встановити лінійну модель на деякі дані лише з одним предиктором (скажімо, (x, y)). Дані є такими, що для малих значень x значення y дають чітке прилягання до прямої лінії, однак у міру збільшення значень x значення y стають більш мінливими. Ось приклад таких даних (код R) y = …

4
Як побудувати графік 20 років щоденних даних у часових рядах
У мене є такий набір даних: https://dl.dropbox.com/u/22681355/ORACLE.csv, і я хотів би побудувати щоденні зміни у "Відкрити" на "Дата", тому я зробив наступне: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open, type="l") і я отримую наступне: Зараз це, очевидно, не найприємніший сюжет коли-небудь, тому мені цікаво, який правильний метод використовувати при побудові таких …

2
Визначення найбільшого учасника групи
Я мало знаю про статистику, тож ведіть мене. Скажімо, у мене набір 1000 робітників. Я хочу розібратися, хто найважчий працівник, але я можу виміряти лише кількість роботи, яку виконують у групах по 1-100 за години роботи. Якщо припустити, що кожен працівник завжди виконує приблизно однакову кількість роботи, під час великої …

3
Порівнюючи показники захворюваності
Я хочу порівняти показник захворюваності між двома групами (одна без захворювання та одна із захворюванням). Я планував обчислити коефіцієнт частоти захворюваності (IRR), тобто групу захворюваності B / рівень частоти захворюваності, група А, а потім перевірити, чи є цей показник рівним 1, і, нарешті, обчислити 95% інтервали ІС для IRR. Я …

1
Інтервали довіри та прогнозування лінійної регресійної моделі
Гаразд, тому я намагаюся зрозуміти лінійну регресію. У мене є набір даних, і це виглядає все в порядку, але я розгублений. Це моя лінійна резюме моделі: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074 0.0004779 6.502 4.79e-07 *** --- Signif. codes: 0 ‘***’ …
9 r  regression 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.