Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

1
Чим відрізняється логістична регресія від регресії дробової реакції?
Наскільки мені відомо, різниця між логістичною моделлю та моделлю дробового реагування (frm) полягає в тому, що залежна змінна (Y), в якій frm, [0,1], але логістична - {0, 1}. Крім того, frm використовує квазіімовірність для визначення його параметрів. Зазвичай ми можемо використовувати glmдля отримання логістичних моделей за glm(y ~ x1+x2, data …

1
Поясніть, як `eigen` допомагає інвертувати матрицю
Моє запитання стосується техніки обчислень, що експлуатується в geoR:::.negloglik.GRFабо geoR:::solve.geoR. У налаштуваннях лінійної змішаної моделі: де і - фіксовані та випадкові ефекти відповідно. Такожβ b Σ = cov ( Y )Y= Xβ+ Zb + eY=Xβ+Zb+e Y=X\beta+Zb+e ββ\betaбbbΣ = cov ( Y)Σ=cov(Y)\Sigma=\text{cov}(Y) Оцінюючи ефекти, виникає потреба в обчисленні що зазвичай можна …

2
Процедура та методи аналізу часових журналів з використанням R
Я працюю над невеликим проектом, де ми намагаємось передбачити ціни на товари (нафта, алюміній, олово тощо) на наступні 6 місяців. У мене є 12 таких змінних, які можна передбачити, і у мене є дані з квітня 2008 р. По травень 2013 р. Як слід робити прогнозування? Я зробив наступне: Імпортовані …

1
R: нормальність тесту залишків лінійної моделі - які залишки використовувати
Я хотів би зробити W тест Шапіро Вілка і тест Колмогорова-Смірнова на залишки лінійної моделі, щоб перевірити їх нормальність. Мені було просто цікаво, які залишки слід використовувати для цього - залишки сировини, залишки Пірсона, залишки в студії або стандартизовані залишки? Для W тесту Shapiro-Wilk W виявляється, що результати для залишків …

1
Неправильний висновок, коли спостереження не є незалежними
З елементарної статистики я дізнався, що для загальної лінійної моделі, щоб умовиводи були дійсними, спостереження повинні бути незалежними. Якщо відбувається кластеризація, незалежність може більше не приводити до недійсного висновку, якщо це не враховується. Один із способів обліку такої кластеризації - це використання змішаних моделей. Я хотів би знайти приклад набору …

2
Чи можна за допомогою пакету caret отримати матриці плутанини для конкретних порогових значень?
Я отримав модель логістичної регресії (через train) для бінарного відповіді, і я отримав логістичну матрицю сплутаності через confusionMatrixв caret. Це дає мені матрицю плутанини логістичної моделі, хоча я не впевнений, який поріг використовується для її отримання. Як отримати матрицю плутанини для конкретних порогових значень, використовуючи confusionMatrixв caret?

1
Як перевірити, чи відповідає розподіл закону про владу?
У мене є дані про те, скільки користувачів публікує скільки питань. Наприклад, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Це означає, що кожен користувач опублікував 100 запитань, 9 користувачів - 10 питань тощо. Отже, як я можу визначити, чи відповідає UserCount, QuestionCountрозподіл закону про владу? Я знайшов …

1
Чому lm () R повертає різні оцінки коефіцієнта, ніж мій підручник?
Фон Я намагаюся зрозуміти перший приклад в курсі пристосування моделей (тому це може здатися смішно простим). Я зробив обчислення вручну, і вони відповідають прикладу, але коли я повторюю їх у R, коефіцієнти моделі вимкнено. Я вважав, що різниця може бути пов’язана з підручником із застосуванням дисперсії сукупності ( ), тоді …
13 r  regression  self-study  lm 

2
Чи коли-небудь є причина не використовувати ортогональні многочлени під час регресії?
Взагалі мені цікаво, чи краще коли-небудь не використовувати ортогональні поліноми під час регресії із змінними вищого порядку. Зокрема, мені цікаво використання R: Якщо poly()з raw = FALSEвиробляє те ж значення, що і підігнаного poly()з raw = TRUE, і polyз raw = FALSEвирішуєте деякі з проблем , пов'язаних з поліноміальними регрессиями, …

2
використання інформації про сусідів для введення даних або пошуку даних (у R)
У мене є набір даних з припущенням, що найближчі сусіди є найкращими прогнозами. Просто прекрасний приклад двостороннього візуалізації градієнта- Припустимо, у нас є випадок, коли мало значень не вистачає, ми можемо легко передбачити, виходячи з сусідів та тенденції. Відповідна матриця даних у R (макетний приклад для тренування): miss.mat <- matrix …

1
Як масштабувати нові спостереження для прогнозування, коли модель оснащувалася масштабованими даними?
Я розумію поняття масштабування матриці даних для використання в лінійній регресійній моделі. Наприклад, в R ви можете використовувати: scaled.data <- scale(data, scale=TRUE) Єдине моє запитання - як правильно оцінювати нові спостереження, для яких я хочу передбачити вихідні значення? Було б scaled.new <- (new - mean(data)) / std(data),?

3
Покрокова реалізація PCA в R за допомогою підручника Ліндсі Сміт
Я працюю в R через чудовий підручник з PCA Ліндсей І Сміт, і я застрягаю на останній стадії. Сценарій R нижче приводить нас до етапу (на с. 19), де реконструюються оригінальні дані (головного компонента в цьому випадку), який повинен отримати прямий графік уздовж осі PCA1 (враховуючи, що дані має лише …
13 r  pca 

3
Як перевірити, чи відрізняються два (ненормальні) розподіли?
Я читав про t-тест Стьюдента, але, здається, він працює, коли можна припустити, що оригінальні дистрибутиви зазвичай розподіляються. У моєму випадку їх точно немає. Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13^2тести?

2
Тест Даннета в R щоразу повертає різні значення
Я використовую бібліотеку R 'multcomp' ( http://cran.r-project.org/web/packages/multcomp/ ) для обчислення тесту Даннета . Я використовую сценарій нижче: Group <- factor(c("A","A","B","B","B","C","C","C","D","D","D","E","E","F","F","F")) Value <- c(5,5.09901951359278,4.69041575982343,4.58257569495584,4.79583152331272,5,5.09901951359278,4.24264068711928,5.09901951359278,5.19615242270663,4.58257569495584,6.16441400296898,6.85565460040104,7.68114574786861,7.07106781186548,6.48074069840786) data <- data.frame(Group, Value) aov <- aov(Value ~ Group, data) summary(glht(aov, linfct=mcp(Group="Dunnett"))) Тепер, якщо я запускаю цей сценарій через консоль R кілька разів, я кожного разу отримую …

2
ARIMA проти ARMA на різницевій серії
У R (2.15.2) я встановив один раз ARIMA (3,1,3) на часовій серії та один раз ARMA (3,3) на колись різнилися часові серії. Встановлені параметри відрізняються, що я відніс до методу підгонки в ARIMA. Крім того, встановлення ARIMA (3,0,3) на ті ж дані, що й ARMA (3,3), не призведе до однакових …
13 r  time-series  arima  fitting  arma 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.