Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

1
Зменшення розмірності (SVD або PCA) на великій розрідженій матриці
/ редагувати: подальше спостереження зараз ви можете використовувати irlba :: prcomp_irlba / редагувати: слідкувати за моєю власною публікацією. irlbaтепер є аргументи "центр" і "шкала", які дозволяють використовувати його для обчислення основних компонентів, наприклад: pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v У мене є велика кількість розрізнених Matrixфункцій, які …

2
Як побудувати межу рішення k-найближчого класифікатора сусіда з елементів статистичного навчання?
Я хочу створити сюжет, описаний у книзі ElemStatLearn "Елементи статистичного навчання: видобуток даних, висновок та прогнозування. Друге видання" Тревор Хасті та Роберт Тібширані та Джером Фрідман. Сюжет: Мені цікаво, як я можу створити цей точний графік R, особливо зверніть увагу на сітку графіку та обчислення, щоб показати межу.

3
Візуалізуючи мільйон, видання PCA
Чи можливо візуалізувати результати аналізу основних компонентів способами, які дають більше розуміння, ніж просто зведені таблиці? Чи можна це зробити, коли кількість спостережень велика, скажімо ~ 1e4? І чи можна це робити в R [інші середовища]?

1
Для яких розподілів параметризації в BUGS та R різні?
Я знайшов деякі дистрибутиви, для яких BUGS та R мають різні параметризації: Normal, log-Normal та Weibull. Для кожного з них я вважаю, що другий параметр, який використовується R, повинен бути перетворений в обернене (1 / параметр) перед тим, як використовувати його в BUGS (або в моєму випадку JAGS). Хтось знає …

1
Багаторазове порівняння на моделі змішаних ефектів
Я намагаюся проаналізувати деякі дані, використовуючи модель змішаного ефекту. Дані, які я зібрав, представляють вагу деяких молодих тварин різного генотипу в часі. Я використовую запропонований тут підхід: https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ Зокрема, я використовую рішення №2 Тож у мене щось подібне require(nlme) model <- lme(weight ~ time * Genotype, random = ~1|Animal/time, data=weights) …

6
Як збільшити довгострокову відтворюваність досліджень (особливо з використанням R та Sweave)
Контекст: У відповідь на попереднє запитання про відтворювані дослідження Джейк писав Однією з проблем, які ми виявили під час створення нашого архіву JASA, було те, що змінилися версії та типові параметри CRAN-пакетів. Отже, в цей архів ми також включаємо версії пакетів, які ми використовували. Система, що базується на віньєтці, ймовірно, …

2
Відносна важливість набору предикторів у випадковій класифікації лісів у R
Я хотів би визначити відносну важливість наборів змінних до randomForestкласифікаційної моделі в Р. importanceФункція забезпечує MeanDecreaseGiniметрику для кожного окремого предиктора - чи це так просто, як підсумовувати це для кожного предиктора в наборі? Наприклад: # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., …

3
Чи можна розрахувати AIC та BIC для регресійних моделей ласо?
Чи можна обчислити значення AIC або BIC для регресійних моделей ласо та інших регульованих моделей, де параметри лише частково вводяться в рівняння. Як можна визначити ступеня свободи? Я використовую R для підключення регресійних моделей ласо з glmnet()функцією з glmnetпакету, і я хотів би знати, як обчислити значення AIC та BIC …
31 r  model-selection  lasso  aic  bic 

7
Статистичні методи для більш ефективного побудови даних при наявності мільйонів балів?
Я вважаю, що R може зайняти тривалий час для створення сюжетів, коли присутні мільйони балів - не дивно, враховуючи, що бали розміщуються окремо. Крім того, такі сюжети часто занадто захаращені та щільні, щоб бути корисними. Багато пунктів перекриваються і утворюють чорну масу, і багато часу витрачається, будуючи більше точок на …

2
Що таке квазібіноміальний розподіл (в контексті ГЛМ)?
Я сподіваюсь, що хтось може надати інтуїтивний огляд того, що таке квазібіномічний розподіл і що він робить. Мене особливо цікавлять такі моменти: Наскільки квазібіноміальне відрізняється від біноміального розподілу. Коли змінна відповіді є пропорцією (приклади значень включають 0,23, 0,11, 0,78, 0,98), квазібіноміальна модель буде працювати в R, але біноміальна модель не …

2
lme та lmer порівняння
Мені було цікаво, чи може хтось просвітити мене про нинішні відмінності між цими двома функціями. Я знайшов наступне питання: Як вибрати бібліотеку nlme або lme4 R для моделей зі змішаними ефектами? , але це датується пару років тому. Це життя в колах програмного забезпечення. Мої конкретні запитання: Чи є (досі) …

1
Що робить команда anova () з об'єктом моделі lmer?
Сподіваюсь, це питання, на який хтось тут може відповісти за мене про характер розкладання сум квадратів у моделі змішаних ефектів, що відповідає lmer(з пакету lme4 R). По-перше, я повинен сказати, що мені відомо про суперечки з використанням цього підходу, і на практиці я з більшою ймовірністю використовую завантажений LRT для …

2
Тест на бімодальний розподіл
Цікаво, чи є якийсь статистичний тест, щоб "перевірити" значущість бімодального розподілу. Я маю на увазі, наскільки мої дані відповідають бімодальному розподілу чи ні? Якщо так, чи є тест в програмі R?

4
Як виконати зменшення розмірності за допомогою PCA в R
У мене великий набір даних, і я хочу виконати зменшення розмірності. Зараз скрізь я читаю, що для цього можу використовувати PCA. Однак я все ще не можу отримати, що робити після розрахунку / виконання ПКС. У R це легко зробити за допомогою команди princomp. Але що робити після розрахунку PCA? …
30 r  pca 

1
Інтуїція за взаємодією тензорних продуктів у GAM (пакет MGCV в R)
Узагальнені моделі добавок - це такі, де наприклад. функції плавні, і їх слід оцінити. Зазвичай пенальними шліцами. MGCV - це пакет в R, який робить це, і автор (Simon Wood) пише книгу про свій пакет із прикладами R. Ruppert та ін. (2003) написати набагато доступнішу книгу про простіші версії того …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.