Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

4
Які змінні пояснюють, які компоненти PCA, і навпаки?
Використовуючи ці дані: head(USArrests) nrow(USArrests) Я можу зробити PCA так: plot(USArrests) otherPCA <- princomp(USArrests) Я можу отримати нові компоненти otherPCA$scores і частка дисперсії, поясненої компонентами з summary(otherPCA) Але що робити, якщо я хочу знати, які змінні в основному пояснюються основними компонентами? І навпаки: пояснюється, наприклад, PC1 або PC2 murder? Як …

3
Перевірте, чи багатовимірні розподіли однакові
Скажімо, у мене є дві або більше вибіркових сукупностей n-мірних векторів безперервного значення. Чи є непараметричний спосіб перевірити, чи є ці зразки з одного розподілу? Якщо так, чи є для цього функція в R або python?

2
Чому lrtest () не відповідає anova (test = “LRT”)
Я шукав способи зробити тест на коефіцієнт ймовірності в R, щоб порівняти відповідність моделі. Спочатку я кодував це сам, потім знайшов як функцію за замовчуванням, так anova()і lrtest()в lmtestпакеті. Однак, коли я перевіряв, anova()завжди створює дещо інше значення p від інших двох, навіть якщо для параметра "test" встановлено значення "LRT". …

1
Чи може логістична регресія glmnet безпосередньо обробляти факторні (категоричні) змінні, не потребуючи фіктивних змінних? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 3 роки тому . Я будую логістичну регресію в R за допомогою методу LASSO з функціями cv.glmnetвибору lambdaі glmnetдля кінцевої моделі. Я вже знаю всі недоліки …

1
Як випадкові ефекти лише з 1 спостереженням вплинуть на узагальнену лінійну змішану модель?
У мене є набір даних, в якому змінна, яку я хотів би використовувати як випадковий ефект, має лише одне спостереження для деяких рівнів. На основі відповідей на попередні запитання я зібрав, що в принципі це може бути добре. Чи можу я відповідати змішаній моделі з предметами, які мають лише 1 …

3
За яким розподілом відбувається обернена нормальна CDF бета-випадкової змінної?
Припустимо, Ви визначаєте: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) де - зворотна CDF стандартного нормального розподілу .Φ−1Φ−1\Phi^{-1} Моє запитання: чи існує простий розподіл, який слід , або який може наближати ? YYYYYY Y α β α = 1 ; β = 1 X YЯ запитую, оскільки у мене є сильні підозри на основі …

2
Різні результати від randomForest за допомогою карети та базового пакету randomForest
Я трохи розгублений: як результати тренованої моделі за допомогою карети можуть відрізнятися від моделі в оригінальній упаковці? Читаю, чи потрібна попередня обробка перед прогнозуванням за допомогою FinalModel of RandomForest з пакетом caret?але я тут не використовую жодної попередньої обробки. Я навчав різні випадкові ліси, використовуючи пакет карет і налаштовуючи різні …

1
Від досвіду (коефіцієнтів) до коефіцієнта коефіцієнта та їх інтерпретації в логістичній регресії з факторами
Я провів лінійну регресію прийому до коледжу на основі балів SAT та сімейного / етнічного походження. Дані вигадані. Це продовження попереднього запитання, вже відповіді. Питання фокусується на збиранні та інтерпретації коефіцієнтів шансів, залишаючи бали SAT осторонь простоти. Змінні: Accepted(0 або 1) та Background("червоний" чи "синій"). Я налаштував дані, щоб люди …
14 r  regression  logistic 

3
Як обчислити перекриття між емпіричними щільністю ймовірності?
Я шукаю метод обчислення площі перекриття між двома оцінками щільності ядра в R, як міру подібності між двома вибірками. Щоб уточнити, у наступному прикладі мені потрібно було б кількісно визначити область пурпурної області, що перекривається: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) …

1
Тест на коефіцієнт ймовірності - lmer R - Невкладені моделі
Зараз я переглядаю деяку роботу і натрапив на таке, що мені здається неправильним. Дві змішані моделі встановлені (в R) за допомогою lmer. Моделі не вкладені і порівнюються за тестами співвідношення ймовірності. Коротше кажучи, ось відтворювальний приклад того, що я маю: set.seed(105) Resp = rnorm(100) A = factor(rep(1:5,each=20)) B = factor(rep(1:2,times=50)) …

3
Чи можу я відновити нормальний розподіл за розміром вибірки, значеннями min та max? Я можу використовувати середню точку для проксі середнього
Я знаю, що це може бути трохи моторошно, статистично, але це моя проблема. У мене дуже багато даних про діапазон, тобто мінімальний, максимальний і розмір вибірки змінної. Для деяких із цих даних я також маю на увазі, але не багато. Я хочу порівняти ці діапазони один з одним, щоб кількісно …

3
Зважування останніх даних у моделі Random Forest
Я треную класифікаційну модель із випадковим лісом для розмежування між 6 категоріями. Мої трансакційні дані мають приблизно 60 К + спостережень та 35 змінних. Ось приклад того, як це приблизно виглядає. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 | 2013-04-12 | …

1
Як намалювати випадкові вибірки з непараметричного оціночного розподілу?
У мене є вибірка з 100 точок, які є суцільними та одновимірними. Я оцінив його непараметричну щільність за допомогою методів ядра. Як я можу взяти випадкові вибірки з цього розрахункового розподілу?

3
Розуміння смуги довіри від поліноміальної регресії
Я намагаюся зрозуміти результат, який я бачу в своєму графіку нижче. Зазвичай я схильний використовувати Excel і отримую лінійно-регресійну лінію, але у випадку нижче я використовую R і отримую поліноміальну регресію з командою: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Тож мої запитання зводяться до цього: Яка сіра зона (стрілка №1) …

3
Алгоритм регресійного дерева з лінійними моделями регресії в кожному аркуші
Коротка версія: Я шукаю пакет R, який може будувати дерева рішень, тоді як кожен лист у дереві рішень - це повна модель лінійної регресії. AFAIK, бібліотека rpartстворює дерева рішень, де залежна змінна є постійною у кожному аркуші. Чи є інша бібліотека (або rpartустановка, про яку я не знаю), яка може …
14 r  regression  rpart  cart 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.