Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

1
Оцінка логістичної регресійної моделі
Я працюю над логістичною моделлю, і у мене виникають певні труднощі з оцінкою результатів. Моя модель - двочленний логіт. Мої пояснювальні змінні: категорична змінна з 15 рівнями, дихотомна змінна та 2 безперервні змінні. Мій N великий> 8000. Я намагаюся моделювати рішення фірм інвестувати. Залежна змінна - це інвестиція (так / …

2
дисперсія в резюме.glm ()
Я провів glm.nb о glm1<-glm.nb(x~factor(group)) при цьому група є категоріальною, а х - метричною змінною. Коли я намагаюся отримати підсумок результатів, я отримую дещо інші результати, залежно від того, використовую summary()чи summary.glm. summary(glm1)дає мені ... Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.1044 0.1519 0.687 0.4921 factor(gruppe)2 0.1580 0.2117 …

4
Boxplot еквівалент для важкохвостих розподілів?
Для приблизно нормально розповсюджених даних, боксплоти - це прекрасний спосіб швидкої візуалізації медіани та розповсюдження даних, а також наявності будь-яких залишків. Однак для більш важкохвостих розподілів, багато очок відображаються як екслієри, оскільки люди, що визначають перешкоди, визначаються як такі, що не мають фіксованого коефіцієнта IQR, і це, звичайно, відбувається набагато …

2
Лінійна проти нелінійна регресія
У мене є набір значень і які теоретично пов'язані експоненціально:уxxxyyy y=axby=axby = ax^b Одним із способів отримання коефіцієнтів є застосування природних логарифмів в обидві сторони та встановлення лінійної моделі: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Інший спосіб отримати це - використання нелінійної регресії з …

1
Структурні рівняння: як вказати ефекти взаємодії в пакеті R lavaan
Я використовую пакет R lavaan для оцінки моделі структурного рівняння. Скажімо, модель складається з 1 ендогенної маніфестної змінної з 1 латентною та 2 маніфестною пояснювальною змінними: group = {0,1} attitude1 = latent,scale age = respondent's age Потім потрібна модель лавану (не працює): model <- ' attitude1 =~ att1 + att2 …
13 r  interaction  sem  lavaan 

3
Як обчислити основні компоненти, обернені варімакс в R?
Я провів PCA на 25 змінних і вибрав топ-7 ПК за допомогою prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Тоді я здійснив обертання varimax на цих компонентах. varimax7 <- varimax(prc$rotation[,1:7]) А тепер я хочу, щоб varimax обертав дані, обернені PCA (оскільки це не частина об'єкта varimax - лише матриця завантаження …
13 r  pca  factor-rotation 

4
Інтерполяція даних про грип, яка зберігає середню тиждень
Редагувати Я знайшов документ, що описує саме ту процедуру, яка мені потрібна. Єдина відмінність полягає в тому, що папір інтерполює середньомісячні дані на щоденні, зберігаючи щомісячні засоби. У мене є проблеми реалізувати підхід у R. Будь-які підказки цінуються. Оригінал Для кожного тижня я маю такі дані підрахунку (одне значення на …

3
Великі дані кластера в R та чи є вибірка релевантною?
Я новачок у науці даних і маю проблему з пошуку кластерів у наборі даних із 200 000 рядків та 50 стовпців у Р. Оскільки дані мають як числові, так і номінальні змінні, такі методи, як K-засоби, які використовують евклідову міру відстані, не здаються відповідним вибором. Тому я звертаюся до PAM, …

2
Чи не повинен SVD взагалі нічого пояснювати для випадкової матриці? Що я роблю неправильно?
Якщо я будую 2-D матрицю, повністю складається з випадкових даних, я б очікував, що компоненти PCA та SVD по суті нічого не пояснюють. Натомість, здається, що перший стовпець SVD пояснює 75% даних. Як це можливо? Що я роблю неправильно? Ось сюжет: Ось код R: set.seed(1) rm(list=ls()) m <- matrix(runif(10000,min=0,max=25), nrow=100,ncol=100) …
13 r  pca  svd 

1
Розуміння прогнозів від логістичної регресії
Мої прогнози, що випливають з логістичної регресійної моделі (glm в R), не обмежені між 0 і 1, як я очікував. Моє розуміння логістичної регресії полягає в тому, що параметри вводу та моделі поєднуються лінійно і відповідь перетворюється на ймовірність за допомогою функції посилання logit. Оскільки функція logit обмежена між 0 …

2
Чи існує пакет R для безперервних подовжених бінарних відповідей?
bildПакет , здається, чудовий пакет для послідовних бінарних відповідей. Але це для дискретного часу. Я хотів би вказати плавну функцію часу для з'єднання співвідношення шансів поточної відповіді Y з двійковими відповідями, виміряними в більш ранні часи, або, принаймні, першою черговою версією Маркова. Я вважаю, що це називається чергуванням логістичної регресії. …

2
Числові розв'язувачі для стохастичних диференціальних рівнянь у R: чи є?
Я шукаю загальний, чистий і швидкий (тобто, використовуючи підпрограми C ++) R для імітації шляхів з неоднорідної нелінійної дифузії типу (1) за допомогою схеми Ейлера-Маруями, схеми Мільштейна (або будь-якої іншої). Це призначено для вбудовування в більшу оціночну версію і тому заслуговує на оптимізацію. гХт= f( θ , t , Xт)гt …

1
Лінійна регресія та просторово-автокореляція
Я хочу передбачити висоту дерева в певній області, використовуючи деякі змінні, отримані за допомогою дистанційного зондування. Як приблизна біомаса тощо. Спочатку я хочу використовувати лінійну регресію (я знаю, що це не найкраща ідея, але це необхідний крок для мого проекту). Мені хотілося знати, як погано може впливати на нього просторова …

3
Чи дійсно компоненти PCA представляють відсоток дисперсії? Чи можуть вони становити більше 100%?
"Машинне навчання хакерам" О'Рейлі говорить, що кожен головний компонент становить відсоток дисперсії. Я цитував відповідну частину сторінки нижче (глава 8, с.207). Розмовляючи з іншим експертом, вони погодилися, що це відсоток. Однак 24 компоненти складають 133.2095%. Як це може бути? Переконавшись у тому, що ми можемо використовувати PCA, як це робити …
13 r  pca 

1
Допоможіть мені зрозуміти
Я намагаюся запустити байєсівський логіт на даних тут . Я використовую bayesglm()в armпакеті в Р. Кодування досить просто: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) дає такий вихід: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.10381 0.10240 1.014 0.311 SEXMale 0.02408 …
13 r  bayesian  p-value 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.