Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

1
Як генерувати дані про виживання із залежними від часу коваріатами за допомогою R
Я хочу генерувати час виживання з пропорційною моделлю небезпеки Кокса, яка містить коефіцієнт, залежний від часу. Модель є h(t|Xi)=h0(t)exp(γXi+αmi(t))h(t|Xi)=h0(t)exp⁡(γXi+αmi(t))h(t|X_i) =h_0(t) \exp(\gamma X_i + \alpha m_{i}(t)) де породжується з двочлена (1,0.5) і .XiXiX_imi(t)=β0+β1Xi+β2Xitmi(t)=β0+β1Xi+β2Xitm_{i}(t)=\beta_0 + \beta_1 X_{i} + \beta_2 X_{i} t Справжні значення параметрів використовуються якγ=1.5,β0=0,β1=−1,β2=−1.5,h0(t)=1γ=1.5,β0=0,β1=−1,β2=−1.5,h0(t)=1\gamma = 1.5, \beta_0 = 0, \beta_1 …

1
Розуміння сингулярної декомпозиції значення в контексті LSI
Моє запитання, як правило, щодо сингулярної декомпозиції значення (SVD), зокрема, щодо латентної семантичної індексації (LSI). Скажімо, у мене є що містить частоти 5 слів для 7 документів.Aword×documentAword×document A_{word \times document} A = matrix(data=c(2,0,8,6,0,3,1, 1,6,0,1,7,0,1, 5,0,7,4,0,5,6, 7,0,8,5,0,8,5, 0,10,0,0,7,0,0), ncol=7, byrow=TRUE) rownames(A) <- c('doctor','car','nurse','hospital','wheel') Я отримую матрицю розкладання для за допомогою SVD: …

2
Оцінка коригуваних коефіцієнтів ризику у двійкових даних за допомогою реагресії Пуассона
Мені цікаво оцінити скоригований коефіцієнт ризику, аналогічний тому, як можна оцінити скоригований коефіцієнт шансів за допомогою логістичної регресії. Деяка література (наприклад, ця ) вказує на те, що використання регресії Пуассона зі стандартними помилками Губера-Уайта є модельним способом зробити це Я не знайшов літератури про те, як коригування на безперервні коваріати …

3
Перехресне підтвердження K-згину або витримки для регресії хребта з використанням R
Я працюю над перехресною валідацією прогнозування моїх даних з 200 предметами та 1000 змінними. Мене цікавить регресія хребта, оскільки кількість змінних (я хочу використовувати) більша, ніж кількість вибірки. Тому я хочу використовувати оцінювачі усадки. Наступні складені приклади даних: #random population of 200 subjects with 1000 variables M <- matrix(rep(0,200*100),200,1000) for …

1
anova тест III типу для ГЛММ
Я вписую glmerмодель в lme4пакет R. Я шукаю таблицю anova з вказаною в ній величиною p, але не можу знайти жодного пакета, який би їй підходив. Чи можливо це зробити в R? Модель, яка мені підходить, має форму: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))

5
Логістична регресія на великих даних
У мене набір даних близько 5000 функцій. Для цих даних я вперше використав тест Chi Square для вибору особливостей; після цього я отримав близько 1500 змінних, які показали залежність значущості від змінної відповіді. Тепер мені потрібно підходити до цього логістичної регресії. Я використовую пакунок glmulti для R (пакет glmulti забезпечує …

2
Оцінка параметрів з узагальненими лінійними моделями
За замовчуванням, коли ми використовуємо glmфункцію в R, він використовує метод ітераційно перезавантажених найменших квадратів (IWLS), щоб знайти максимальну оцінку ймовірності параметрів. Зараз у мене два питання. Чи гарантують оцінки IWLS глобальний максимум функції ймовірності? На основі останнього слайду в цій презентації, я думаю, це не так! Я просто хотів …

4
Як зробити багатоваріантне машинне навчання? (передбачення декількох залежних змінних)
Я хочу передбачити групи предметів, які хтось придбає ... тобто у мене є декілька змінних, що залежать від коліна. Замість того, щоб будувати 7 або більше незалежних моделей, щоб передбачити ймовірність того, що хтось купить кожен із 7 предметів, а потім поєднати результати, які методи я повинен розглянути, щоб мати …

2
Баєсовий аналіз таблиць на випадок надзвичайних ситуацій: Як описати розмір ефекту
Я працюю над прикладами в аналізі даних Doing Bayesian Kruske , зокрема експоненціальної пуассонової ANOVA в гл. 22, який він подає як альтернативу часто-часто-тестовим тестам незалежності для таблиць на випадок надзвичайних ситуацій. Я бачу, як ми отримуємо інформацію про взаємодії, які трапляються більш-менш часто, ніж можна було б очікувати, якби …

2
R виявляє тенденцію до збільшення / зменшення тенденції часових рядів
У мене багато часових рядів з періодами: день, тиждень або місяць. За допомогою stl()функції чи за допомогою loess(x ~ y)я можу побачити, як виглядають тенденції певного часового ряду. Мені потрібно виявити, чи збільшується чи зменшується тенденція часових рядів. Як я можу цим керувати? Я намагався обчислити коефіцієнти лінійної регресії lm(x …
9 r  time-series  trend 

1
Поміщення коефіцієнта DLM, що змінюється часом
Я хочу пристосувати DLM до змінних за часом коефіцієнтів, тобто розширення до звичайної лінійної регресії, ут=θ1+θ2х2yt=θ1+θ2x2y_t = \theta_1 + \theta_2x_2 . У мене є предиктор ( ) та змінна відповідь ( y_t ), морський та внутрішній річний вилов риби відповідно з 1950 по 2011 рік. Я хочу, щоб модель регресії …

1
Дивний спосіб обчислення чи-квадрата в Excel проти R
Я дивлюся на лист Excel, який стверджує, що його обчислюють χ2χ2\chi^2, але я не визнаю такого способу цього, і мені було цікаво, чи я щось пропускаю. Ось дані, які він аналізує: +------------------+----------+----------+ | Total Population | Observed | Expected | +------------------+----------+----------+ | 2000 | 42 | 32.5 | | 2000 …
9 r  chi-squared  excel 

3
Чому лінійна регресія не здатна передбачити результат простої детермінованої послідовності?
Кожен мій колега надіслав мені цю проблему, очевидно, роблячи тури в Інтернеті: If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ? Здається, відповідь 200. 3*6 4*8 5*10 6*12 7*14 8*16 9*18 10*20=200 Коли я роблю лінійну регресію в R: …
9 r  regression  lm 

1
R: Анова та лінійна регресія
Я новачок у статистиці і намагаюся зрозуміти різницю між ANOVA та лінійною регресією. Я використовую R для дослідження цього. Я читав різні статті про те, чому ANOVA і регресія відрізняються, але все одно однакові, і як можна візуалізувати і т. Д. Я думаю, що я там симпатичний, але один біт …
9 r  regression  anova 

3
Оцінка потужності тесту на нормальність (в R)
Я хочу оцінити точність тестів на нормальність для різних розмірів вибірки в R (я розумію, що тести на нормальність можуть бути оманливими ). Наприклад, щоб переглянути тест Шапіро-Вілка, я провожу наступне моделювання (а також графік результатів) і очікував би, що в міру збільшення розміру вибірки ймовірність відхилення нуля зменшується: n …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.