Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

3
Як реалізувати змішану модель за допомогою функції betareg в R?
У мене є набір даних, що складається з пропорцій, які вимірюють "рівень активності" окремих пуголовків, тому встановлюють значення, пов'язані між 0 і 1. Ці дані збираються шляхом підрахунку кількості разів, яку людина перемістив за певний проміжок часу (1 для руху, 0 без руху), а потім усереднюється для створення одного значення …

1
Градієнт для функції логістичних втрат
Я б задавав питання, пов’язане з цим . Я знайшов приклад написання спеціальної функції втрати для xgboost тут : loglossobj <- function(preds, dtrain) { # dtrain is the internal format of the training data # We extract the labels from the training data labels <- getinfo(dtrain, "label") # We compute …

1
Який найкращий метод мережевого мета-аналізу?
Зараз існує кілька різних підходів для здійснення мережевого метааналізу або змішаного порівняння лікування. Можливо, найбільш часто використовувані та доступні такі: в байєсівських рамках : підхід взаємодії дизайну за методом лікування в WinBUGS (наприклад, Jackson et al ); ієрархічне байесівське моделювання на основі арм у WinBUGS (наприклад, Чжао та ін ); …

5
Як аналізувати тенденцію в неперіодичних часових рядах
Припустимо, я маю наступні неперіодичні часові ряди. Очевидно, що тенденція зменшується, і я хотів би довести це деяким тестом (з р-значенням ). Я не в змозі використовувати класичну лінійну регресію через сильну тимчасову (послідовну) автокореляцію серед значень. library(forecast) my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9, 6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1), start = 1, end = 27,frequency = 1) …
12 r  time-series 

2
Оптимальне підключення відносно заданої змінної відповіді
Я шукаю оптимальний метод бінінгу (дискретизація) безперервної змінної щодо заданої відповіді (цільової) бінарної змінної та з максимальною кількістю інтервалів як параметр. Приклад: У мене є набір спостережень за людьми зі змінними "висота" (число безперервно) та "has_back_pains" (бінарні). Я хочу розрізнити висоту на 3 інтервали (групи) максимум з різною часткою людей …

2
Алгоритми машинного навчання даних панелей
У цьому запитанні - чи існує метод побудови дерев рішень, який враховує структуровані / ієрархічні / багаторівневі предиктори?- вони згадують метод панельних даних для дерев. Чи існують конкретні методи даних панелей для підтримки векторних машин та нейронних мереж? Якщо так, чи можете ви навести деякі документи для алгоритмів та (якщо …

1
Тестування великого набору даних на предмет нормальності - наскільки і чи надійно це?
Я вивчаю частину мого набору даних, що містить 46840 подвійних значень, розміром від 1 до 1690, згрупованих у дві групи. Для того, щоб проаналізувати відмінності між цими групами, я почав з вивчення розподілу значень, щоб вибрати правильний тест. Дотримуючись інструкції з тестування на нормальність, я зробив qqplot, гістограму та boxplot. …

1
Точний тест Фішера та гіпергеометричне поширення
Я хотів краще зрозуміти точний тест Фішера, тому я розробив наступний іграшковий приклад, де f і m відповідає чоловічому та жіночому, а n і y відповідає такому "споживання соди", як це: > soda_gender f m n 0 5 y 5 0 Очевидно, це різке спрощення, але я не хотів, щоб …

1
Чи потрібна попередня обробка перед прогнозуванням за допомогою FinalModel of RandomForest з пакетом caret?
Я використовую пакет caret для навчання випадкового об'єкта Forest з 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Після цього я тестую randomForest на testSet (нові дані) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) Матриця плутанини показує мені, що модель не така вже …

2
Чому I Моран не дорівнює “-1” у ідеально розсіяній точці
Вікіпедія помилкова ... чи я її не розумію? Вікіпедія: Білі та чорні квадрати («шаховий малюнок») ідеально розійшлися, так що в Морана я був би -1. Якби білі квадрати були складені до однієї половини дошки, а чорні - до іншої, то для Морану я був би близький до +1. Випадкове розташування …

1
Динамічний факторний аналіз та модель простору стану
Пакет MARSS в R пропонує функцію динамічного аналізу факторів. У цьому пакеті динамічна факторна модель записана як особлива форма моделі простору стану, і вони припускають, що загальні тенденції слідують за процесом AR (1). Оскільки я не дуже знайомий з цими двома методами, я стикаюся з двома питаннями: Чи є динамічний …

1
Маніпулювання логістичною регресійною моделлю
Я хотів би зрозуміти, що робить наступний код. Людина, яка написала код, вже не працює тут, і він майже повністю недокументований. Мене попросили дослідити це хтось, хто думає, що " це байєсівська модель логістичної регресії " bglm <- function(Y,X) { # Y is a vector of binary responses # X …

2
Інтерпретація сюжету QQ
Розглянемо наступний код та вихід: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Схоже, що цей QQ-графік для log-normal майже такий самий, як QQ-графік …

1
Функція витрат для перевірки регресійних моделей Пуассона
Для підрахунку даних, які я зібрав, я використовую регресію Пуассона для побудови моделей. Я роблю це за допомогою glmфункції в R, де я використовую family = "poisson". Для оцінки можливих моделей (у мене є кілька прогнозів) я використовую AIC. Все йде нормально. Тепер я хочу здійснити перехресну перевірку. Мені вже …

2
Інтерпретація результату кластеризації k-засобів у R
Я використовував kmeansінструкцію R для виконання алгоритму k-означає на наборі даних ірису Андерсона. У мене питання про деякі параметри, які я отримав. Результати: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 У цьому випадку, що означає «Кластер»? Це середнє значення відстаней усіх об'єктів у кластері? Також в …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.