Запитання з тегом «r»

Використовуйте цей тег для будь-якого питання * на тему *, який (a) включає `R` як критичну частину запитання або очікувану відповідь, а (b) - не * просто * про те, як використовувати` R`.

2
Як отримати результати постсоціального тесту Tukey HSD у таблиці, що показує згруповані пари?
Я хотів би провести пост-хок-тест TukeyHSD після моєї двосторонньої Anova з R, отримавши таблицю, що містить відсортовані пари, згруповані за суттєвою різницею. (Вибачте за формулювання, я все ще нова в статистиці.) Я хотів би мати щось подібне: Отже, згруповані з зірками чи літерами. Будь-яка ідея? Я перевірив функцію HSD.test()з agricolaeпакету, …

1
Прогнози з використанням glmnet в R
Я намагаюся моделювати деякі дані за допомогою glmnetпакету в Р. Скажімо, у мене є такі дані training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3), variable2 = c(1, 2, 3, 4, 5)) y <- c(1, 2, 3, 4, 5) (Це спрощення; мої дані набагато складніші.) Тоді я використовував наступний код …
13 r  glmnet 

6
Випадковий ліс: як поводитися з новими рівнями факторів у тестовому наборі?
Я намагаюся робити прогнози, використовуючи випадкову лісову модель у Р. Однак я отримую помилки, оскільки деякі фактори мають різні значення в тестовому наборі, ніж у навчальному наборі. Наприклад, коефіцієнт Cat_2має значення 34, 68, 76тощо у тестовому наборі, які не відображаються у навчальному наборі. На жаль, я не маю контролю над …

2
Що таке тести на шматки?
Відповідаючи на запитання щодо вибору моделі за наявності мультиколінеарності , Френк Харрелл запропонував : Помістіть усі змінні в модель, але не перевіряйте ефект однієї змінної, скоригованої на ефекти конкуруючих змінних ... Тести блоку конкуруючих змінних є потужними, оскільки колінеарні змінні об'єднують сили в загальний тест на асоціацію множинного ступеня свободи, …

3
Рубі як робочий стіл статистики
Це також питання, яке дуже стосується Python як верстата для статистики та excel як робочого місця зі статистикою . Я знаю, що про Рубі проти Python ведеться велика дискусія, але це питання не в цьому. Я думав, що Рубі швидше, ніж Python і має дуже природний синтаксис, може принести користь …
13 r  python  software  ruby 

3
Чи є формула або правило для визначення правильного sampSize для randomForest?
Я граю з randomForest і виявив, що загалом збільшення sampSize призводить до кращої продуктивності. Чи існує правило / формула / тощо, яке підказує, яким повинен бути оптимальний sampSize або це річ проб і помилок? Я здогадуюсь іншого способу її фразування; які мої ризики занадто малого розміру sampSize або занадто великого …
13 r  random-forest 

2
Проаналізуйте пропорції
У мене є набір даних, що містить декілька пропорцій, які складають до 1. Мене цікавить зміна цих пропорцій уздовж градієнта (див. Нижче, наприклад, дані). gradient <- 1:99 A1 <- gradient * 0.005 A2 <- gradient * 0.004 A3 <- 1 - (A1 + A2) df <- data.frame(gradient = gradient, A1 …
13 r  multinomial 

1
Розрахунки потужності / розмір вибірки для дослідження біомаркерів
У нас є потенційний біомаркер для прогнозування того, хворий на рак чи ні. Результатом тесту на біомаркер є двійкові позитивні чи негативні. Ми хочемо зрозуміти кількість пацієнтів, які потребують тестування, щоб визначити, чи є цей біомаркер хорошим прогнозом чи ні. Якщо читати в Інтернеті, то, схоже, слід поглянути на чутливість …
13 r  power 

2
Оцінка логістичних регресійних моделей
Це питання виникає з моєї фактичної плутанини щодо того, як вирішити, чи достатньо хороша логістична модель. У мене є моделі, які використовують стан пар індивідуальний проект через два роки після їх формування як залежної змінної. Результат успішний (1) чи ні (0). У мене є незалежні змінні, виміряні в момент утворення …


4
Намалюйте кілька графіків на одному графіку в R?
Використовуючи наступний код, я спробував намалювати чотири графіки на графіку в R. Я не задоволений фігурою, оскільки між ділянками є багато місця, тому ширина ділянок недостатня для аналізу ділянок. Може хтось допоможе мені скласти хороший графік, що має чотири сюжети? Як я можу зберігати мітки осі x від 1 до …

5
R лише альтернативи BUGS [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закритий минулого року . Я стежу за курсом байєсівської статистики за допомогою BUGS та R. Тепер я вже знаю BUGS, це чудово, але я не дуже люблю …
13 r  bayesian  bugs 

2
Boxplot по відношенню до двох факторів, що використовують ggplot2 в R
Заблокований . Це запитання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. Я дуже новачок у R та в будь-яких пакунках у Р. Я переглянув документацію ggplot2, але не зміг її знайти. Я хочу поле поле змінної boxthisщодо …
13 r  boxplot  ggplot2 

4
Пакет R / Stata для нульового усіченого негативного біноміального GEE?
це моє перше повідомлення. Я щиро вдячний цій громаді. Я намагаюся проаналізувати дані поздовжнього підрахунку, які є нульовими (усі ймовірність того, що змінна відповіді = 0 дорівнює 0), і середнє значення! = Дисперсія, тому було вибрано негативний біноміальний розподіл по пуассону. Функції / команди, які я виключив: R функція gee …

2
Розуміння порівнянь результатів кластеризації
Я експериментую з класифікацією даних на групи. Я досить новачок у цій темі, і намагаюся зрозуміти результат деяких аналізів. За допомогою прикладів Quick-R пропонується кілька Rпакетів. Я спробував використовувати два з цих пакетів ( fpcза допомогою kmeansфункції та mclust). Один із аспектів цього аналізу, який я не розумію, - це …
13 r  clustering 

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.