Запитання з тегом «categorical-data»

Категоричні (також їх називають номінальними) дані можуть приймати обмежену кількість можливих значень, званих категоріями. Категоричні значення "мітка", вони не "вимірюють". Будь ласка, використовуйте тег [ordinal-data] для дискретних, але упорядкованих типів даних.

1
Інтерпретація коефіцієнтів взаємодії категоріальної та безперервної змінної
У мене є питання про інтерпретацію коефіцієнтів взаємодії між неперервною та категоричною змінною. ось моя модель: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 -1.785 0.07469 . …

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
Манекени із змінними пастками
Я використовую велику регресію OLS, де всі незалежні змінні (приблизно 400) - фіктивні змінні. Якщо всі включені, існує ідеальна мультиколінеарність (фільтр фіктивних змінних), тому я повинен опустити одну із змінних, перш ніж запустити регресію. Перше моє запитання: яку змінну слід опустити? Я читав, що краще опустити змінну, яка присутня у …

1
Чому стовпець перехоплення в model.matrix замінює перший фактор?
Я намагаюся перетворити свій факторний стовпчик на фіктивні змінні: str(cards$pointsBin) # Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ... labels <- model.matrix(~ pointsBin, data=cards) head(labels) # (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300 # 741 1 0 0 0 0 # 407 1 1 …

4
Розробіть статистичний тест, щоб виділити два продукти
У мене є набір даних з опитування клієнтів, я хочу розгорнути статистичний тест, щоб побачити, чи є різниця між значущістю продукту 1 і продуктом 2. Ось набір даних відгуків клієнтів. Коефіцієнт - від дуже поганого, поганого, добре, хорошого, до дуже хорошого. customer product1 product2 1 very good very bad 2 …

1
Метод опитування на особистих тканинах
Мій друг статистики розповів мені про цікаву методику, яка використовувалась для отримання чесних відповідей на опитування, які стосувались чутливих питань. Я пригадую загальну суть методу, але мені цікаво, чи хтось знає деталі та чи на нього десь посилаються. Історія полягала в тому, що Флорида AMA хотіла оцінити вживання наркотиків серед …

2
Як побудувати взаємодію між фактором і безперервним коваріатом?
Я хотів би побудувати на одному графіку взаємодію між моїм безперервним прогноктором та моїм категоричним модератором. Я знаю, як це зробити, коли обидва є категоричними ( факторна взаємодія ), але насправді не знаю, як це зробити, коли один безперервний, а другий - категоричний.

2
Кореляція між категоріями між категоричними номінальними змінними
У мене є набір даних з двома категоричними номінальними змінними (обидві з 5 категоріями). Мені хотілося б знати, чи (і як) мені вдається виявити потенційні кореляції між категоріями цих двох змінних. Іншими словами, чи, наприклад, результати категорії в змінній 1 показують сильну кореляцію з конкретною категорією у змінній 2. Оскільки …

2
Параметричне, напівпараметричне та непараметричне завантаження для змішаних моделей
Наступні трансплантати взяті з цієї статті . Я новачок у завантажувальній програмі та намагаюся реалізувати параметричне, напівпараметричне та непараметричне завантажувальне завантаження для лінійної змішаної моделі з R bootпакетом. R код Ось мій Rкод: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
Як виміряти кореляцію між категоріальною змінною? [дублікат]
На це питання вже є відповідь тут : співвідношення між категоричними змінними (1 відповідь) Закрито 6 місяців тому . Я знаю, що ми можемо використовувати Spearman rho для вимірювання кореляції між числовими змінними. Але як виміряти кореляцію між категоричними змінними?

1
Як підібрати модель Бредлі – Террі – Люсі в R, без складної формули?
Модель Бредлі – Террі – Люсі (BTL) зазначає, що , де - ймовірність того, що об'єкт вважається "кращим", важчі тощо, ніж об'єкт , і , і - параметри.pj i= л о гiт- 1(δj-δi)pji=логiт-1(δj-δi)p_{ji} = logit^{-1}(\delta_j - \delta_i)pi jpijp_{ij}jjjiiiδiδi\delta_iδjδj\delta_j Це, здається, є кандидатом на функцію glm, з сімейством = двочлен. Однак …

4
Як реалізувати фіктивну змінну за допомогою змінних n-1?
Якщо у мене є змінна з 4 рівнями, теоретично мені потрібно використовувати 3 фіктивні змінні. На практиці, як це насправді здійснюється? Чи використовую 0-3, чи використовую 1-3, а 4 залишаю порожнім? Будь-які пропозиції? ПРИМІТКА. Я буду працювати в Р. ОНОВЛЕННЯ: Що буде, якщо я просто використовую один стовпець, який використовує …

2
Найкращі практики при обробці даних діапазону як безперервних
Я дивлюся, чи достаток пов’язаний із розмірами. Розмір (звичайно) безперервний, проте достаток записується в такій масштабі A = 0-10 B = 11-25 C = 26-50 D = 51-100 E = 101-250 F = 251-500 G = 501-1000 H = 1001-2500 I = 2501-5000 J = 5001-10,000 etc... А через Q …

3
Чи можуть випадкові ефекти застосовуватися лише до категоричних змінних?
Ці питання можуть здатися дурними, але ... чи правильно, що випадкові ефекти можуть застосовуватися лише до категоричних змінних (наприклад, індивідуальний ідентифікатор, ідентифікатор сукупності, ...), наприклад, скажімо, є категоріальною змінною:хixix_i уiyiy_i ~βхiβxi\beta_{x_i} βхiβxi\beta_{x_i} ~No r m ( μ ,δ2)Norm(μ,δ2)Norm(\mu, \delta^2) але від принципу випадковий ефект не може застосовуватися до постійної змінної …

2
Корекція безперервності для 2 таблиць на випадок надзвичайних ситуацій
Мені хотілося б зібрати інформацію від людей на місцях про корекцію безперервності Yates для 2 x 2 таблиць на випадок надзвичайних ситуацій. У статті Вікіпедії згадується, що вона може надто далеко регулюватися, і тому використовується лише в обмеженому сенсі. Родинний пост тут не пропонує набагато глибший. Тож людям, які регулярно …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.