Запитання з тегом «continuous-data»

Випадкова величина X називається безперервним, якщо його набір можливих значень незлічен, а шанс, що він приймає якесь конкретне значення, дорівнює нулю (P(X=x)=0 для кожного реального числа x). Випадкова величина є безперервною тоді і лише тоді, коли її функція кумулятивного розподілу ймовірностей є безперервною функцією.

6
Кореляції з не упорядкованими категоричними змінними
У мене є кадр даних з багатьма спостереженнями та багатьма змінними. Деякі з них є категоричними (не упорядкованими), а інші - числовими. Я шукаю асоціацій між цими змінними. Мені вдалося обчислити кореляцію для числових змінних (кореляція Спірмена), але: Я не знаю, як виміряти співвідношення між невпорядкованими категоричними змінними. Я не …

7
Яка користь від розриву суцільної змінної предиктора?
Мені цікаво, яке значення має взяття суцільної змінної предиктора та розбиття його (наприклад, на квінтили), перш ніж використовувати його в моделі. Мені здається, що, поширюючи змінну, ми втрачаємо інформацію. Це просто так, щоб ми могли моделювати нелінійні ефекти? Якби ми зберігали змінну безперервною, і це насправді не було прямим лінійним …

1
Кореляція між номінальною (IV) та суцільною (DV) змінною
У мене є номінальна змінна (різні теми розмови, кодовані як тема0 = 0 тощо) та ряд змінних масштабів (DV), таких як тривалість розмови. Як я можу отримати кореляції між номінальною та масштабною змінними?

3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
Чи є сенс ставитись до категоричних даних як до безперервних?
Відповідаючи на це запитання щодо дискретних та безперервних даних, я з глибоким твердженням стверджував, що рідко є сенс трактувати категоричні дані як безперервні. Зважаючи на це, це здається само собою зрозумілим, але інтуїція часто є поганим посібником для статистики, або, принаймні, моя. Тож зараз мені цікаво: це правда? Або є …

5
Кластеризація набору даних як дискретних, так і безперервних змінних
У мене є набір даних X з 10 вимірами, 4 з яких - дискретні значення. Насправді ці 4 дискретні змінні є порядковими, тобто більш високе значення означає більш високу / кращу семантичну. 2 з цих дискретних змінних є категоричними в тому сенсі, що для кожної з цих змінних відстань, наприклад, …

4
Прогнозування як безперервних, так і категоричних особливостей
Деякі методи моделювання прогнозування більш розроблені для роботи з безперервними прогнозами, а інші - для управління категоричними або дискретними змінними. Звичайно, існують методи перетворення одного типу в інший (дискретизація, фіктивні змінні тощо). Однак чи існують методи прогнозування моделювання, призначені для обробки обох типів введення одночасно, не просто перетворюючи тип функцій? …

2
Безперервне узагальнення негативного біноміального розподілу
Негативний двочленний (NB) розподіл визначається на невід'ємні цілі числа і має функцію масової ймовірностіЧи має сенс розглянути безперервний розподіл на негативних реалах, визначених тією ж формулою (замінивши на x \ in \ mathbb R _ {\ ge 0} )? Біноміальний коефіцієнт можна переписати як добуток (k + 1) \ cdot …

2
Коли ми повинні дискретизувати / бін безперервні незалежні змінні / функції, а коли не слід?
Коли ми повинні дискретизувати / бін незалежні змінні / функції, а коли не слід? Мої спроби відповісти на питання: Взагалі, ми не повинні бініти, оскільки бінінг втратить інформацію. Бінінг насправді збільшує ступінь свободи моделі, тому можливе сприятливе пристосування після бінінгу. Якщо у нас є модель "з великим ухилом", бінінг може …

2
Уніфікована випадкова величина як сума двох випадкових величин
Взяті від Гріммета та Стірцакера : Покажіть, що не може бути випадку, що де рівномірно розподілено на [0,1], а і незалежні та однаково розподілені. Не слід вважати, що X і Y - суцільні змінні.U = X + YU=X+YU=X+YU X YUUXXYY Простий доказ протиріччя достатній для випадку, коли , вважаються дискретними, …

1
Як вибрати між ANOVA та ANCOVA в розробленому експерименті?
Я провожу експеримент, який має наступне: DV: Споживання скибочок (безперервне або може бути категоричним) IV: Здорове повідомлення, нездорове повідомлення, відсутність повідомлення (контроль) (3 групи, до яких люди призначаються випадковим чином - категоричні) Це маніпульоване повідомлення про здоров’я шматочка. Наступні IV можна вважати індивідуальними змінними різниці: Імпульсивність (це може бути категоричним, …


2
Чи завжди перехід від безперервних даних до категоричних завжди помиляється?
Коли я читаю про те, як налаштувати ваші дані, одне, що мені часто траплялося, - це те, що перетворення деяких безперервних даних у категоричні дані не є хорошою ідеєю, оскільки ви дуже добре можете зробити неправильний висновок, якщо пороги погано визначені. Однак на даний момент у мене є деякі дані …

1
Як правильно оцінити співвідношення між порядковою та суцільною змінною?
Я хотів би оцінити співвідношення між: Порядкова змінна: суб'єктам пропонується оцінити їх перевагу для 6 видів фруктів за шкалою 1-5 (від дуже огидної до дуже смачної). В середньому випробувані використовують лише 3 бали шкали. Безперервна змінна: ті ж суб'єкти просять швидко визначити ці плоди, що призводить до середньої точності для …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.