Запитання з тегом «binary-data»

Двійкова змінна приймає одне з двох значень, як правило, кодується як "0" і "1".

1
Як інтерпретувати коефіцієнт другої стадії в регресії інструментальних змінних за допомогою бінарного інструменту та бінарної ендогенної змінної?
(досить довгий пост, вибачте. Він містить багато довідкової інформації, тому сміливо переходьте до питання внизу.) Вступ: Я працюю над проектом, де ми намагаємось визначити вплив бінарної ендогенної змінної, , на постійний результат, . Ми придумали інструмент , на який ми впевнені, що він призначений як- небудь випадково.х1x1x_1уyyz1z1z_1 Дані: Самі дані …

3
Змінна показника для двійкових даних: {-1,1} проти {0,1}
Я зацікавлений в лікувально-коваріат взаємодій в контексті експериментів / рандомізованих контрольованих досліджень, з бінарним призначення лікування індикатора .TTT Залежно від конкретного методу / джерела, я бачив і і для оброблених та необроблених суб'єктів відповідно.T={1,0}T={1,0}T=\{1,0\}T={1,−1}T={1,−1}T=\{1, -1\} Чи є якесь правило, коли використовувати або ?{1,0}{1,0}\{1,0\}{1,−1}{1,−1}\{1, -1\} Чим інтерпретація відрізняється?

1
Моделювання автокорельованих двійкових часових рядів
Які звичні підходи до моделювання бінарних часових рядів? Чи є папір чи текстова книга, де це обробляється? Я думаю про бінарний процес із сильним автокореляцією. Щось на зразок ознаки процесу AR (1), що починається з нуля. Скажіть і з білим шумом . Тоді двійковий часовий ряд визначений Y_t = \ …

1
Чи коли-небудь гарна ідея надати «частковий кредит» (постійний результат) у навчанні логістичної регресії?
Я треную логістичну регресію, щоб передбачити, які бігуни, швидше за все, закінчать виснажливу гонку на витривалість. Дуже мало бігунів завершують цю гонку, тому у мене важкий класовий дисбаланс і невеликий зразок успіхів (можливо, кілька десятків). Я відчуваю, що міг би отримати якийсь гарний "сигнал" від десятків бігунів, які ледь не …

1
Які небезпеки обчислення Пірсонових кореляцій (замість тетрахорних) для бінарних змінних у факторному аналізі?
Я займаюся дослідженнями навчальних ігор, і деякі мої поточні проекти передбачають використання даних BoardGameGeek (BGG) та VideoGameGeek (VGG) для вивчення взаємозв'язків між елементами дизайну ігор (тобто, "встановлених у Другій світовій війні", "включає кочення" ) та рейтинги гравців у цих іграх (тобто бали з 10). Кожен з цих елементів дизайну відповідає …

3
Як візуалізувати байєсовську користь пристосованості для логістичної регресії
Для проблеми байєсівської логістичної регресії я створив задній прогнозний розподіл. Я беру вибірку з прогнозного розподілу і отримую тисячі зразків (0,1) за кожне маю спостереження. Візуалізація корисності придатності є менш ніж цікавою, наприклад: Цей сюжет показує 10 000 зразків + спостережна точка даної точки (шлях зліва може виділити червону лінію: …

2
Рекомендована процедура аналізу факторів на дихотомічні дані з R
Мені потрібно провести факторний аналіз на наборі даних, що складається з дихотомних змінних (0 = так, 1 = ні), і я не знаю, чи я на правильному шляху. Використовуючи, tetrachoric()я створюю кореляційну матрицю, на якій я запускаюсь fa(data,factors=1). Результат дуже близький до результатів, які я отримую при використанні MixFactor , …

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
Для проблеми класифікації, якщо змінна класу має неоднакове розподіл, яку техніку ми повинні використовувати?
напр. якщо у мене є оцінка кредитної змінної з двома класами - хороший і поганий, де # (хороший) = 700 і # (погано) = 300. Я не хочу скорочувати свої дані. яку техніку я повинен використовувати? Я використовував SVM, але він дає все погане як хороше в прогнозах.

4
Як слід підходити до цієї проблеми бінарного передбачення?
У мене є набір даних із наступним форматом. Рак бінарного результату / рак немає. Кожен лікар у наборі даних бачив кожного пацієнта і давав незалежне рішення щодо того, хворий на рак чи ні. Потім лікарі дають рівень впевненості з 5, що їх діагноз правильний, а рівень довіри відображається в дужках. …

5
Як виміряти ефективність класифікатора, коли близько 100% міток класу належать одному класу?
У моїх даних, у мене є змінна класу, позначена як . Значення змінної цього класу становлять (двійкові). Практично всі спостереження мають 0 (близько 100%, точніше, 97%). Мені б хотілося "тестування" продуктивності на різних моделях класифікації (це може бути точність). Мені страшно траплятися, що якщо у мене є класифікаційна модель, яка …

3
Обчислення коефіцієнта Жакарда або іншого асоціації для двійкових даних за допомогою множення матриць
Я хочу знати, чи є можливий спосіб обчислити коефіцієнт Жакарда за допомогою матричного множення. Я використав цей код jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | x[,j])) jaccard[j,i]=jaccard[i,j] …

2
Обчисліть криву ROC для даних
Отже, у мене є 16 випробувань, в яких я намагаюся ідентифікувати людину з біометричної ознаки за допомогою дистанції Hamming. Мій поріг встановлено на 3,5. Мої дані нижче, і лише пробна версія 1 - справжнє Позитивне: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.