Запитання з тегом «censoring»

Процес цензури дає дані без лише часткової інформації. Найпоширенішим прикладом цензури є * правильна цензура * в аналізі виживання, коли час, до якого сталася подія, лише відомо, що він перевищує деяку тривалість, оскільки подія не відбулася після закінчення дослідження.

3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Чи є у нас проблема "жалісних нагород"?
Я знаю, це може здатися, що це поза темою, але вислухай мене. У режимі переповнення стека і тут ми отримуємо голоси за повідомлення, все це зберігається в табличній формі. Наприклад: пост ідентифікатор виборця ідентифікатор типу голосування дата ------- -------- --------- -------- 10 1 2 2000-1-1 10:00:01 11 3 3 2000-1-1 …

3
Чому існує різниця між ручним обчисленням логістичної регресії 95% довірчого інтервалу та використанням функції conint () в R?
Дорогі всі - я помітив щось дивне, чого я не можу пояснити, чи не так? Підсумовуючи: ручний підхід до обчислення довірчого інтервалу в моделі логістичної регресії та функції R confint()дають різні результати. Я пережив прикладну логістичну регресію Hosmer & Lemeshow (2-е видання). У 3-й главі є приклад обчислення коефіцієнта шансів …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Чим відрізняється цензура від усічення?
У книзі Статистичні моделі та методи життєвих даних написано: Цензура: коли спостереження є неповним через якусь випадкову причину. Укорочення: Коли неповний характер спостереження пов'язаний із систематичним процесом відбору, властивим дизайну дослідження. Що розуміється під "систематичним процесом відбору, властивим дизайну дослідження" у визначенні усічення? Чим відрізняється цензура від усічення?

3
Як моделювати цей непарний розподіл (майже зворотний J)
Моя залежна змінна, показана нижче, не відповідає жодному мені відомості про розподіл запасів. Лінійна регресія створює дещо ненормальні залишки з правою косою, які відносяться до передбачуваного Y незвичайним чином (2-й графік). Будь-які пропозиції щодо перетворень чи інші способи отримання найбільш вагомих результатів та найкращої точності прогнозування? Якщо можливо, я хотів …

3
Об'єктивна оцінка матриці коваріації для множинні цензуровані дані
Хімічні аналізи зразків навколишнього середовища часто цензуруються нижче за межами звітності або різними межами виявлення / кількості. Останні можуть варіюватися, як правило, пропорційно значенням інших змінних. Наприклад, зразок з високою концентрацією одного з'єднання, можливо, повинен бути розведений для аналізу, в результаті чого пропорційна інфляція меж цензури для всіх інших сполук, …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
Що таке "цільове максимальне очікування ймовірності"?
Я намагаюся зрозуміти деякі статті Марка ван дер Лаана. Він теоретичний статистик в Берклі, який працює над проблемами, які суттєво перегукуються з машинним навчанням. Одна з проблем для мене (крім глибокої математики) полягає в тому, що він часто закінчує опис звичних підходів до машинного навчання, використовуючи зовсім іншу термінологію. Одне …

5
Які саме цензурні дані?
Я читав різні описи цензурованих даних: А) Як пояснено в цій темі, цензуруються не кількісні дані нижче або вище певного порогу. Некваліфіковані засоби означають, що вище або нижче певного порогу, але ми не знаємо точного значення. Потім дані маркуються за низьким або високим пороговим значенням у моделі регресії. Він відповідає …

2
Пояснення Леймана щодо цензури в аналізі виживання
Я читав про те, що таке цензура, і як це потрібно враховувати в аналізі виживання, але хотів би почути менш математичне визначення цього і більш інтуїтивне визначення (фотографії були б чудовими!). Чи може хто-небудь надати мені пояснення: 1) цензура та 2) як це впливає на такі речі, як криві Каплана-Меєра …

1
Моделювання, коли залежна змінна має "межування"
Вибачте заздалегідь, якщо будь-яка термінологія, яку я використовую, є невірною. Я вітаю будь-які виправлення. Якщо те, що я характеризую як "відсікання", має інше ім'я, дайте мені знати, і я можу оновити питання. Мене цікавить ситуація така: у вас є незалежні змінні і одна залежна змінна . Я залишу це розпливчастим, …

2
Ухил у середньому віці для кваліфікації звання гросмайстра за віковими групами?
Вже досить давно відомо, що наймолодший вік, в якому шахісти зуміли отримати право на титул гросмейстера, значно зменшився з 1950-х років, і наразі майже 30 гравців, які стали гросмейстером до свого 15-го дня народження . Однак на біржі шахових стеків виникає питання, який середній вік, щоб стати гросмейстером? . Хтось …

1
Використання стандартних інструментів машинного навчання на даних, що цензуруються ліворуч
Я розробляю програму прогнозування, мета якої - дозволити імпортеру прогнозувати попит на свою продукцію із своєї мережі клієнтів дистриб'юторів. Показники продажів є досить хорошим показником попиту, якщо існує достатня кількість запасів, щоб заповнити попит. Однак, коли товарний запас знижується до нуля (ситуація, яку ми прагнемо допомогти нашому клієнту уникнути), ми …

2
Цензура / укорочення в JAGS
У мене питання про те, як укласти проблему цензури в JAGS. Я спостерігаю, як біваріантна суміш нормальна, коли значення X мають похибку вимірювання. Я б хотів моделювати справжні основні "засоби" спостережуваних цензурованих значень. ⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)\begin{align*} \lceil x_{true}+\epsilon \rceil = x_{observed} \ \epsilon \sim N(0,sd=.5) \end{align*} Ось що я маю …

1
Які середня величина та дисперсія 0-цензурованої багатоваріантної норми?
Дозволяє Z∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma) бути в RdRd\mathbb R^d. Назвіть середню та коваріаційну матрицюZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z) (з максимально обчисленими елементами)? Це виникає, наприклад, тому, що якщо ми використовуємо функцію активації ReLU всередині глибокої мережі, і припустимо через CLT, що входи до даного шару приблизно нормальні, то це розподіл …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.