Запитання з тегом «reliability»

Кажуть, що міра має високу надійність, якщо вона дає подібні результати за послідовних умов. НЕ плутайте надійність з дійсністю (див. Теги wiki). НЕ використовуйте для надійності між рейтингами, яка має власний тег inter-rater

1
Обчислення дисперсії Копа Коена (та стандартні помилки)
Статистика Kappa ( ) була введена в 1960 році Коеном [1] для вимірювання згоди між двома рейтинговими. Однак його розбіжність була джерелом суперечностей досить довгий час.κκ\kappa Моє запитання про те, який найкращий дисперсійний розрахунок використовувати для великих зразків. Я схильний вважати, що тестований та перевірений Фліссом [2] був би правильним …

3
За яким розподілом слід мої дані?
Скажімо, що у мене є 1000 компонентів, і я збирав дані про те, скільки разів цей помилок записується, і кожен раз, коли вони реєстрували помилку, я також відслідковую, скільки часу моїй команді потрібно було вирішити проблему. Коротше кажучи, я записував час на ремонт (у секундах) для кожного з цих 1000 …

1
Обчислювальна повторюваність ефектів від lmer-моделі
Я щойно натрапив на цю статтю , в якій описано, як обчислити повторюваність (він же - надійність, також внутрішньокласова кореляція) вимірювання за допомогою моделювання змішаних ефектів. R-код буде: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
Чи дійсно "Полювання на снарка" Джоела Спольського є статистичним аналізом змісту?
Якщо ви останнім часом читали бюлетені спільноти, ви, ймовірно, бачили The Hunting of Snark, публікацію в офіційному блозі StackExchange Джоела Спольського, генерального директора мережі StackExchange. Він обговорює статистичний аналіз, проведений на вибірці коментарів SE для оцінки їх "дружелюбності" з точки зору стороннього користувача. Зауваження були відібрані випадковим чином із StackOverflow, …

2
Міжрейтингова надійність для порядкових або інтервальних даних
Які методи надійності між рейтингами найбільш підходять для порядкових або інтервальних даних? Я вважаю, що "Спільна ймовірність угоди" або "Каппа" розроблені для номінальних даних. У той час як "Пірсон" та "Спірмен" можуть використовуватися, вони в основному використовуються для двох рейтингів (хоча їх можна використовувати більше двох рейтингів). Які ще заходи …

2
Оцінка надійності анкети: розмірність, проблемні елементи та чи слід використовувати альфа, лямбда6 чи якийсь інший індекс?
Я аналізую бали, які дають учасники експерименту. Я хочу оцінити надійність моєї анкети, яка складається з 6 пунктів, спрямованих на оцінку ставлення учасників до товару. Я обчислював альфа Кронбаха, обробляючи всі елементи як єдину шкалу (альфа - приблизно 0,6) і видаляв один елемент за один раз (макс. Альфа - приблизно …

2
Точність проти площі під кривою ROC
Я побудував криву ROC для діагностичної системи. Тоді площа під кривою була непараметрично оцінена як AUC = 0,89. Коли я спробував обчислити точність при встановленні оптимального порогового значення (точка, найближча до точки (0, 1)), я отримав точність діагностичної системи 0,8, що менше AUC! Коли я перевірив точність на іншому порозі, …

3
Звідки беруться дескриптори значень альфа Кронбаха (наприклад, поганий, відмінний)?
Досить поширеним є опис значень альфа Кронбаха таким чином: α ≥ 0,9 Відмінно 0,7 ≤ α <0,9 Добре 0,6 ≤ α <0,7 Прийнятно 0,5 ≤ α <0,6 Погано α <0,5 Неприпустимо Звідки беруться ці значення? Я не можу знайти оригінальну дослідницьку статтю, що описує їх. Редагувати: Я на 90% впевнений, …

4
Якими є тематичні дослідження в дослідженнях політики охорони здоров’я, коли ненадійні / збентежені / недійсні дослідження чи моделі були неправомірно використані?
Я готую огляд літератури щодо актуального питання охорони здоров’я, де дані заплутані: Які загальні історичні приклади, які використовуються в освіті з питань охорони здоров'я / епідеміології, коли неправомірні або заплутані стосунки чи умовиводи були навмисно чи помилково використані в політиці та законодавстві про охорону здоров'я? Автомобільний сплеск фатальності 1960-х років …

1
Caret glmnet vs cv.glmnet
Здається, існує велика плутанина в порівнянні використання glmnetв рамках caretпошуку оптимальної лямбда та використання cv.glmnetтого ж завдання. Поставлено багато питань, наприклад: Класифікаційна модель train.glmnet vs. cv.glmnet? Який правильний спосіб використання glmnet з каретою? Перехресне підтвердження `glmnet` за допомогою` caret` але відповіді не надано, що може бути пов'язано з відтворюваністю питання. …

2
Міжбірна надійність подій у часовій серії із невизначеністю часу події
У мене є кілька незалежних кодерів, які намагаються ідентифікувати події у часовій серії - в цьому випадку дивляться відео бесіди віч-на-віч і шукають особливості невербальної поведінки (наприклад, головні кивки) та кодують час і категорію кожного. подія. Ці дані можна обґрунтувати як дискретний часовий ряд із високою швидкістю вибірки (30 кадрів …

2
Ідентифікація марних питань із анкети
Я розробляю анкету. Для підвищення його надійності та обґрунтованості я хочу використовувати статистичні методи. Я хочу усунути питання, відповіді яких завжди однакові. Це означає, що майже всі учасники дали однакові відповіді на ці питання. Тепер мої запитання: Який технічний термін для таких марних питань, відповіді яких завжди однакові, незалежно від …

2
Як зменшити кількість елементів, використовуючи аналіз факторів, внутрішню узгодженість та теорію відгуку елементів разом?
Я зараз емпірично розробляю анкету, і я буду використовувати в якості прикладу довільні числа для ілюстрації. Для контексту я розробляю психологічну анкету, спрямовану на оцінку думок, які зазвичай виявляються у людей, які мають тривожні розлади. Елемент може виглядати так: "Мені потрібно кілька разів перевірити духовку, оскільки я не можу бути …

3
Надійність приталеної кривої?
Я хотів би оцінити невизначеність або надійність встановленої кривої. Я навмисно не називаю точну математичну величину, яку шукаю, оскільки не знаю, що це. Тут (енергія) - залежна змінна (відповідь), а V (об'єм) - незалежна змінна. Я хотів би знайти криву енергії-об’єму ( E ( V )) деякого матеріалу. Тому я …

2
Наскільки точний IQR для виявлення людей, що вижили
Я пишу сценарій, який аналізує час запуску процесів. Я не впевнений у їх розподілі, але хочу знати, чи процес триває "занадто довго". Поки що я використовував 3 стандартні відхилення останніх періодів запуску (n> 30), але мені сказали, що це не дає нічого корисного, якщо дані не є нормальними (що, здається, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.