Як боротися з ефектом стелі завдяки вимірювальному інструменту?


12

Я зібрав психофізіологічні дані, що вимірюють здатність випробовуваних (двох груп) сприймати вібрацію. Вібруючий зонд рухається проти шкіри при менших і менших зміщеннях, і випробовуваний вказує, коли вони відчувають вібрацію. На жаль, на високих частотах зонд може рухатися лише на невеликій відстані, а іноді найбільша відстань, яку може пройти зонд, все ще недостатньо велика, щоб суб'єкти сприймали. Таким чином, у мене є точні порогові значення для деяких предметів, але для тих, хто ніколи не відчував вібрацію, у мене просто є значення, яке я знаю, що їх поріг перевищує. Чи є мені можливість все-таки включити ці дані? І який найкращий спосіб проаналізувати?


5
Вони називаються цензурованими спостереженнями . Як його включити, залежить від виду статистичного аналізу, який ви проводите.

Я погоджуюся з Прокрастинатором, за винятком того, що я вжив би термін усічений. Підхід до простої проблеми, яка називається правильною цензурою, відбувається в аналізі виживання там, де ви зберігаєте усічене значення, але маєте змінну індикатора, яка дозволяє вам повідомити, чи є цінність цілковитою, або цензурованою. В аналізі виживання існує простий спосіб вирішити це, але це тому, що ви оцінюєте криву виживання. Тут ви, можливо, захочете порахувати середні показники. Якщо ви ігноруєте трактат, ви недооцінюєте середнє значення. Якщо ви викидаєте усічені бали, ви недооцінюєте середнє значення.
Майкл Р. Черник

Щоб правильно включити усічені значення, вам потрібно мати модель ймовірності відстані зонда, враховуючи, що вона перевищує поріг. Потім можна взяти середнє значення для цього розподілу і обчислити середньозважене значення, використовуючи середнє значення для значень, які не були відрізані від середнього для усіченого розподілу, де зважування відповідає частці урізаних випадків.
Майкл Р. Черник

4
Урізання - це те, що станеться, якщо ви викинете неперевірені дані. Ти не хочеш цього робити! Ви маєте рацію, Кейл, що в цих цензурованих значеннях є інформація і підозрюючи, що існують деякі стандартні способи їх аналізу (і підводні камені для необережних). Але для надання гарної відповіді нам слід знати, який саме аналіз ви шукаєте. Зокрема, обробка цих даних принципово відрізняється залежно від того, чи вони відображаються як залежні чи незалежні змінні в регресії. Можливо, ви могли б детальніше зупинитися на цьому?
whuber

1
Невелика деталь, не пов’язана зі статистичним питанням, але це може бути корисно знати: Дані подібного роду зазвичай називаються "психофізичними" даними, а не "психофізіологічними" (які включають такі речі, як пульс або заходи провідності шкіри, але не суб'єктивні судження про відчуття ). Це також може допомогти вам знайти літературу про те, як люди зазвичай ставляться до цього типу даних.
Гала

Відповіді:


2

Мені подобається використовувати неоднорідні моделі сумішей для опису комбінованих ефектів із принципово різних джерел.

Ви можете поглянути на щось на зразок моделі "Нуль надутого Пуассона" в стилі Діани Ламберт. « Нульова завищена пуассонова регресія із застосуванням до дефектів у виробництві », Діана Ламберт, Технометрія, Vol. 34, вип. 1, 1992

Я вважаю цю ідею особливо приємною, оскільки вона, здається, суперечить думці, що застосування статистичної конструкції експериментів у медицині не може повністю вилікувати хворобу. За ідеєю стоїть ідея про те, що науковий метод не може досягти своєї мети в медицині, випливає з ідеї про відсутність даних про хворобу у "ідеально" здорового індивіда, так що дані не можуть повідомити про виправлення захворювання. Без вимірювання немає можливості покращитись.

Використання щось на зразок нульової завищеної моделі дозволяє витягти корисну інформацію з даних, які частково є "без помилок". Це використовує розуміння процесу, щоб взяти інформацію, яку можна вважати «мовчазною», і змусити її говорити. Для мене це те, що ти намагаєшся зробити.

Зараз я не можу почати стверджувати, які комбінації моделей використовувати. Я підозрюю, що ви могли б використовувати для початківців нульову завищену модель гауссової суміші (GMM). GMM є дещо емпіричним універсальним наближенням для безперервних PDF-файлів - на зразок PDF-кузена наближення серії Фур'є, але за підтримки центральної граничної теореми для покращення глобальної застосуваності та дозволення, як правило, набагато менше компонентів для того, щоб зробити " гарне "наближення.

Удачі.

Редагувати:

Більше про нульові надуті моделі:


0

Кластеризація результатів та визначення шкали може бути рішенням.

Зробіть змінну категорії так (або по-іншому):

  1. Висока чутливість
  2. Нормальна чутливість
  3. Низька чутливість
  4. Нечутливі (ті, що не відповідають масштабам у вашому випадку)

Ви можете використовувати цю змінну для аналізу, але від того, наскільки результати є значущими, залежить те, наскільки правильно ви визначаєте категорії.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.