Як ви «контролюєте» коефіцієнт / змінну?


19

Наскільки я розумію, "контроль" може мати два значення в статистиці.

  1. Контрольна група: В експерименті не проводиться лікування члена контрольної групи. Наприклад: Плацебо проти наркотиків: Ви даєте наркотики одній групі, а не іншій (контрольній), що також називається "контрольований експеримент".

  2. Управління змінною: техніка відокремлення ефекту конкретної незалежної змінної. Деякі інші назви, що даються цим методам, - це "облік", "утримування константи", "контроль за", деяка змінна. Наприклад: У дослідженні футбольного перегляду (подобається чи не подобається), ви можете захотіти зняти ефект статі, оскільки, на нашу думку, стать спричиняє упередженість, тобто чоловікові це може подобатися більше, ніж жінці.

Отже, моє питання стосується точки (2). Два питання:

Як ви "керуєте" / "рахунком" змінних, взагалі. Які методи використовуються? (З точки зору регресії, рамки ANOVA).

У наведеному вище прикладі, чи вибір випадково чоловіків і жінок являє собою контроль? Тобто, чи «випадковість» є однією з методик контролю інших ефектів?


3
З точки зору регресії та ANOVA, контроль змінної зазвичай означає, що змінна була включена в модель.
Глен

Як каже Глен, включення його в модель - це шлях. Однак рандомізація використовується для запобігання упередженості від ефектів, не включених у модель. Після створення дизайну люди часто врівноважують, щоб переконатися в таких речах, як приблизно однакова кількість кожної статі в кожному лікуванні. Проблема, що покладається виключно на рандомізацію та противагу, полягає в тому, що вони перетворюють цю зміщення у дисперсію, і тому важче спостерігати, хто з факторів є активним.
neverKnowsBest

Відповіді:


16

Як уже було сказано, контроль зазвичай означає включення змінної в регресію (як вказує @EMS, це не гарантує успіху в досягненні цього, він посилається на це ). На цю тему вже є запитання та відповіді з високою оцінкою, такі як:

Прийняті відповіді на ці запитання - це дуже хороші трактування питання, яке ви задаєте, в рамках спостереження (я б сказав, кореляційний), більше таких питань можна знайти тут .

Однак ви ставите своє запитання конкретно в експериментальному або ANOVA-рамках, ще можна подумати на цю тему.

В рамках експериментальної структури ви керуєте змінною шляхом рандомізації індивідів (або інших одиниць спостереження) за різних експериментальних умов. Основне припущення полягає в тому, що, як наслідок, єдиною різницею між умовами є експериментальне лікування. Якщо правильно рандомізувати (тобто, кожна людина має однаковий шанс опинитися в кожній умові), це обґрунтоване припущення. Крім того, тільки рандомізація дозволяє робити причинно-наслідкові умовиходи зі спостереження, оскільки це єдиний спосіб переконатися, що не інші фактори відповідають за ваші результати.

Однак може також бути необхідним контроль за змінними в експериментальних рамках, а саме тоді, коли є ще один відомий фактор, який також впливає на цю залежну змінну. Щоб збільшити статистичну потужність, то може бути хорошою ідеєю контролювати цю змінну. Звичайною статистичною процедурою, що використовується для цього, є аналіз коваріації (ANCOVA), який в основному також просто додає змінну до моделі.

Тепер випливає суть: для ANCOVA, щоб бути розумним, абсолютно важливо, щоб присвоєння групам було випадковим і що коваріат, для якого він контролюється, не співвідноситься зі змінною групування.
На жаль, це часто ігнорується, що призводить до непереборних результатів. Miller & Chapman (2001) дають справді читабельний вступ до цієї точної проблеми (тобто коли використовувати ANCOVA чи ні ) :

Незважаючи на численні технічні методи лікування у багатьох місцях, аналіз коваріації (ANCOVA) залишається широко використовуваним підходом до вирішення суттєвих групових відмінностей щодо потенційних коваріатів, особливо в дослідженнях психопатології. Опубліковані статті дають необгрунтовані висновки, а деякі тексти статистики нехтують проблемою. Проблема з ANCOVA в таких випадках розглядається. У багатьох випадках немає засобів для досягнення надзвичайно привабливої ​​мети "виправлення" або "контролю за" реальною груповою різницею на потенційному коваріаті. Сподіваючись на зменшення зловживання ANCOVA та сприяння правильному використанню, проводиться нетехнічна дискусія, що підкреслює суттєву плутанину, яка рідко формулюється в підручниках та інших загальних презентаціях, щоб доповнити наявну математичну критику.


Міллер, Джорджія та Чапман, JP (2001). Аналіз нерозуміння коваріації. Журнал ненормальної психології , 110 (1), 40–48. doi: 10.1037 / 0021-843X.110.1.40


Для того, щоб наголосити на цьому питанні (яке дуже часто задають питання), добре врахувати, що просто включення змінної в модель не гарантується "контролювати" її ефект навіть за надзвичайно сильних припущень про те, що змінна є монотонно пов'язаний із залежною змінною. Дивіться статтю, яка пов'язана в моєму іншому коментарі.
ely

1
@EMS Добрий момент. Я додав попереджувальну записку та ваше посилання на початок тексту. Не соромтесь редагувати мій текст, якщо вам здається, що можна ще додати.
Генрік

0

Щоб контролювати змінну, можна зрівняти дві групи за відповідною ознакою, а потім порівняти різницю з проблеми, яку ви досліджуєте. Я можу пояснити це лише прикладом, не формально, B-школа - це роки в минулому, так що там.

Якби ви сказали:

Бразилія багатша за Швейцарію, оскільки Бразилія має 3524 мільярдів доларів, а Швейцарія - 551 мільярд

ви б абсолютно правильні, але кожен, хто старше 12 років, хто знає про світ, підозрює, що в цьому твердженні теж щось не так.

Краще було б підняти населення Швейцарців до населення Бразилії, а потім знову порівняти дохід. Отже, якби кількість населення Швейцарцланда була чисельнішою за Бразилій, їх дохід склав би:

(210 млн. / 8,5 млн.) * 551 млрд. Дол. = 13612 млрд. Дол

Це робить їх приблизно в 4 рази багатішими, ніж Бразилія, на 3524 мільярди доларів.

І так, ви також можете скористатися підходом на душу населення, де ви порівнюєте середні доходи. Але вищезазначений підхід, ви можете застосувати це кілька разів.


1
Ви наче описуєте якусь форму нормалізації, а не «контроль» у тому сенсі, який мається на увазі у питанні.
whuber

Власне, я думаю, що це те саме. Якщо ви не вважаєте це так, не соромтеся детальніше
розібратися

Я не думаю, що мені потрібно додавати до інших відповідей, які вже є в цій темі.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.