Як зробити логістичну регресію в R, коли результат є дробовим (співвідношення двох рахунків)?


24

Я переглядаю статтю з наступним біологічним експериментом. Пристрій використовується для піддавання клітинам різної кількості напруги зсуву рідини. Оскільки сильні напруги зсуву прикладаються до клітин, більше їх починає відшаровуватися від субстрату. На кожному рівні напруги зсуву вони підраховують клітини, які залишаються приєднаними, і оскільки вони знають загальну кількість комірок, які були приєднані на початку, вони можуть обчислити дробову прихильність (або відшарування).

Якщо побудувати графік прилягаючої фракції проти напруги зсуву, результат - логістична крива. Теоретично кожна окрема клітина - це єдине спостереження, але очевидно, що це тисячі чи десятки тисяч комірок, тож набір даних був би гігантським, якби він був налаштований звичайним чином (кожен рядок - спостереження).

Тож, природно, моє запитання (як зазначено в назві) має мати зараз сенс. Як ми можемо зробити логістичну регресію, використовуючи дробовий результат як DV? Чи є якесь автоматичне перетворення, яке можна зробити в glm?

Як би це було для багаточленної логістичної регресії, якби було потенційно 3 або більше (дробових) вимірювань, як би це було зроблено?


Ось кілька прикладів щодо багатоваріантної логістичної регресії підсумків:http://www.ats.ucla.edu/stat/r/dae/mlogit.htm
березня 1313

1
Те, що ви описуєте, не здається, що у вас будуть незалежні спостереження (оскільки, імовірно, клітини не повторно приєднуються, коли зсув збільшується, число, що все ще приєднується при кожному більш високому напруженні, повинно бути не більше попереднього числа); цю залежність необхідно враховувати. (Це нагадує ситуацію з кривими зростання.) --- ви не можете просто підключити числа до GLM, як ніби вони незалежні ... і жодна з відповідей, схоже, не вирішує цю проблему.
Glen_b -Встановити Моніку

2
@Glen_b Кожен експеримент проводиться з різними осередками, тобто починаючи з "100%" прикріплення та застосування різного значення напруги зсуву.
thecity2

Ага, гаразд. Це дало б незалежні результати.
Glen_b -Встановити Моніку

Відповіді:


37

Ця glmфункція Rдозволяє 3 способи вказати формулу для моделі логістичної регресії.

Найбільш поширеним є те, що кожен рядок кадру даних являє собою одне спостереження, а змінна відповіді - або 0, або 1 (або коефіцієнт з 2 рівнями, або інша варіабель із лише двома унікальними значеннями).

Іншим варіантом є використання матриці з двома стовпцями як змінної відповіді, причому перший стовпець вважається підрахунком «успіхів», а другий стовпець вважається підрахунком «відмов».

Ви також можете вказати відповідь у пропорції між 0 та 1, а потім вказати інший стовпець як "вагу", який дає загальне число, від якого пропорція (тому відповідь 0,3 та вага 10 - це те саме, що 3 " успіхи 'та 7' невдач ').

Будь-який з останніх двох способів відповідав би тому, що ви намагаєтеся зробити, останній здається найбільш прямим для того, як ви описуєте свої дані.


9

Для початку, якщо у вас є залежна змінна, яка є пропорцією, ви можете використовувати бета-регресію. Це не поширюється (за моїми обмеженими знаннями) на кілька пропорцій.

Для огляду бета-регресії та використання R перевірити бетарег .


Спасибі! Це виглядає як те, що мені потрібно для двочленного випадку.
thecity2

2

Я використовував nnet::multinom(пакетна мережа є частиною MASS) для подібних цілей, він приймає безперервний вхід в [0, 1].

Якщо вам потрібна довідка: C. Beleites et.al . : Раманова спектроскопічна класифікація тканин астроцитоми: використовуючи м'яку довідкову інформацію. Anal Bioanal Chem, 2011, Vol. 400 (9), стор 2801-2816


Чудово! Я маю цей пакет, і не розумів, що він має таку можливість.
thecity2

@cbeleites: Чи дозволяє залежним бути [0,1]? Я хоч це і була функцією для номінальної залежності (предикторів слід масштабувати до [0,1] ...
B_Miner

@B_Miner: так, залежний може бути в [0, 1]. Функція підходить до штучної нейронної мережі без прихованого шару та з логістичною сигмоїдою. І так, рекомендується масштабувати прогнози приблизно до [0, 1], а також для кращої конвергенції.
cbeleites підтримує Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.