методи машинного навчання для поздовжніх даних


11

Мені було цікаво, чи існують якісь методи машинного навчання (без нагляду) для моделювання поздовжніх даних? Я завжди використовував моделі змішаних ефектів (переважно нелінійні), але мені було цікаво, чи існують інші способи цього (за допомогою машинного навчання).

Під машинним навчанням я маю на увазі випадковий ліс, класифікацію / кластеризацію, дерева рішень і навіть глибоке навчання тощо.


Чи можете ви, будь ласка, визначити, що ви маєте на увазі під «машинним навчанням»? Ви можете збільшити LME після відповідної стратифікації. Це було б досить роман насправді!
usεr11852

@ usεr11852, я додав трохи більше пояснень до питання - сподіваємось, це ще більше пояснює його.
John_dydx

Ах ... так що стимулювання не є ML за вашим визначенням. Класна подяка за уточнення, сподіваємось, що вона скоро отримає певну увагу.
usεr11852

... і прискорення теж.
John_dydx

3
Це питання видається досить розпливчастим. "Машинне навчання" - це широкий термін, і навіть категорії "випадковий ліс, класифікація / кластеризація, дерева рішень і навіть глибоке навчання тощо" досить широкі. Чи є чітка програма, яка вас цікавить? Якщо, наприклад, вам потрібно класифікувати дихотомічний вихід, ви можете використовувати логістичну модель змішаних ефектів або логістичний GEE. Машинне машинне навчання та статистичні моделі не обов'язково відрізняються різними речами.
Джон

Відповіді:


7

У випадку, коли є кілька спостережень від одного суб'єкта (наприклад, багаторазові відвідування одного і того ж пацієнта), то "ідентифікатор пацієнта" є змінною "групування". Під час оцінювання моделі слід бути обережними, щоб відвідування одного і того ж пацієнта не відображалися як у даних про навчання, так і на тестуванні, оскільки вони співвідносяться і призведуть до інфляції точності класифікатора .

Документація по скрінділідації sklearn має ітератори перехресної перевірки для згрупованих даних. Див. ГрупиKFold , LeaveOneGroupOut та LeavePGroupsOut .

Ще краще, спробуйте періодичні нейронні мережі або приховані моделі Маркова .


4

Ви можете моделювати свій поздовжній метод за допомогою стандартних методів машинного навчання, просто додаючи функції, що представляють довготу, наприклад, додавши функцію, яка представляє час. Або функція, яка вказує на приналежність до групи, особи тощо (у випадку даних панелі).

Якщо ви творчі з створенням / вилученням функцій, ви можете моделювати що-небудь за допомогою ML-алгоритмів.


1
@PhlippePro, я трохи розгублений у цій відповіді. (1) Що робити, якщо ви хочете передбачити людину, яка не є у вашому навчальному наборі? У вас є лише коефіцієнти для тих, хто у вашому навчальному наборі, правда? (2) Додавання функції, що відповідає людині, може призвести до додавання до 100 000 нових фіктивних змінних, якщо припустити, що у вашому наборі даних є 100 000 людей. Ці нові функції просто підходили б поряд із оригінальними?
користувач0

(1) Якщо у вас немає осіб, яких ви хочете передбачити у своєму навчальному наборі даних, ви не можете використовувати "особистість", це правильно. (2) Замість того, щоб створювати фіктивні функції, ви можете зробити одну "категоричну" функцію (наприклад, ви вказали їх як категоричні з as.factor в R). Деякі алгоритми не можуть обробляти так багато категорій (як, наприклад, лише randomForest може обробити приблизно 50), тоді вам дійсно потрібно вказати їх як фіктивні змінні, і ви можете отримати (занадто) багато функцій, як ви вказали.
PhilippPro

ML не перекладає так легко в поздовжні дані
Aksakal
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.