Алгоритми машинного навчання даних панелей


12

У цьому запитанні - чи існує метод побудови дерев рішень, який враховує структуровані / ієрархічні / багаторівневі предиктори?- вони згадують метод панельних даних для дерев.

Чи існують конкретні методи даних панелей для підтримки векторних машин та нейронних мереж? Якщо так, чи можете ви навести деякі документи для алгоритмів та (якщо вони доступні) пакетів R, що реалізують його?


1
Мені було цікаво, що ви вирішили використовувати для цього? Намагаються вирішити подібну проблему.
користувач0

Відповіді:


1

LSTM (Long Short Term Memory) може бути актуальним для вас. Цей тип моделі може обробляти безліч функцій у декількох моментах часу, що має відповідати даним на панелі. Ось дуже приємне пояснення щодо поняття LSTM, і ось пакет, який реалізує R-версію LSTM.


1

Якщо у вас є дані на панелі, є різні завдання, які ви можете спробувати вирішити, наприклад класифікація / регресія часових рядів або прогнозування на панелі. І для кожного завдання існує численні підходи до його вирішення.

Якщо ви хочете використовувати методи машинного навчання для вирішення панельного прогнозування, існує ряд підходів:

Що стосується ваших вхідних даних (X), розглядати одиниці (наприклад, країни, особи тощо) як зразки iid, ви можете

  • бін часових рядів і розглядає кожну кошик як окремий стовпчик, ігноруючи будь-яке тимчасове впорядкування, з рівними бункерами для всіх одиниць, розмір відрізку, звичайно, може бути просто спостережуваним вимірюванням часових рядів, або ви можете збільшити вибірку та об'єднати у більші бункери, тоді використовувати стандартні алгоритми машинного навчання для табличних даних,
  • або витягувати функції з часових рядів для кожної одиниці та використовувати кожну вилучену функцію як окремі стовпці, знову поєднуючись зі стандартними табличними алгоритмами,
  • або використовувати спеціалізовані алгоритми регресії / класифікації часових рядів залежно від того, чи дотримуєтесь ви даних безперервного або категоричного часового ряду, сюди входять машини підтримки векторів зі спеціальними ядрами, які порівнюють часовий ряд із часовими рядами.

Що стосується вихідних даних (y), якщо ви хочете прогнозувати декілька часових точок у майбутньому, ви можете

  • встановити оцінювач для кожного кроку вперед, який потрібно прогнозувати, завжди використовуючи однакові вхідні дані,
  • або встановити єдиний оцінювач для першого кроку вперед та для прогнозування, вчасно згорнути вхідні дані, використовуючи передбачення першого кроку для додавання до спостережуваних вхідних даних, щоб зробити прогнози на другий крок тощо.

Усі вищезазначені підходи, в основному, зводять проблему прогнозування панелі до регресії часових рядів або табличної регресії. Після того, як ваші дані будуть у форматі часових рядів або табличної регресії, ви також можете додати будь-які інваріантні для користувача функції.

Звичайно, існують інші варіанти вирішення проблеми прогнозування панелі, наприклад, із застосуванням класичних методів прогнозування, таких як ARIMA, адаптованих до даних панелей або методів глибокого навчання, що дозволяють безпосередньо складати послідовність передбачень послідовностей.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.