Я розробляю програму прогнозування, мета якої - дозволити імпортеру прогнозувати попит на свою продукцію із своєї мережі клієнтів дистриб'юторів. Показники продажів є досить хорошим показником попиту, якщо існує достатня кількість запасів, щоб заповнити попит. Однак, коли товарний запас знижується до нуля (ситуація, яку ми прагнемо допомогти нашому клієнту уникнути), ми не знаємо, наскільки ми пропустили ціль. Скільки продажів заробив би замовник, якби вони мали достатню пропозицію? Стандартні підходи на основі регресії на основі регресії, які використовують продаж як просту цільову змінну, дадуть суперечливі оцінки взаємозв'язку між часом, моїми описовими змінними та попитом.
Тобітне моделювання є найбільш очевидним способом підходу до проблеми: http://en.wikipedia.org/wiki/Tobit_model . Мене цікавить адаптація ML для випадкових лісів, GBMS, SVM та нейронних мереж, які також враховують лівоцензуровану структуру даних.
Коротше кажучи, як я можу застосувати інструменти машинного навчання до лівоцензурованих регресійних даних, щоб отримати послідовну оцінку взаємозв'язків між моїми залежними та незалежними змінними? Перша перевага надаватиметься рішенням, доступним в R, а потім Python.
Ура,
Аарон