Я задав це запитання на сайті matemathics stackexchange і мені рекомендували задати тут.
Я працюю над хобі-проектом і мені потрібна допомога з наступною проблемою.
Трохи контексту
Скажімо, є колекція предметів з описом особливостей та ціни. Уявіть список машин та ціни. Усі автомобілі мають перелік особливостей, наприклад, розмір двигуна, колір, потужність коня, модель, рік і т. Д. Для кожної марки щось подібне:
Ford:
V8, green, manual, 200hp, 2007, $200
V6, red, automatic, 140hp, 2010, $300
V6, blue, manual, 140hp, 2005, $100
...
Подальше перелік автомобілів із цінами публікується з певним інтервалом часу, що означає, що ми маємо доступ до історичних даних про ціни. Не завжди можна включати абсолютно однакові машини.
Проблема
Я хотів би зрозуміти, як моделювати ціни на будь-який автомобіль, виходячи з цієї базової інформації, головне, щоб автомобілі не були в початковому списку.
Ford, v6, red, automatic, 130hp, 2009
Для вищезгаданого автомобіля він майже такий, як один у списку, лише трохи відрізняється потужністю коня та роком. Щоб цінувати це, що потрібно?
Що я шукаю - це щось практичне і просте, але я також хотів би почути про більш складні підходи, як моделювати щось подібне.
Що я спробував
Ось з чим я експериментував досі:
1) використання історичних даних для пошуку автомобіля X. Якщо його не знайдено, немає ціни. Це, звичайно, дуже обмежено, і можна використовувати це лише в поєднанні з деяким часом спаду, щоб змінити ціни на відомі автомобілі з часом.
2) використання схеми зважування автомобільних характеристик разом із ціною автомобіля-зразка. В основному, що існує базова ціна, а характеристики просто змінюють це з деяким фактором. Виходячи з цього, виходить ціна будь-якого автомобіля.
Перший виявився недостатньо, а другий виявився не завжди правильним, і я, можливо, не мав кращого підходу до використання ваг. Це також здається трохи важким для підтримки ваги, тому я вважав, що, можливо, є якийсь спосіб використати історичні дані як статистику, щоб отримати ваги або отримати щось інше. Я просто не знаю, з чого почати.
Інші важливі аспекти
- інтегрувати в якийсь програмний проект, який у мене є. Або за допомогою власних бібліотек або алгоритму запису.
- швидкий перерахунок, коли надходять нові історичні дані.
Будь-які пропозиції, як можна вирішити подібну проблему? Всі ідеї більш ніж вітаються.
Заздалегідь дякую та з нетерпінням чекаю ваших пропозицій!