Побудова моделі машинного навчання для прогнозування врожайності на основі даних про навколишнє середовище


10

У мене є набір даних, що містить дані про температуру, опади та врожайність сої для ферми протягом 10 років (2005 - 2014). Я б хотів передбачити врожайність за 2015 рік на основі цих даних.

Зверніть увагу, що в наборі даних є щоденні значення температури та опадів, але лише 1 значення на рік для врожаю, оскільки збирання врожаю відбувається в кінці вегетаційного періоду врожаю.

Я хочу побудувати регресію чи іншу модель на основі машинного навчання для прогнозування врожаю 2015 року на основі регресії / якоїсь іншої моделі, отриманої шляхом вивчення співвідношення урожайності та температури та опадів у попередні роки.

Мені знайоме виконання машинного навчання за допомогою scikit-learn. Однак не впевнений, як представити цю проблему. Тут складно, що температура та кількість опадів щодня, але врожайність становить лише 1 значення на рік.

Як я підходжу до цього?


навіть я намагаюся створити модель для прогнозування врожайності. Чи можете ви поділіться деталями щодо підходу, який ви дотримуєтесь?
Nitz

Чи змогли ви отримати повну відповідь. Якщо ні, будь ласка, повідомте мене, і я буду радий написати докладну відповідь про те, як це зробити, якщо я працюю в тому ж домені
89_Simple

@ Crop89, це було б чудово! з нетерпінням чекаю вашої відповіді
користувач308827

Ви це зрозуміли? Я зіткнувся з тією ж проблемою. Чи можете ви поділитися деталями, якщо ви їх відпрацювали? велике спасибі
eric huang

Відповіді:


3

Для початку можна прогнозувати врожайність на майбутній рік на основі щоденних даних за попередній рік. Ви можете оцінити параметри моделі, розглядаючи дані про вартість кожного року як одну "точку", а потім перевірити модель за допомогою перехресної перевірки. Ви можете продовжити цю модель, розглядаючи більше, ніж за минулий рік, але огляньтеся занадто далеко, і у вас виникнуть проблеми з підтвердженням моделі та нарядів.


дякую @Emre, моя плутанина полягає в тому, як я ставлюсь до даних, що мають цілий рік, як 1 бал? Чи не кожен рядок даних (що представляє один день) не є зразком у номенклатурі наукових досліджень? Як я розглядаю цілий рік як один зразок, а не 365?
користувач308827

1
Я не звертався до специфіки sklearn, але, оскільки ви запитували, ви хочете використовувати в імені sklearn.cross_validationметоди "Label", наприклад sklearn.cross_validation.LabelKFold .
Емре

спасибі @Emre, тому ідея полягає в тому, щоб призначати кожен рік по одній етикетці, правда?
користувач308827

Так, @ user308827.
Емре

ще раз дякую @Emre, перегляньте подальше запитання: datascience.stackexchange.com/questions/9612/…
користувач308827


1

У вас є 10 точок даних, причому кожна точка даних має розміри 365 (температура на кожен день) + 365 (кількість опадів на кожен день). В ідеалі я б спершу зменшив розміри методами машинного навчання, наприклад, PCA. Потім використовуйте методи машинного навчання для побудови моделі передбачення. Однак через невеликий набір даних я не думаю, що методи машинного навчання є відповідними вашій проблемі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.