[Примітка: Див. Оновлення 1. нижче.] Я вважаю, що методологію rpart
пояснити набагато простіше, ніж party
. Останній, однак, набагато складніший і, ймовірно, дає кращі моделі. Те, як я іноді пояснюю, party
- це говорити про це як про основу для створення локальних лінійних (або GLM) моделей. Я будую до цього, вказуючи, що результати для rpart
постійні для всіх елементів, які потрапляють у вузол листків, тобто поле / область, обмежена розщепленнями. Навіть якщо можливі покращення за допомогою місцевих моделей, ви не отримуєте нічого, крім постійного передбачення.
Навпаки, party
розробляє розбиття, щоб потенційно оптимізувати моделі для регіонів. Насправді використовується інший критерій, ніж оптимальність моделі, але вам потрібно оцінити власну спроможність пояснення різниці, щоб визначити, чи можете ви це добре пояснити. Документи для цього досить доступні для дослідника, але можуть бути досить складними для тих, хто не бажає розглянути простіші методи, такі як випадкові ліси, підсилення тощо. Математично, я вважаю, що party
це більш досконало ... поясніть, як з точки зору методології, так і з результатами, і вони дають гідний крок для впровадження більш досконалих моделей на основі дерев.
Коротше кажучи, я б сказав, що ви повинні зробити rpart
для ясності, і ви можете використовувати party
для точності / продуктивності, але я б не ввів, party
не вводячи rpart
.
Оновлення 1. Свою відповідь я базував на своєму розумінні того, party
як це було рік-два тому. Він виріс зовсім небагато, але я б змінив свою відповідь, щоб сказати, що я все-таки рекомендую rpart
його стислість і спадщину, якщо "нефантазія" є важливим критерієм для вашого клієнта / співпрацівниці. Однак я б спробував перейти до використання більшої функціональності party
, після того, як когось представив rpart
. Краще почати з невеликих, з функціями втрат, розбиттям критеріїв тощо, у простому контексті, перш ніж вводити пакет і методологію, яка передбачає набагато більше задіяних концепцій.