Ви можете перевірити це посилання . Sci-Kit Learn реалізує рандомізовану логістичну регресію і метод описаний там.
Але, щоб відповісти на ваше запитання, два методи значною мірою відрізняються за своїми цілями. Логістична регресія полягає у пристосуванні до моделі, а RLR - у пошуку змінних, що надходять у модель.
Ванільна логістична регресія - це узагальнена лінійна модель. Для двійкової відповіді ми вважаємо, що коефіцієнт ймовірності відповіді журналу є лінійною функцією ряду предикторів. Коефіцієнти прогнозів оцінюються з використанням максимальної ймовірності, а висновок про параметри заснований на великих властивостях вибірки моделі. Для найкращих результатів ми зазвичай припускаємо, що модель досить проста і добре зрозуміла. Ми знаємо, які незалежні змінні впливають на реакцію. Ми хочемо оцінити параметри моделі.
Звичайно, на практиці ми не завжди знаємо, які змінні слід включати в модель. Особливо це стосується ситуацій машинного навчання, коли кількість потенційних пояснювальних змінних величезна, а їх значення мало.
Протягом багатьох років багато людей намагалися використовувати методи підгонки статистичної моделі з метою варіативного вибору (читати "функції"). З підвищенням рівня надійності:
- Підійдіть до великої моделі та укажіть змінні зі значущою статистикою Wald. Не завжди виходить найкраща модель.
- Подивіться на всі можливі моделі та виберіть "найкращі". Обчислювально інтенсивний і не надійний.
- Підійдіть до великої моделі зі строком покарання L1 (стиль ласо). Непридатні змінні можуть потрапляти в придатність. Краще, але нестабільно із розрідженими матрицями.
- Метод рандомізації 3. Візьміть випадкові підмножини, помістіть пенізовану модель до кожного та порівняйте результати. Вибираються змінні, які часто з’являються. Коли реакція є двійковою, це рандомізована логістична регресія. Аналогічну техніку можна витягнути з безперервними даними та загальною лінійною моделлю.