Мені цікаво, чи є пакети для python, який здатний виконувати аналіз виживання. Я використовував пакет виживання в R, але хотів би перенести свою роботу на python.
survival
Пакет R знаходиться під ретельним наглядом великої громади.
Мені цікаво, чи є пакети для python, який здатний виконувати аналіз виживання. Я використовував пакет виживання в R, але хотів би перенести свою роботу на python.
survival
Пакет R знаходиться під ретельним наглядом великої громади.
Відповіді:
AFAIK, в python не існує жодного пакету аналізу виживання. Як зазначає mbq вище, єдиним доступним маршрутом був би Rpy .
Навіть якби був доступний чистий пакет python, я був би дуже обережний у його використанні, зокрема, я би звернув увагу на:
Однією з переваг R є те, що ці стандартні пакети отримують величезну кількість тестування та зворотного зв’язку користувачів. У роботі з реальними даними можуть виникнути несподівані крайові випадки.
Ознайомтеся з проектом f життєвих ресурсів для простої та чистої реалізації моделей виживання на Python, у тому числі
Переваги:
Документація доступна тут: документація та приклади
Приклад використання:
from lifelines import KaplanMeierFitter
survival_times = np.array([0., 3., 4.5, 10., 1.])
events = np.array([False, True, True, False, True])
kmf = KaplanMeierFitter()
kmf.fit(survival_times, event_observed=events)
print(kmf.survival_function_)
print(kmf.median_)
kmf.plot()
Приклади графіків із вбудованої бібліотеки графіків:
python-asurv - це спроба перенести програмне забезпечення asurv для методів виживання в астрономії. Можливо, варто стежити за тим, але cgillespie має рацію щодо того, на що слід стежити: у нього ще довгий шлях, і розвиток не здається активним. (AFAICT існує лише один метод, і навіть він завершений, пакет може бракувати, скажімо, для біостатистів.)
Вам, мабуть, краще використовувати пакет виживання в R від Python через щось на зразок RPy або PypeR . У мене не було ніяких проблем робити це сам.
PyIMSL містить декілька процедур для аналізу виживання. Це безкоштовно як у пиві для некомерційного використання, повністю підтримується інакше. З документації в Посібнику користувача статистики ...
Обчислює оцінку ймовірностей виживання Каплана-Мейєра: kaplanMeierEstimates ()
Аналізує дані про виживання та надійність за допомогою моделі пропорційної небезпеки Кокса: propHazardsGenLin ()
Аналізує дані про виживання за допомогою узагальненої лінійної моделі: survivalGlm ()
Оцінки за допомогою різних параметричних режимів: survivalEstimates ()
Оцінює функцію небезпеки щодо надійності за допомогою непараметричного підходу: nonparamHazardRate ()
Створює таблиці населення та когорти життя: lifeTables ()
Тепер ви можете використовувати R зсередини IPython , тому ви, можливо, захочете вивчити використання IPython з розширенням R.
rpy2
). Я теж хотів би побачити короткий приклад. ( Наскільки я розумію, що моделі виживання ще не повністю доступні в статистичних моделях .)
Я також хочу зазначити scikit-виживання , яке надає моделі аналізу виживання, які легко поєднуються з інструментами scikit-learn (наприклад, перехресна перевірка KFold).
Станом на це написання, scikit-виживання включає реалізацію
Окрім використання R
через RPy
або еквівалент, у бібліотеці статистичних моделей (раніше sicpy.statsmodel
) пітонів існує ряд процедур аналізу виживання . Вони знаходяться в упаковці "пісочниці", тобто зараз вони не повинні бути готові до виробництва.
Наприклад, у вас тут закодована модель Кокса пропорційної небезпеки .