Можна оцінити GLM в Python / scikit-learn, використовуючи розподіли Poisson, Gamma або Tweedie як сімейство для розподілу помилок?


13

Намагаюся вивчити деякі Python та Sklearn, але для своєї роботи мені потрібно запустити регресії, які використовують розподіл помилок із сімей Пуассона, Гамми та особливо Tweedie.

Я нічого не бачу в документації про них, але вони знаходяться в декількох частинах розподілу R, тому мені було цікаво, чи хтось бачив реалізацію для Python де-небудь. Було б дуже круто, якщо ви можете вказати мені на реалізацію SGD дистрибуції Tweedie!


Найбільш надійні реалізації GLM в Python - це в [statsmodels] statsmodels.sourceforge.net, хоча я не впевнений, чи є реалізації SGD.
Трей

Дякую Трей. Схоже, немає підтримки Tweedie, але вони мають певну дискусію щодо розповсюдження Пуассона та Гамми.
Джо

Відповіді:


13

Існує рух для впровадження узагальнених лінійних моделей з розподілами помилок Пуассона, гами та Твіді в scikit-learn.

Statsmodels має реалізацію узагальнених лінійних моделей з розподілом помилок Пуассона, Твіді та гамми.

Поки я оновлюю цю відповідь, Spark ML також (експериментально) підтримує розповсюдження Poisson, Tweedie та гамма.


5
Я працюю над цим: github.com/madrury/py-glm
Matthew Drury

@MatthewDrury Awesome!
Ніл

@MatthewDrury приємно! Я щойно почав використовувати GLM, і statsmodels має деякі обмеження. Не впевнений, що я повністю розумію математику, але чи міг би ваше внутрішнє вирішити замінити довільним вирішувачем найменших квадратів? Я думав, що це додасть гнучкості (наприклад, передайте у sklearn.ElasticNet, щоб отримати масштабованість / регуляризацію / тощо. "Безкоштовно"?).
GeoMatt22

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.