Запитання з тегом «python»

Python - мова програмування, яка зазвичай використовується для машинного навчання. Використовуйте цей тег для будь-якого питання * на тему *, що (a) включає `Python` або як критичну частину запитання або очікувану відповідь; & (b) не є * лише * про те, як використовувати` Python`.

6
Ресурси для вивчення способів реалізації ансамблевих методів
Я теоретично розумію (начебто), як вони працюватимуть, але не впевнений, як реально використовувати метод ансамблю (наприклад, голосування, зважені суміші тощо). Які хороші ресурси для впровадження ансамблевих методів? Чи є якісь ресурси щодо впровадження в Python? Редагувати: Щоб прояснити деякі результати на основі обговорення в коментарях, я не шукаю алгоритмів ансамблі, …

3
Рубі як робочий стіл статистики
Це також питання, яке дуже стосується Python як верстата для статистики та excel як робочого місця зі статистикою . Я знаю, що про Рубі проти Python ведеться велика дискусія, але це питання не в цьому. Я думав, що Рубі швидше, ніж Python і має дуже природний синтаксис, може принести користь …
13 r  python  software  ruby 

4
Чи є підручники з теорії ймовірностей Баєса чи графічних моделей на прикладі?
Я бачив посилання на вивчення баєсівської теорії ймовірностей в R, і мені було цікаво, чи є щось подібне, можливо, конкретно в Python? Орієнтований на вивчення байєсівської теорії ймовірностей, умовиводу, максимальної оцінки ймовірності, графічних моделей і подібного роду?

9
Підсилили дерева рішень у пітоні? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 6 місяців тому . Чи є хороша бібліотека пітонів для навчання підсилених дерев рішень?
13 python  cart  boosting 

1
Пакет GBM проти Caret з використанням GBM
Я налаштовував модель за допомогою caret, але потім повторно запустив модель за допомогою gbmпакета. Наскільки я розумію, що caretпакет використовує gbmі вихід повинен бути однаковим. Однак, лише швидкий тестовий пробіг із застосуванням data(iris)показує невідповідність моделі приблизно 5%, використовуючи RMSE і R ^ 2 в якості метрики оцінювання. Я хочу знайти …

2
Використання BIC для оцінки кількості k у KMEANS
В даний час я намагаюся обчислити BIC для мого набору даних про іграшки (ofc iris (:). Я хочу відтворити результати, як показано тут (рис. 5). Цей документ також є моїм джерелом для формул BIC). У мене є 2 проблеми з цим: Позначення: ninin_i = кількість елементів кластераiii CiCiC_i = центральні …

2
Можна оцінити GLM в Python / scikit-learn, використовуючи розподіли Poisson, Gamma або Tweedie як сімейство для розподілу помилок?
Намагаюся вивчити деякі Python та Sklearn, але для своєї роботи мені потрібно запустити регресії, які використовують розподіл помилок із сімей Пуассона, Гамми та особливо Tweedie. Я нічого не бачу в документації про них, але вони знаходяться в декількох частинах розподілу R, тому мені було цікаво, чи хтось бачив реалізацію для …

2
Як користуватися фільтром Kalman?
У мене траєкторія об'єкта у двомірному просторі (поверхні). Траєкторія задається у вигляді послідовності (x,y)координат. Я знаю, що мої вимірювання шумні, і іноді я маю очевидні люди. Отже, я хочу відфільтрувати свої спостереження. Наскільки я зрозумів фільтр Кальмана, він робить саме те, що мені потрібно. Отже, я намагаюся ним скористатися. Я …

4
Як (систематично) налаштовувати рівень навчання з градієнтним походженням як оптимізатор?
Аутсайдер у галузі ML / DL; розпочав курс глибокого навчання Udacity, який базується на Tensorflow; виконання завдання 3 завдання 4; намагаючись налаштувати рівень навчання за допомогою наступної конфігурації: Розмір партії 128 Кількість кроків: достатньо, щоб заповнити 2 епохи Розміри прихованих шарів: 1024, 305, 75 Ініціалізація ваги: ​​усічений нормальний з std. …

1
Звичайна логістична регресія в Python
Я хотів би провести порядкову логістичну регресію в Python - для змінної відповіді з трьома рівнями та з кількома пояснювальними факторами. statsmodelsПакет підтримує двійковий логит і модель полиномиального логіт (MNLogit), але не впорядковану логит. Оскільки основна математика не така вже й інша, мені цікаво, чи можна її легко реалізувати, використовуючи …

1
Як інтерпретувати графік автокореляції в MCMC
Я знайомлюсь із статистикою Байєса, читаючи книгу " Проведення байєсівського аналізу даних " Джона К. Крушке, також відомого як "цуценя книга". У розділі 9 ієрархічні моделі знайомляться з цим простим прикладом: а спостереження Бернуллі - 3 монети, кожні 10 фліп. Один показує 9 голів, інший 5 голів та інший 1 …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Чому цей розподіл рівномірний?
Ми досліджуємо байєсівські статистичні випробування, і натрапимо на дивне (на мене принаймні) явище. Розглянемо наступний випадок: нас цікавить вимірювання того, яке населення, А чи В, має більш високий коефіцієнт конверсії. Для перевірки встановлюємо , тобто ймовірність конверсії однакова в обох групах. Ми створюємо штучні дані за допомогою біноміальної моделі, наприкладpA=pBpA=pBp_A …

1
Пакети Python для роботи з моделями суміші Гаусса (GMM)
Здається, існує кілька варіантів роботи з моделями Gaussian Mixure (GMM) в Python. На перший погляд є щонайменше: PyMix - http://www.pymix.org/pymix/index.php Інструменти для моделювання сумішей PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, який є частиною панелі інструментів Scipy і, здається, зосереджений на оновленнях GMM : Зараз відомий як sklearn.mixture . PyPR - http://pypr.sourceforge.net/ розпізнавання образів …

1
Інтерпретація вихідного прогнозу Scikit
Я працюю з бібліотекою scikit-learn в python. У наведеному нижче коді я прогнозую ймовірність, але не знаю, як прочитати вихід. Тестування даних from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Розділіть набір даних X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.5, random_state=0) …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.