Запитання з тегом «python»

Python - мова програмування, яка зазвичай використовується для машинного навчання. Використовуйте цей тег для будь-якого питання * на тему *, що (a) включає `Python` або як критичну частину запитання або очікувану відповідь; & (b) не є * лише * про те, як використовувати` Python`.

2
Як Tensorflow `tf.train.Optimizer` обчислює градієнти?
Я стежу за підручником із журналу Tensorflow ( https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/mnist_softmax.py ). Підручник використовує tf.train.Optimizer.minimize(конкретно tf.train.GradientDescentOptimizer). Я не бачу жодних аргументів, щоб передаватись ніде для визначення градієнтів. Чи потік тензорів використовує цифрову диференціацію за замовчуванням? Чи є спосіб пройти в градієнтах, як ви можете scipy.optimize.minimize?

1
Випадкові лісові ймовірнісні прогнози проти більшості голосів
Здається, Scikit використовує ймовірнісне прогнозування замість більшості голосів для методики моделювання агрегації без пояснення того, чому (1.9.2.1. Випадкові ліси). Чи є чітке пояснення чому? Далі є хороша стаття чи огляд статей для різних методів агрегації моделей, які можна використовувати для випадкового розпалювання лісу? Дякую!

1
Стандартне відхилення середньозваженого середнього значення
Я написав просту функцію в Python для обчислення експоненціально зваженого середнього: def test(): x = [1,2,3,4,5] alpha = 0.98 s_old = x[0] for i in range(1, len(x)): s = alpha * x[i] + (1- alpha) * s_old s_old = s return s Однак як я можу розрахувати відповідну SD?

2
PyMC для непараметричної кластеризації: Процес Діріхле для оцінки параметрів суміші Гаусса не вдається кластеризувати
Налаштування проблеми Однією з перших іграшкових проблем, до якої я хотів застосувати PyMC, є непараметричне кластеризація: давши деякі дані, моделюйте її як гауссову суміш та дізнайтеся кількість кластерів та середнє значення та коеваріантність кожного кластеру. Більшість того, що я знаю про цей метод, походить з відео-лекцій Майкла Джордана та Йе-Уу-Тех, …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Як розрахувати взаємну інформацію?
Я трохи розгублений. Чи може хтось пояснити мені, як обчислити взаємну інформацію між двома термінами на основі матриці термінового документа з двояковим виникненням терміна як ваг? Document1Document2Document3′Why′111′How′101′When′111′Where′100′Why′′How′′When′′Where′Document11111Document21010Document31110 \begin{matrix} & 'Why' & 'How' & 'When' & 'Where' \\ Document1 & 1 & 1 & 1 & 1 \\ Document2 & 1 …

2
Придатна модель для двох нормальних розподілів в PyMC
Оскільки я інженер програмного забезпечення, який намагається дізнатися більше статистики, вам доведеться пробачити мене ще до того, як я навіть розпочну, це серйозна територія нового походження ... Я вивчав PyMC і працюю через кілька справді (дійсно) простих прикладів. Одна з проблем, яку я не можу взяти на роботу (і не …
10 modeling  python  pymc 

2
Як я можу генерувати числа відповідно до розподілу Soliton?
Розподіл Солітона - це дискретний розподіл ймовірності на множині з функцією маси ймовірностей{1,…,N}{1,…,N}\{1,\dots, N\} p ( 1 ) = 1N,p ( k ) = 1k ( k - 1 )для k ∈ { 2 , … , N}p(1)=1N,p(k)=1k(k−1)for k∈{2,…,N} p(1)=\frac{1}{N},\qquad p(k)=\frac{1}{k(k-1)}\quad\text{for }k\in\{2,\dots, N\} Я хотів би використовувати його як частину …

4
Вміст нормального розподілу журналу в R проти SciPy
Я встановив логічну модель, використовуючи R із набором даних. Отримані параметри: meanlog = 4.2991610 sdlog = 0.5511349 Я хотів би перенести цю модель на Scipy, яку я ніколи раніше не використовував. Використовуючи Scipy, я зміг отримати форму та масштаб 1 та 3.1626716539637488e + 90 - дуже різні числа. Я також …
10 r  python  numpy  scipy 

3
Який найефективніший спосіб навчання даних з використанням найменшої пам'яті?
Це мої дані про навчання: 200 000 Приклади х 10 000 Особливості. Тож моя матриця даних про навчання - 200 000 х 10 000. Мені вдалося зберегти це у плоскому файлі без проблем із пам'яттю, зберігаючи кожен набір даних один за одним (один приклад за іншим), оскільки я генерую функції …

1
t-SNE зі змішаними безперервними та бінарними змінними
В даний час я досліджую візуалізацію об'ємних даних за допомогою t-SNE. У мене є деякі дані зі змішаними бінарними та безперервними змінними, і, схоже, ці дані занадто легко кластерують бінарні дані. Звичайно, це очікується для масштабованих (між 0 і 1) даних: евклідова відстань завжди буде найбільшим / найменшим між бінарними …

4
Як статистично довести, чи стовпець має категоричні дані чи не використовує Python
У мене є фрейм даних в python, де мені потрібно знайти всі категоричні змінні. Перевірка типу стовпця не завжди працює, тому що intтип може бути також категоричним. Тож я шукаю допомоги у пошуку правильного методу тестування гіпотез, щоб визначити, категорія категорія чи ні. Я пробував нижче тесту чи-квадрата, але не …

2
Регульований індекс Rand vs коригувана взаємна інформація
Я намагаюся оцінити ефективність кластеризації. Я читав документацію по вивченню skiscit на метриках . Я не розумію різниці між ARI та AMI. Мені здається, що вони роблять одне й те саме двома різними способами. Посилаючись на документацію: Враховуючи знання присвоєння основного класу правди labels_true та призначення алгоритму кластеризації одних і …

4
Найкращий спосіб посіяти N незалежних генераторів випадкових чисел з 1 значення
У моїй програмі мені потрібно запустити N окремих потоків, кожен з яких має власний RNG, який використовується для вибірки великого набору даних. Мені потрібно мати можливість зафіксувати весь цей процес одним значенням, щоб я міг відтворити результати. Чи достатньо просто послідовно збільшувати насіння для кожного показника? В даний час я …

3
Визначення відфільтрованих функцій після вибору функцій за допомогою scikit learn
Ось мій код вибору функції в Python: from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) Але після отримання нової X (залежної змінної - X_new), як я можу знати, які змінні …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.