Запитання з тегом «python»

Python - мова програмування, яка зазвичай використовується для машинного навчання. Використовуйте цей тег для будь-якого питання * на тему *, що (a) включає `Python` або як критичну частину запитання або очікувану відповідь; & (b) не є * лише * про те, як використовувати` Python`.

2
Реалізація вкладеної перехресної перевірки
Я намагаюся зрозуміти, чи правильно я розумію вкладені перехресні перевірки, тому я написав цей приклад іграшки, щоб побачити, чи маю рацію: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = 1 # load boston dataset …

3
Виявлення аномалії часового ряду з Python
Мені потрібно реалізувати виявлення аномалії на кількох наборах даних часових рядів. Я ніколи цього не робив і сподівався на поради. Мені дуже зручно з python, тому я вважаю за краще, щоб рішення було втілено в ньому (більшість мого коду - це python для інших частин моєї роботи). Опис даних: дані …

1
R лінійна регресія, категоріальна змінна значення «приховане»
Це лише приклад, на який я зустрічався кілька разів, тому у мене немає даних про вибірку. Запуск лінійної регресійної моделі в R: a.lm = lm(Y ~ x1 + x2) x1є суцільною змінною. x2категоричний і має три значення, наприклад "Низький", "Середній" та "Високий". Однак вихід, отриманий R, був би на кшталт: …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


1
Як дітям вдається зібрати батьків у проекції PCA набору даних GWAS?
Візьміть 20 випадкових точок у 10-мірному просторі з кожною координатною лінією від N( 0 , 1 )N(0,1)\mathcal N(0,1). Розділіть їх на 10 пар ("пари") і додайте до набору даних середнє значення кожної пари ("дитина"). Потім зробіть PCA на отриманих 30 очках і побудуйте графік PC1 проти PC2. Відбувається чудова річ: …

1
Утворіть випадкові числа з "похилого рівномірного розподілу" з математичної теорії
З якоюсь метою мені потрібно генерувати випадкові числа (дані) з "похилого рівномірного" розподілу. "Нахил" цього розподілу може змінюватись в якийсь розумний інтервал, і тоді мій розподіл повинен змінюватися від рівномірного до трикутного на основі схилу. Ось моя деривація: Давайте спростимо та сформуємо дані від до (синій, червоний - рівномірний розподіл). …

2
Як би ви візуалізували сегментовану воронку? (а ви могли б це зробити з Python?)
Я побачив цю публікацію на Moz, яка представила сегментовану маркетингову лійку: Така річ мала б неабияку цінність у моїй роботі. Я поняття не маю - це візуалізувати необроблені дані, щоб показати сегментовану воронку, як ця. Ідея полягає в тому, що потенційні продажі надходять з різних джерел (які ми використовуємо для …

1
Формування формули інерції в науці
Я хотів би кодувати kmeans, що кластеруються в python, використовуючи панди та scikit learn. Для того, щоб вибрати хороший k, я хотів би зашифрувати статистику прогалини від Tibshirani та ін 2001 ( pdf ). Мені хотілося б знати, чи можу я використати результат inertia_ від scikit і адаптувати статистичну формулу …

2
Як вписати регресію типу в R?
У мене є дані часових рядів, де вимірювана змінна - це дискретні додатні цілі числа (рахунки). Я хочу перевірити, чи є тенденція до зростання (чи ні). Незалежна змінна (x) знаходиться в діапазоні 0-500, а залежна змінна (y) знаходиться в діапазоні 0-8. Я подумав, що відповідаю на це, встановлюючи регресію форми …
9 r  regression  python 

2
Оцінка піків у часових рядах даних сигналу комірок
Я вимірюю наявність відповіді в вимірюваннях клітинного сигналу. Я спершу застосував алгоритм згладжування (Ханнінг) до часових рядів даних, а потім виявив піки. Що я отримую, це: Якби я хотів зробити виявлення відповіді трохи об'єктивнішим, ніж "так, ви бачите підвищення в безперервному падінні", який би був найкращий підхід? Чи потрібно отримати …

5
Обчислення відсотків нормального розподілу
Дивіться цю сторінку Вікіпедії: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval Щоб отримати інтервал узгодженості Куллі, потрібно обчислити відсоток нормального розподілу, званого . Як обчислити відсоток? Чи є готова функція, яка робить це в Wolfram Mathematica та / або Python / NumPy / SciPy?zzz

1
Різниця між Naive Bayes і періодичною нейронною мережею (LSTM)
Я хочу провести аналіз настрою на текст, пройшов кілька статей, деякі з них використовують "Naive Bayes", а інші - "Recurrent Neural Network (LSTM)" , з іншого боку я бачив бібліотеку пітонів для аналізу настроїв, які є nltk. Він використовує "Naive Bayes", може хто-небудь пояснити, в чому різниця між використанням цих …

2
Чому цей набір даних не має коваріації?
Я розумію, як працює коваріація, що дані, що співвідносяться, повинні мати дещо високу коваріацію. Я натрапив на ситуацію, коли мої дані виглядають співвіднесеними (як показано на графіку розкидання), але коваріація майже до нуля. Як може коваріація даних дорівнювати нулю, якщо вони співвідносяться? import numpy as np x1 = np.array([ 0.03551153, …

1
Як зробити аналіз кореляції "пива та пелюшок"
У мене є дані, еквівалентні: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... Я хотів би зробити якийсь аналіз цього набору даних, щоб отримати кореляційну матрицю, яка матиме подібні наслідки: якщо ви купили x, ви, ймовірно, купите y. Використовуючи python (або, можливо, що-небудь, крім MATLAB), як я можу …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.