Запитання з тегом «python»

Python - мова програмування, яка зазвичай використовується для машинного навчання. Використовуйте цей тег для будь-якого питання * на тему *, що (a) включає `Python` або як критичну частину запитання або очікувану відповідь; & (b) не є * лише * про те, як використовувати` Python`.

2
Як використовувати функції крос-валідації scikit-learn на багатозначних класифікаторах
Я тестую різні класифікатори на наборі даних, де є 5 класів, і кожен екземпляр може належати до одного або декількох із цих класів, тому конкретно використовую багатозначні класифікатори scikit-learn sklearn.multiclass.OneVsRestClassifier. Тепер я хочу виконати перехресну перевірку за допомогою sklearn.cross_validation.StratifiedKFold. Це спричиняє таку помилку: Traceback (most recent call last): File "mlfromcsv.py", …

2
Як назвати кліщів у коробці плітону matplotlib
Заблокований . Це питання та його відповіді заблоковано, оскільки це питання поза темою, але має історичне значення. Наразі не приймає нових відповідей чи взаємодій. У Python matplotlib є команда boxplot . Зазвичай всі частини графіка проставляються цифрами. Як я можу змінити галочки на імена замість позицій? Для ілюстрації я маю …

4
Які правильні значення для точності та відкликання у кращих випадках?
Точність визначається як: p = true positives / (true positives + false positives) Чи правильно, що як true positivesі false positivesпідхід 0, точність наближається до 1? Те саме запитання для відкликання: r = true positives / (true positives + false negatives) Зараз я впроваджую статистичний тест, де мені потрібно обчислити …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
Кластеризація кореляційної матриці
У мене є кореляційна матриця, яка визначає, як кожен елемент співвідноситься з іншим елементом. Отже, для N елементів я вже маю кореляційну матрицю N * N. Використовуючи цю кореляційну матрицю, як я кластеризую N елементів у M-бункерах, щоб я міг сказати, що Nk-елементи в kth bin поводяться однаково. Прошу допомогти …

3
Юлія: Підвівши підсумки того, як це було
Ця публікація стосується події, що швидко змінюється. Я наштовхнувся на питання 2012 року, в якому було дуже добре обговорювати Юлію як альтернативу R / Python для різних видів статистичної роботи. Тут лежить оригінальний запитання 2012 року про обіцянку Джулії На жаль, тоді Юлія була зовсім новою, і набори інструментів, необхідні …
19 r  python  computing  julia 

1
Використання кругових предикторів при лінійній регресії
Я намагаюся підігнати модель, використовуючи дані про вітер (0, 359) та час доби (0, 23), але я стурбований тим, що вони погано впишуться в лінійну регресію, оскільки самі по собі не є лінійними параметрами. Я хотів би перетворити їх за допомогою Python. Я бачив деякі згадки про обчислення середнього вектора …

3
Використання RNN (LSTM) для прогнозування векторів таймсерій (Theano)
У мене дуже проста проблема, але я не можу знайти правильний інструмент для її вирішення. У мене є деяка послідовність векторів однакової довжини. Тепер я хотів би навчити LSTM RNN на зразку поїздів цих послідовностей, а потім змусити його передбачити нову послідовність векторів довжиною на основі декількох векторів праймінгу .ннn …

3
Як моделювати дані, щоб бути статистично значущими?
Я перебуваю в 10 класі і шукаю моделювати дані для проекту ярмарку машинного навчання. Кінцева модель буде використана на даних про пацієнтів і передбачає співвідношення між певним часом тижня та впливом, яке це має на прихильність ліків у межах даних про одного пацієнта. Значення прихильності будуть двійковими (0 означає, що …

3
Як обчислити стандартні похибки коефіцієнтів логістичної регресії
Я використовую науку Python для навчання та перевірки логістичної регресії. scikit-learn повертає коефіцієнти регресії незалежних змінних, але це не забезпечує стандартних помилок коефіцієнтів. Мені потрібні ці стандартні помилки для обчислення статистики Wald для кожного коефіцієнта і, в свою чергу, порівняння цих коефіцієнтів один з одним. Я знайшов один опис, як …

3
Як систематично видаляти колінеарні змінні в Python? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 2 роки тому . Поки що я видалив колінеарні змінні як частину процесу підготовки даних, переглянувши таблиці кореляції та усунувши змінні, що перевищують певний поріг. Чи …

3
Як я можу моделювати фліпси до досягнення N успіхів?
Ми з вами вирішили пограти в гру, де ми по черзі гортаємо монету. Перший гравець, який перевернув 10 головок, виграє гру. Природно, є аргумент про те, хто повинен йти першим. Симулятори цієї гри показують, що гравець, який перевертає спочатку, виграє на 6% більше, ніж той, хто перевертає другий (перший гравець …


2
Чи можливо автоматизувати прогнозування часових рядів?
Я хотів би побудувати алгоритм, який міг би проаналізувати будь-який часовий ряд і «автоматично» вибрати найкращий традиційний / статистичний метод прогнозування (та його параметри) для аналізованих даних часових рядів. Чи можна було б зробити щось подібне? Якщо так, чи можете ви дати мені кілька порад, як можна підійти до цього?

1
Природні перерви Дженкса в Python: Як знайти оптимальну кількість перерв?
Я знайшов цю реалізацію Python в Дженкс Natural Breaks алгоритму , і я міг би зробити його запустити на моєму комп'ютері Windows 7. Це досить швидко, і він знаходить перерви за кілька разів, враховуючи розмір моїх геоданих. Перш ніж використовувати цей алгоритм кластеризації для моїх даних, я використовував sklearn.clustering.KMeans (тут) …

2
Вибір особливостей за допомогою випадкових лісів
У мене є набір даних з переважно фінансовими змінними (120 функцій, приклади 4 к), які в основному є дуже корельованими та дуже галасливими (наприклад, технічні показники), тому я хотів би вибрати приблизно 20-30 для подальшого використання при навчанні моделі (двійкова класифікація - збільшення / зменшення). Я думав про використання випадкових …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.