Запитання з тегом «performance»

12
Наскільки великі великі дані?
Багато людей використовують термін великі дані досить комерційним шляхом, як засіб вказування на те, що великі набори даних беруть участь у обчисленнях, і тому потенційні рішення повинні мати хороші показники. Звичайно, великі дані завжди містять пов'язані терміни, такі як масштабованість та ефективність, але що саме визначає проблему як велику проблему …

4
Чи існує прямий спосіб паралельного запуску pandas.DataFrame.isin?
У мене є програма моделювання та підрахунку балів, яка широко використовує DataFrame.isinфункцію панд, здійснюючи пошук по списках фейсбукових "схожих" записів окремих користувачів на кожну з кількох тисяч певних сторінок. Це найбільш трудомістка частина програми, більше, ніж моделювання чи забивання штук, просто тому, що вона працює лише на одному ядрі, а …

3
Як ви керуєте очікуванням на роботі?
З усього голосу навколо наукових даних, машинного навчання та всіх історій успіху існує багато виправданих, а також завищених очікувань від науковців даних та їх прогнозних моделей. Моє запитання до практикуючих статистиків, експертів машинного навчання та науковців даних - як ви керуєте очікуваннями бізнесменів вашої компанії, особливо щодо точності прогнозування моделей? …

1
Коли реляційна база даних має кращі показники, ніж реляційна
Коли реляційна база даних, як MySQL, має кращу продуктивність, ніж реляційна, як MongoDB? Днями я побачив питання про Quora про те, чому Quora все ще використовує MySQL як їхній запуск, і про те, що їхня ефективність все ще хороша.

3
Вимірювання продуктивності різних класифікаторів з різними розмірами вибірки
В даний час я використовую кілька різних класифікаторів для різних об'єктів, витягнутих з тексту, і використовую точність / згадування як підсумок того, наскільки добре працює кожен окремий класифікатор для певного набору даних. Мені цікаво, чи є змістовний спосіб порівняння продуктивності цих класифікаторів аналогічним чином, але який також враховує загальну кількість …

4
Міра ефективності: Чому це називається відкликанням?
точність - це частка отриманих екземплярів, які є релевантними, тоді як виклик (також відомий як чутливість) - це частка відповідних екземплярів, які витягуються. Я знаю їх значення, але не знаю, чому це називається відкликанням ? Я не є носієм англійської мови. Я знаю, що згадати означає, пам'ятайте, тоді я не …

3
Кращі мови для наукових обчислень [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 5 років тому . Здається, що більшість мов мають деяку кількість бібліотек наукових обчислень. Python має Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
Як порівняти ефективність методів вибору функцій?
Є кілька підходів до вибору функцій / змінних (див., Наприклад, Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): методи фільтрування (наприклад, на основі кореляції, на основі ентропії, на основі випадкових лісів), способи обгортки (наприклад, пошук вперед, пошук на сходження на гору) та вбудовані методи, де вибір функції є …

4
Чому важко надати ефективність під час використання бібліотек?
Будь-яка невелика обробка бази даних може бути легко вирішена сценаріями Python / Perl / ..., що використовує бібліотеки та / або навіть утиліти з самої мови. Однак, що стосується продуктивності, люди, як правило, тягнуться до мов C / C ++ / низького рівня. Можливість адаптації коду до потреб, здається, є …

1
Який найкращий показник ефективності, який використовується в балансуванні набору даних за допомогою технології SMOTE
Я використовував техніку smote, щоб проаналізувати мій набір даних, і тепер у мене є збалансований набір даних. Проблема, з якою я стикався, полягає в тому, що показники ефективності; точність, нагадаємо, міра f1, точність в незбалансованому наборі даних краще виконуватись, ніж у збалансованих даних. Яке вимірювання можна використовувати, щоб показати, що …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.