Наука про дані tools

8

Чому інтернет-компанії віддають перевагу Java / Python для роботи вченого?

Я багато разів бачу в описі вакансії науковця даних, який запитує досвід Python / Java та ігнорує R. Нижче наведено особистий електронний лист, який я отримав від головного науковця даних компанії, до якого я подав заявку через linkedin. X, Дякую за зв'язок та виявлення інтересу. У вас є хороші навички …

53 beginner tools career reference-request

9

Інструменти та протокол для відтворення даних з використанням Python

Я працюю над проектом з вивчення даних за допомогою Python. Проект має кілька етапів. Кожен етап включає прийняття набору даних, використання сценаріїв Python, допоміжних даних, конфігурації та параметрів та створення іншого набору даних. Я зберігаю код у git, щоб ця частина була прикрита. Я хотів би почути про: Інструменти для …

50 python tools version-control

9

Альтернативи IDE для програмування на R (RStudio, IntelliJ IDEA, Eclipse, Visual Studio)

Я використовую RStudio для програмування R. Я пам’ятаю про солідні IDE з інших стеків технологій, таких як Visual Studio або Eclipse. У мене є два питання: Які інші IDE, ніж RStudio, використовуються (будь ласка, розгляньте, надавши короткий опис про них). Чи має хтось із них помітні переваги перед RStudio? Я …

46 r tools rstudio programming

11

Чи використовують дані вчені Excel?

Я вважав би себе вченим даними. Як і більшість (я думаю), я склав свої перші графіки і зробив свої перші агрегації у середній школі та коледжі, використовуючи Excel. Пройшовши навчання в коледжі, середній школі та ~ 7 років досвіду роботи, я швидко підібрав те, що вважаю більш досконалими інструментами, такими …

37 tools career excel

5

Образ VM для проектів з наукових даних

Оскільки є чимало інструментів, доступних для завдань із вивчення даних, і це громіздко встановити все і створити досконалу систему. Чи є зображення ОС Linux / Mac OS з Python, R та іншими інструментами з відкритим вихідним кодом, встановленими та доступними для того, щоб люди могли їх використовувати відразу? Ідеально підійде …

24 python r tools

4

Що робить стовпчикові бази даних придатними для наукових даних?

Які є переваги стовпчастих сховищ даних, які роблять їх більш придатними для наукових даних та аналітики?

23 databases tools

5

збільшують теплову карту для новонароджених

Я створюю corr()df з оригінального df. corr()ДФ вийшов 70 X 70 і неможливо уявити собі Heatmap ... sns.heatmap(df). Якщо я спробую відобразити corr = df.corr()таблицю, таблиця не відповідає екрану, і я бачу всі кореляції. Це спосіб або надрукувати весь, dfнезалежно від його розміру, або контролювати розмір теплової карти?

17 visualization pandas plotting machine-learning neural-network svm decision-trees svm efficiency python linear-regression machine-learning nlp topic-model lda named-entity-recognition naive-bayes-classifier association-rules fuzzy-logic kaggle deep-learning tensorflow inception classification feature-selection feature-engineering machine-learning scikit-learn tensorflow keras encoding nlp text-mining nlp rnn python neural-network feature-extraction machine-learning predictive-modeling python r linear-regression clustering r ggplot2 neural-network neural-network training python neural-network deep-learning rnn predictive-modeling databases sql programming distribution dataset cross-validation neural-network deep-learning rnn machine-learning machine-learning python deep-learning data-mining tensorflow visualization tools sql embeddings orange feature-extraction unsupervised-learning gan machine-learning python data-mining pandas machine-learning data-mining bigdata apache-spark apache-hadoop deep-learning python convnet keras aggregation clustering k-means r random-forest decision-trees reference-request visualization data pandas plotting neural-network keras rnn theano deep-learning tensorflow inception predictive-modeling deep-learning regression sentiment-analysis nlp encoding deep-learning python scikit-learn lda convnet keras predictive-modeling regression overfitting regression svm prediction machine-learning similarity word2vec information-retrieval word-embeddings neural-network deep-learning rnn

2

Яка різниця між Hadoop і noSQL

Я чув про багато інструментів / рамок, які допомагають людям обробляти свої дані (середовище великих даних). Один називається Hadoop, а інший - noSQL. Чим відрізняється точка обробки? Вони доповнюють один одного?

15 nosql tools processing apache-hadoop

2

Інструменти з відкритих джерел для допомоги у видобутку потоку балів лідерів

Розглянемо потік, що містить кортежі, що (user, new_score) представляють результати користувачів в онлайн-грі. Потік може мати 100-1000 нових елементів в секунду. У грі є 200K до 300K унікальних гравців. Я хотів би мати кілька постійних запитів, таких як: Котрі гравці розміщували більше x балів у розсувному вікні години Які гравці …

12 tools data-stream-mining

2

Бухгалтерський облік експериментів та результатів

Я є дослідником і мені подобається тестувати життєздатні рішення, тому я, як правило, провожу багато експериментів. Наприклад, якщо я обчислюю оцінку подібності між документами, я, можливо, захочу спробувати багато заходів. Насправді, для кожного заходу мені може знадобитися зробити кілька запусків, щоб перевірити дію деяких параметрів. Поки що я відстежував вхідні …

11 tools experiments

3

Кращі мови для наукових обчислень [закрито]

Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 5 років тому . Здається, що більшість мов мають деяку кількість бібліотек наукових обчислень. Python має Scipy Rust …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

4

Які початкові кроки я повинен використовувати, щоб зрозуміти великі набори даних, і які інструменти я повинен використовувати?

Caveat: Я повний новачок, коли йдеться про машинне навчання, але прагну вчитися. У мене великий набір даних, і я намагаюся знайти в ньому шаблон. Можливо / може не бути кореляції між даними, як з відомими змінними, так і зі змінними, які містяться в даних, але які я ще не зрозумів, …

10 machine-learning data-mining tools beginner

Запитання з тегом «tools»