Запитання з тегом «tools»

8
Чому інтернет-компанії віддають перевагу Java / Python для роботи вченого?
Я багато разів бачу в описі вакансії науковця даних, який запитує досвід Python / Java та ігнорує R. Нижче наведено особистий електронний лист, який я отримав від головного науковця даних компанії, до якого я подав заявку через linkedin. X, Дякую за зв'язок та виявлення інтересу. У вас є хороші навички …

9
Інструменти та протокол для відтворення даних з використанням Python
Я працюю над проектом з вивчення даних за допомогою Python. Проект має кілька етапів. Кожен етап включає прийняття набору даних, використання сценаріїв Python, допоміжних даних, конфігурації та параметрів та створення іншого набору даних. Я зберігаю код у git, щоб ця частина була прикрита. Я хотів би почути про: Інструменти для …

9
Альтернативи IDE для програмування на R (RStudio, IntelliJ IDEA, Eclipse, Visual Studio)
Я використовую RStudio для програмування R. Я пам’ятаю про солідні IDE з інших стеків технологій, таких як Visual Studio або Eclipse. У мене є два питання: Які інші IDE, ніж RStudio, використовуються (будь ласка, розгляньте, надавши короткий опис про них). Чи має хтось із них помітні переваги перед RStudio? Я …
46 r  tools  rstudio  programming 

11
Чи використовують дані вчені Excel?
Я вважав би себе вченим даними. Як і більшість (я думаю), я склав свої перші графіки і зробив свої перші агрегації у середній школі та коледжі, використовуючи Excel. Пройшовши навчання в коледжі, середній школі та ~ 7 років досвіду роботи, я швидко підібрав те, що вважаю більш досконалими інструментами, такими …
37 tools  career  excel 

5
Образ VM для проектів з наукових даних
Оскільки є чимало інструментів, доступних для завдань із вивчення даних, і це громіздко встановити все і створити досконалу систему. Чи є зображення ОС Linux / Mac OS з Python, R та іншими інструментами з відкритим вихідним кодом, встановленими та доступними для того, щоб люди могли їх використовувати відразу? Ідеально підійде …
24 python  r  tools 


5
збільшують теплову карту для новонароджених
Я створюю corr()df з оригінального df. corr()ДФ вийшов 70 X 70 і неможливо уявити собі Heatmap ... sns.heatmap(df). Якщо я спробую відобразити corr = df.corr()таблицю, таблиця не відповідає екрану, і я бачу всі кореляції. Це спосіб або надрукувати весь, dfнезалежно від його розміру, або контролювати розмір теплової карти?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

2
Яка різниця між Hadoop і noSQL
Я чув про багато інструментів / рамок, які допомагають людям обробляти свої дані (середовище великих даних). Один називається Hadoop, а інший - noSQL. Чим відрізняється точка обробки? Вони доповнюють один одного?

2
Інструменти з відкритих джерел для допомоги у видобутку потоку балів лідерів
Розглянемо потік, що містить кортежі, що (user, new_score) представляють результати користувачів в онлайн-грі. Потік може мати 100-1000 нових елементів в секунду. У грі є 200K до 300K унікальних гравців. Я хотів би мати кілька постійних запитів, таких як: Котрі гравці розміщували більше x балів у розсувному вікні години Які гравці …

2
Бухгалтерський облік експериментів та результатів
Я є дослідником і мені подобається тестувати життєздатні рішення, тому я, як правило, провожу багато експериментів. Наприклад, якщо я обчислюю оцінку подібності між документами, я, можливо, захочу спробувати багато заходів. Насправді, для кожного заходу мені може знадобитися зробити кілька запусків, щоб перевірити дію деяких параметрів. Поки що я відстежував вхідні …

3
Кращі мови для наукових обчислень [закрито]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 5 років тому . Здається, що більшість мов мають деяку кількість бібліотек наукових обчислень. Python має Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
Які початкові кроки я повинен використовувати, щоб зрозуміти великі набори даних, і які інструменти я повинен використовувати?
Caveat: Я повний новачок, коли йдеться про машинне навчання, але прагну вчитися. У мене великий набір даних, і я намагаюся знайти в ньому шаблон. Можливо / може не бути кореляції між даними, як з відомими змінними, так і зі змінними, які містяться в даних, але які я ще не зрозумів, …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.