Запитання з тегом «beginner»

Для питань, які стосуються початку роботи в Data Science або будь-якому з пов’язаних з ним субдоменів.

3
RNN проти CNN на високому рівні
Я думав про періодичні нейронні мережі (RNN) та їх різновиди, конволюційні нейронні мережі (CNN) та їх різновиди. Чи справедливо сказати б ці два моменти: Використовуйте CNN, щоб розбити компонент (наприклад, зображення) на підкомпоненти (наприклад, об'єкт у зображенні, такий як контур об'єкта на зображенні тощо) Використовуйте RNN для створення комбінацій підкомпонентів …

8
Чому інтернет-компанії віддають перевагу Java / Python для роботи вченого?
Я багато разів бачу в описі вакансії науковця даних, який запитує досвід Python / Java та ігнорує R. Нижче наведено особистий електронний лист, який я отримав від головного науковця даних компанії, до якого я подав заявку через linkedin. X, Дякую за зв'язок та виявлення інтересу. У вас є хороші навички …

1
Чому xgboost так швидше, ніж sklearn GradientBoostingClassifier?
Я намагаюся підготувати градієнтну модель для збільшення градієнта на 50 к. Прикладах із 100 числовими функціями. XGBClassifierобробляє 500 дерев протягом 43 секунд на моїй машині, тоді як GradientBoostingClassifierобробляє лише 10 дерев (!) за 1 хвилину і 2 секунди :( Я не намагався виростити 500 дерев, як це займе години. Я …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

2
Як боротися з часовими рядами, які змінюються сезонністю чи іншими моделями?
Фон Я працюю над набором даних часових рядів показань лічильника енергії. Тривалість серії варіюється в залежності від метра - для одних у мене кілька років, інших - лише кілька місяців і т. Д. Багато хто демонструє значну сезонність, а часто і багатошаровість - протягом дня, тижня чи року. Однією з …

3
Вилучення ключового слова / фрази з тексту за допомогою бібліотек Deep Learning
Можливо, це занадто широко, але я шукаю посилання на те, як використовувати глибоке навчання у завданні підбиття тексту. Я вже реалізував узагальнення тексту, використовуючи стандартні підходи до частоти слів і ранжування речень, але я хотів би вивчити можливість використання методів глибокого навчання для цього завдання. Я також пройшов кілька реалізацій, …

3
Як самостійно засвоїти наукові дані? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 4 роки тому . Я веб-розробник-самоучка і зацікавлений навчати себе науці даних, але я не знаю, як це …

5
Проекти з відкритим кодом для наукових даних, щоб зробити свій внесок
Внесок у проекти з відкритим кодом, як правило, є хорошим способом отримати практику для новачків та спробувати нову область для досвідчених науковців та аналітиків. У які проекти ви сприяєте? Укажіть, будь ласка, якесь вступне посилання на Github.

2
Наука даних без знання певної теми, чи варто займатися кар’єрою? [зачинено]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було актуальним для обміну стеками даних. Закрито 5 років тому . Нещодавно я провів бесіду з кимось і згадав про свій інтерес до аналізу даних і про те, з ким я мав …

7
Я програміст, як я можу потрапити в сферу наукових даних?
Перш за все цей термін звучить так незрозуміло. У всякому разі .. Я програмний програміст. Однією з мов, яку я можу кодувати, є Python. Якщо говорити про дані, то я можу використовувати SQL і можу робити скребки даних. Що я з’ясував поки що, прочитавши так багато статей, що в науці …
13 beginner  career 

3
Неструктурована класифікація тексту
Я буду класифікувати неструктуровані текстові документи, а саме веб-сайти невідомої структури. Кількість класів, до яких я класифікую, обмежена (на даний момент я вважаю, що існує не більше трьох). Хтось пропонує, як мені почати? Чи підхід "мішок слів" тут здійсненний? Пізніше я можу додати ще один етап класифікації на основі структури …

4
Які початкові кроки я повинен використовувати, щоб зрозуміти великі набори даних, і які інструменти я повинен використовувати?
Caveat: Я повний новачок, коли йдеться про машинне навчання, але прагну вчитися. У мене великий набір даних, і я намагаюся знайти в ньому шаблон. Можливо / може не бути кореляції між даними, як з відомими змінними, так і зі змінними, які містяться в даних, але які я ще не зрозумів, …

1
Чи потрібно нормалізувати дані, будуючи дерева рішень за допомогою R?
Отже, наш набір даних цього тижня має 14 атрибутів, і кожен стовпець має дуже різні значення. Один стовпець має значення нижче 1, а інший - у трьох-чотирьох цілих цифр. Ми дізналися про нормалізацію минулого тижня, і, здається, ви повинні нормалізувати дані, коли вони мають дуже різні значення. Чи стосується дерев …
10 r  beginner 
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.