Запитання з тегом «data-mining»

Діяльність, яка шукає шаблони у великих, складних наборах даних. Зазвичай це підкреслює алгоритмічні прийоми, але може також включати будь-який набір пов'язаних навичок, застосувань чи методологій з цією метою.

4
Як налагодити аналіз даних?
Я зіткнувся з наступною проблемою, яку я повторюю досить типово. У мене є кілька великих даних, скажімо, кілька мільйонів рядків. Я виконую на ньому нетривіальний аналіз, наприклад, SQL-запит, що складається з декількох підзапитів. Я отримую певний результат, констатуючи, наприклад, що властивість X з часом збільшується. Зараз є дві можливі речі, …

1
Кластеризація даних клієнтів, що зберігаються в ElasticSearch
У мене є купа профілів клієнтів, які зберігаються в еластичний пошуккластер. Ці профілі зараз використовуються для створення цільових груп для нашої підписки на електронну пошту. Цільові групи тепер формуються вручну, використовуючи можливість пошуку гранічних пошуків (наприклад, залучити всіх клієнтів чоловіків віком до 23 років з одним автомобілем та 3 дітьми). …

5
Як створити хороший список зупинок
Я шукаю підказки про те, як вилікувати список зупинок. Хтось знає / чи може хтось порекомендувати хороший метод вилучення списків зупинок із самого набору даних для попередньої обробки та фільтрації? Дані: величезна кількість введення людського тексту різної довжини (пошукові терміни та цілі речення (до 200 символів)) протягом кількох років. Текст …

2
Як моделювати поведінку покупців користувачів на Amazon?
Для нашого підсумкового курсового проекту з наукових даних ми запропонували наступне: Надайте набір даних обзорів Amazon , ми плануємо розробити алгоритм (орієнтований приблизно на персоналізований PageRank), який визначає стратегічну позицію для розміщення реклами на Amazon. Наприклад, на Amazon є мільйони продуктів. І набір даних дає вам уявлення про те, з …

1
Кодування навчального сигналу
У мене є велика кількість зразків, які представляють закодовані в Манчестері потоки бітів як звукові сигнали. Частота, з якою вони кодуються, є основною складовою частоти, коли вона велика, а на задньому плані є стійка кількість білого шуму. Я вручну розшифрував ці потоки, але мені було цікаво, чи можу я використати …

1
Реляційний обмін даними без ІЛП
У мене є величезний набір даних з реляційної бази даних, для чого мені потрібно створити модель класифікації. Зазвичай у цій ситуації я б використовував індуктивне логічне програмування (ILP), але через особливі обставини цього не можу. Іншим способом вирішити це було б просто спробувати узагальнити значення, коли у мене є зовнішні …

2
Розпізнавання діяльності людини за допомогою набору даних про смартфон
Я новачок у цій спільноті, і, сподіваюся, моє запитання тут добре впишеться. Як частина мого курсу бакалаврської аналітики даних я вирішив зробити проект з розпізнавання людської діяльності за допомогою наборів даних смартфонів. Наскільки мене хвилює ця тема стосується машинного навчання та підтримки векторних машин. Я ще не добре знайомий з …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.