Запитання з тегом «machine-learning»

Методи та принципи побудови "комп'ютерних систем, які автоматично вдосконалюються з досвідом".

1
Що таке відстань Хеллінгера і коли її використовувати?
Мені цікаво дізнатися, що насправді відбувається на відстані Хеллінгера (простими словами). Крім того, мені також цікаво знати, які існують проблеми, якими ми можемо скористатися Відстань Хеллінгера? Які переваги використання дистанції Hellinger?

3
Як виконати інженерію функцій на невідомих функціях?
Я беру участь у змаганнях з кагл. Набір даних має близько 100 функцій і всі невідомі (з точки зору того, що насправді вони представляють). В основному це просто цифри. Люди виконують багато інженерних можливостей щодо цих функцій. Мені цікаво, як саме можна вміти виконувати інженерну програму на невідомих функціях? Може …

3
Як генерувати синтетичний набір даних за допомогою моделі машинного навчання, засвоєної з оригінальним набором даних?
Взагалі модель машинного навчання побудована на наборах даних. Мені хотілося б знати, чи є який-небудь спосіб генерувати синтетичний набір даних за допомогою такої підготовленої моделі машинного навчання із збереженням оригінальних характеристик набору даних? [оригінальні дані -> побудувати модель машинного навчання -> використовувати модель ml для отримання синтетичних даних .... !!!] …

2
Категоризація тексту: поєднання різного роду ознак
Проблема, яку я вирішую, - класифікація коротких текстів на кілька класів. Мій сучасний підхід полягає у використанні зважених термінальних частот tf-idf та вивченні простого лінійного класифікатора (логістична регресія). Це працює досить добре (близько 90% макро F-1 на тестовому наборі, майже 100% на навчальному наборі). Великою проблемою є невидимі слова / …

4
Яку статистичну модель я повинен використовувати для аналізу ймовірності того, що одна подія вплинула на поздовжні дані
Я намагаюся знайти формулу, метод чи модель, яку б використати для аналізу ймовірності того, що конкретна подія вплинула на деякі поздовжні дані. Мені важко зрозуміти, що шукати в Google. Ось приклад сценарію: Image Ви є власником бізнесу, який щодня має в середньому 100 відвідувачів. Одного разу ви вирішите, що хочете …

2
Чому ReLU використовується як функція активації?
Функції активації використовуються для введення нелінійностей у лінійний вихід типу w * x + bв нейронній мережі. Який я здатний зрозуміти інтуїтивно для таких функцій активації, як сигмоїд. Я розумію переваги ReLU, яка уникає мертвих нейронів під час розмноження. Однак я не в змозі зрозуміти, чому ReLU використовується як функція …

1
Способи вирішення функції довготи / широти [закрито]
Закрито . Це питання потребує деталей або ясності . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Додайте деталі та уточніть проблему, відредагувавши цю публікацію . Закрито 3 роки тому . Я працюю над вигаданим набором даних з 25 функціями. Дві особливості - це широта та довгота місця, а інші …

1
Word2Vec проти Sentence2Vec проти Doc2Vec
Нещодавно я натрапив на терміни Word2Vec , Sentence2Vec і Doc2Vec, і я щось плутаю , оскільки я новачок у векторній семантиці. Чи може хтось, будь ласка, детально прояснити відмінності цих методів. Які найбільш підходящі завдання для кожного методу?


4
Коли можна використовувати відстань Манхеттена як протилежну евклідовій відстані?
Я намагаюся шукати хороший аргумент щодо того, чому можна використовувати відстань Манхеттена над евклідовою дистанцією в машинному навчанні. Найближча річ, яку я вважаю хорошим аргументом до цих пір, є на цій лекції MIT . О 36:15 на слайдах ви можете побачити таке твердження: "Зазвичай використовують евклідову метрику; Манхеттен може бути …

1
Як боротися зі строковими мітками в багатокласовій класифікації з керами?
Я новачок у машинному навчанні та керах, і зараз працюю над класовою проблемою класифікації зображень за допомогою керас. Вхід позначено тегом зображення. Після деякої попередньої обробки дані тренінгу представлені в списку Python як: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "собака", "кішка" та "птах" - це позначки класу. Я думаю, що для …

7
Як я можу передбачити трафік на основі даних попереднього часового ряду?
Якщо у мене є роздрібний магазин і є спосіб виміряти кількість людей, що заходять у мій магазин щохвилини, і позначити ці дані, як я можу передбачити майбутній рух пішки? Я вивчив алгоритми машинного навчання, але не впевнений, який саме використовувати. За моїми тестовими даними, річна тенденція за рік є більш …

2
місцеві мінімуми проти сідлових точок у глибокому навчанні
Я чув, як Ендрю Нг (у відео, якого я, на жаль, більше не можу знайти) розповів про те, як розуміння місцевих мінімумів у проблемах глибокого навчання змінилося в тому сенсі, що вони зараз вважаються менш проблематичними, оскільки у просторах з великими розмірами (зустрічаються в глибоке навчання) критичні точки, швидше, будуть …

4
Рольове похідне від сигмоподібної функції в нейронних мережах
Я намагаюся зрозуміти роль похідної сигмоїдної функції в нейронних мережах. Спочатку я будую сигмоподібну функцію та похідну всіх точок з визначення за допомогою python. Яка саме роль цієї похідної? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1 + np.exp(-x)) def derivative(x, step): return (sigmoid(x+step) …

2
Навіщо використовувати як набір перевірки, так і тестовий набір?
Розглянемо нейронну мережу: Для даного набору даних ми ділимо їх на навчальний, валідаційний та тестовий набір. Припустимо, ми робимо це в класичному співвідношенні 60:20:20, тоді ми запобігаємо надмірному встановленню, перевіряючи мережу, перевіряючи її на набір перевірки. Тоді яка необхідність перевірити його на тестовому наборі, щоб перевірити його працездатність? Чи не …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.