Запитання з тегом «machine-learning»

Алгоритми машинного навчання будують модель навчальних даних. Термін «машинне навчання» нечітко визначений; вона включає те, що також називається статистичним навчанням, підкріпленням навчання, непідвладним навчанням і т. д. ВЖЕ ДОДАЙТЕ БІЛЬШЕ СПЕЦИФІЧНУ МЕТОДУ.

11
Яка різниця між тестовим набором і набором валідації?
Я вважав це заплутаним, коли використовую панель інструментів нейронної мережі в Matlab. Він розділив набір необроблених даних на три частини: навчальний набір набір перевірки тестовий набір Я помічаю в багатьох алгоритмах навчання або навчання, дані часто діляться на 2 частини, навчальний набір і тестовий набір. Мої запитання: Яка різниця між …

20
Дві культури: статистика проти машинного навчання?
Минулого року я прочитав допис у блозі від Брендана О'Коннора під назвою "Статистика проти машинного навчання, боріться!" які обговорювали деякі відмінності між двома полями. Ендрю Гельман відповів на це позитивно : Саймон Бломберг: З пакету статей R: Якщо перефразовувати провокаційно, "машинне навчання - це статистика за вирахуванням будь-якої перевірки моделей …

5
Як зрозуміти недоліки К-засобів
K-засоби - це широко застосовуваний метод кластерного аналізу. Наскільки я розумію, цей метод НЕ вимагає жодних припущень, тобто дайте мені набір даних та заздалегідь задане число кластерів, k, і я просто застосую цей алгоритм, який мінімізує суму помилок у квадраті (SSE), кластер всередині кластеру помилка. Тож k-засоби є по суті …


8
Чому евклідова відстань не є хорошою метрикою у великих розмірах?
Я читав, що «Евклідова відстань - це не дуже добра відстань у великих розмірах». Я думаю, це твердження має щось спільне з прокляттям розмірності, але що саме? Крім того, що таке "високі розміри"? Я застосовував ієрархічну кластеризацію за допомогою евклідової відстані зі 100 ознаками. На скільки функцій безпечно використовувати цей …

12
Яка різниця між обробкою даних, статистикою, машинним навчанням та ШІ?
Яка різниця між обробкою даних, статистикою, машинним навчанням та ШІ? Чи було б точно сказати, що це 4 поля, які намагаються вирішити дуже схожі проблеми, але з різними підходами? Що саме вони мають спільне і чим вони відрізняються? Якщо між ними існує якась ієрархія, що це було б? Подібні запитання …

3
Як дізнатися, що проблема з машинним навчанням безперспективна?
Уявіть стандартний сценарій машинного навчання: Ви стикаєтесь з великим багатофакторним набором даних і маєте досить розмите розуміння цього. Що вам потрібно зробити, це зробити передбачення щодо якоїсь змінної на основі того, що у вас є. Як завжди, ви очищаєте дані, переглядаєте описову статистику, запускаєте деякі моделі, перехресне підтверджуєте їх тощо, …

4
Що обчислює прихований шар у нейронній мережі?
Я впевнений, що багато людей відгукнуться посиланнями на тему "дозвольте мені погуглювати це для вас", тому я хочу сказати, що я намагався розібратися в цьому, тож, пробачте, пробачте моє нерозуміння тут, але я не можу зрозуміти, як практична реалізація нейронної мережі насправді працює. Я розумію вхідний шар і як нормалізувати …

9
Чому раптове захоплення тензорами?
Останнім часом я помічав, що багато людей розробляють тензорні еквіваленти багатьох методів (тензорна факторизація, тензорні ядра, тензори для моделювання тем тощо) Мене цікавить, чому світ раптом захоплюється тензорами? Чи є нещодавні статті, які є особливо дивними, що призвели до цього? Це обчислювально набагато дешевше, ніж раніше підозрювали? Я не буду …

3
Криві ROC vs точності та відкликання
Я розумію формальні відмінності між ними, що я хочу знати, коли важливіше використовувати одне проти іншого. Чи завжди вони забезпечують додаткове розуміння продуктивності даної системи класифікації / виявлення? Коли розумно надати їх обом, скажімо, в папері? замість лише одного? Чи існують альтернативні (можливо, більш сучасні) дескриптори, які відображають відповідні аспекти …

2
Генеративні та дискримінаційні
Я знаю, що генеративні засоби "засновані на П( х , у)П(х,у)P(x,y) ", а дискримінаційні засоби "засновані на П( у| х)П(у|х)P(y|x) ", але я плутаюся в декількох моментах: Вікіпедія (+ багато інших звернень до Інтернету) класифікує такі речі, як SVM та дерева рішень, як дискримінаційні. Але вони навіть не мають ймовірнісних …

6
Які переваги ReLU над сигмоподібною функцією в глибоких нейронних мережах?
Найсучаснішою нелінійністю є використання випрямлених лінійних одиниць (ReLU) замість сигмоподібної функції в глибокій нейронній мережі. Які переваги? Я знаю, що навчання мережі, коли використовується ReLU, було б швидше, і це більш біологічно натхненно, які інші переваги? (Тобто, якісь недоліки використання сигмоїди)?

5
Навчання з повним набором даних після перехресної перевірки?
Чи завжди хороша ідея тренуватися з повним набором даних після перехресної перевірки ? Інакше кажучи, чи нормально тренуватися з усіма зразками в моєму наборі даних і не можете перевірити, чи відповідає саме цей примір ? Деякі відомості про проблему: Скажіть, у мене є сімейство моделей, параметризованих . Скажіть також, що …

4
Вибір K у K-кратній перехресній валідації
Я використовую в кратної перехресної перевірки кілька разів зараз , щоб оцінити продуктивність деяких алгоритмів навчання, але я завжди був спантеличений про те , як я повинен вибрати значення .КKKKKKK Я часто бачив і використовував значення , але це здається мені абсолютно довільним, і тепер я просто використовую за звичкою, …

7
Який вплив С у SVM з лінійним ядром?
Зараз я використовую SVM з лінійним ядром для класифікації моїх даних. На навчальному наборі помилок немає. Я спробував кілька значень параметра ( 10 - 5 , … , 10 2 ). Це не змінило помилки на тестовому наборі.СCC10- 5, … , 10210−5,…,10210^{-5}, \dots, 10^2 Тепер мені цікаво: чи це помилка, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.