Запитання з тегом «machine-learning»

Методи та принципи побудови "комп'ютерних систем, які автоматично вдосконалюються з досвідом".

2
Скільки часу займає класифікатор scikit для класифікації?
Я планую використовувати класифікатор лінійної підтримуючої машини scikit (SVM) для класифікації тексту на корпусі, що складається з 1 мільйона мічених документів. Що я планую зробити, це коли користувач вводить якесь ключове слово, класифікатор спочатку класифікує його до категорії, а потім подається запит на отримання інформації в документах цієї категорії категорії. …

2
Налагодження нейронних мереж
Я створив штучну нейронну мережу в python, використовуючи функцію оптимізації scipy.optimize.minimize (Conjugate gradient). Я здійснив перевірку градієнта, двічі перевірив все тощо, і я впевнений, що він працює правильно. Я запускав його кілька разів, і він досягає "Оптимізація успішно припиняється", але коли я збільшую кількість прихованих шарів, вартість гіпотези збільшується (все …

2
які методи машинного / глибокого навчання / nlp використовуються для класифікації певних слів як імені, мобільного номера, адреси, електронної пошти, штату, округу, міста тощо
Я намагаюся створити інтелектуальну модель, яка може сканувати набір слів або рядків і класифікувати їх як імена, мобільні номери, адреси, міста, штати, країни та інші об'єкти за допомогою машинного навчання або глибокого навчання. Я шукав підходи, але, на жаль, не знайшов жодного підходу. Я намагався вбудовувати мішок із слів моделі …

1
Збалансовані дані, що спричиняють неправильну класифікацію на множині набору даних
Я працюю над класифікацією тексту, де маю 39 категорій / класів та 8,5 мільйонів записів. (У майбутньому дані та категорії будуть збільшуватися). Структура або формат моїх даних наступний. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary …

2
Який алгоритм застосувати для вибору потрібної точки
На малюнку нижче показано 7 пунктів навколо початку. Один з них був обраний людиною на основі правил та досвіду і пофарбований у червоний колір (той у нижньому лівому квадранті). Зараз у нас є понад 1000 цих наборів точок, і для кожного набору людина вибрала одну точку. Ці умови стосуються всіх …

2
«Теорема глибокого Нітера»: побудова обмежень симетрії
Якщо у мене є проблема навчання, яка повинна мати властиву симетрію, чи є спосіб піддати мою проблему навчання обмеженням симетрії для покращення навчання? Наприклад, якщо я роблю розпізнавання зображень, я, можливо, захочу 2D обертальну симетрію. Це означає, що повернута версія зображення повинна мати такий же результат, як і оригінал. Або …

1
Як підходити до проблеми класифікації, коли один із класів визначається "не будь-яким з інших"
Припустимо, мене цікавлять три класи c1c1c_1, c2c2c_2, c3c3c_3. Але мій набір даних насправді містить ще кілька реальних класів(cj)nj=4(cj)j=4n(c_j)_{j=4}^n. Очевидною відповіддю є визначення нового класу c^4c^4\hat c_4 що стосується всіх класів cjcjc_j, j>3j>3j>3 але я підозрюю, що це не гарна ідея, оскільки зразки в c^4c^4\hat c_4 будуть рідкісними і не дуже …

3
Чому б не тренувати кінцеву модель на всіх даних після проведення даних тестування на основі базової настройки гіперпараметрії та даних перевірки вибору моделі?
Під усіма даними я маю на увазі поїзд + тест + перевірка Після того, як я зафіксував свій гіперпараметр за допомогою даних валідації та обрав модель за допомогою тестових даних, чи не краще буде модель тренуватися за всіма даними, щоб параметри були краще навчені, а не модель була навчена тільки …

1
кількість параметрів для шарів згортки
У цій високо цитованій роботі автори дають наступне обговорення щодо кількості вагових параметрів. Мені не дуже зрозуміло, чому він має параметри . Я думаю, що це має бути оскільки кожен із вхідних каналів має той же фільтр, у якого є параметрів.49С249C249C^249 С49C49CСCC494949

3
Навіщо використовувати згорнуті NN для завдання візуального огляду над класичним узгодженням шаблону CV?
У мене була цікава дискусія на основі проекту, над яким ми працювали: навіщо використовувати систему візуального огляду CNN над алгоритмом відповідності шаблонів? Передумови: я показав демонстрацію простої системи бачення CNN (веб-камера + ноутбук), яка виявила, чи певний тип об'єкта був "зламаний" / несправний чи ні - в цьому випадку плати …

4
Інтерпретація дерева рішень у контексті імпортних ознак
Я намагаюся зрозуміти, як повністю зрозуміти процес прийняття рішення щодо моделі класифікації дерева рішень, побудованої за допомогою sklearn. 2 головних аспекту, на які я дивлюся, - це графічне зображення дерева та перелік імпортів функцій. Я не розумію, як визначається важливість функції в контексті дерева. Наприклад, ось мій список імпортів функцій: …

2
Чому швидкість навчання призводить до того, що вага моєї нейронної мережі зростає?
Я використовую tensorflow для написання простих нейронних мереж для невеликих досліджень, і у мене було багато проблем з «нанними» вагами під час тренування. Я спробував багато різних рішень, таких як зміна оптимізатора, зміна втрат, розмір даних тощо, але безрезультатно. Нарешті, я помітив, що зміна рівня навчання внесла неймовірну зміну у …

2
Особливості слово векторів у word2vec
Я намагаюся зробити аналіз настроїв. Для перетворення слів у слова вектори я використовую модель word2vec. Припустимо, у мене є всі речення у списку з назвою "речення", і я передаю ці речення word2vec наступним чином: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Оскільки я є нобієм слова векторів, у …

1
Як підійти до змагань numer.ai з анонімними масштабованими чисельними предикторами?
Numer.ai вже деякий час існує, і, як видається, в Інтернеті є лише кілька публікацій чи інших дискусій про це. Система час від часу змінювалася, і сьогодні налаштування таке: дані поїзду (N = 96K) і тестування (N = 33K) з 21 ознаками з безперервними значеннями в [0,1] і двійковою ціллю. Дані …

3
Який рекомендаційний механізм для ситуації, коли користувачі можуть бачити лише частину всіх елементів?
Я хочу додати рекомендаційну функцію до системи управління документами . Це сервер, на якому зберігається більшість документів компанії. Співробітники переглядають веб-інтерфейс і натискають, щоб завантажити (або прочитати в Інтернеті) потрібні документи. Кожен працівник має лише доступ до підмножини всіх документів: Моя мета : рекомендувати працівникові документи, які нещодавно відкрили їхні …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.