Запитання з тегом «machine-learning»

Методи та принципи побудови "комп'ютерних систем, які автоматично вдосконалюються з досвідом".

8
Кластеризація географічних координат (lat, довгі пари)
Який правильний підхід та алгоритм кластеризації для кластеризації геолокацій? Я використовую наступний код для кластеризації геолокаційних координат: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], coordinates[:,1], …

8
Чому перевиконання погано в машинному навчанні?
Логіка часто стверджує, що, якщо переозброювати модель, її здатність до узагальнення обмежена, хоча це може означати лише, що перевиконання зупиняє вдосконалення моделі після певної складності. Чи надмірне обладнання спричиняє погіршення моделей незалежно від складності даних, і якщо так, то чому це так? Пов’язане: Продовження вищезазначеного питання " Коли модель недостатньо …

4
Нейронні мережі: яку функцію витрат використовувати?
Я використовую TensorFlow для експериментів з нейронними мережами. Хоча зараз я провів досить багато експериментів (XOR-Problem, MNIST, деякі регресії, ...), я борюся з вибором "правильної" функції витрат для конкретних проблем, тому що в цілому мене можна вважати початківцем. Перед тим, як прийти до TensorFlow, я самостійно зашифрував декілька повністю пов'язаних …

9
Чи є домен, де Bayesian Networks перевершує нейронні мережі?
Нейронні мережі отримують найкращі результати у завданнях Computer Vision (див. MNIST , ILSVRC , Kaggle Galaxy Challenge ). Вони, схоже, перевершують будь-який інший підхід у програмі Computer Vision. Але є й інші завдання: Виклик виклику молекулярної активності Регресія: прогноз дощів Kaggle , також 2-е місце Захоплення та підйом 2-го також …

5
Чи варто шукати набір даних "збалансований" або "представник"?
Моє завдання «машинного навчання» - відокремити доброякісний Інтернет-трафік від шкідливого трафіку. У реальному сценарії більшість (скажімо, 90% або більше) Інтернет-трафіку є доброякісними. Таким чином, я відчув, що мені слід вибрати подібний параметр даних і для навчання моїх моделей. Але я натрапив на дослідницький документ або два (в моєму районі роботи), …

10
Машинне навчання - функціонує інженерія з даних дати / часу
Які спільні / найкращі практики для обробки даних про час застосування машинного навчання? Наприклад, якщо в наборі даних є стовпець із часовою позначкою події, наприклад "2014-05-05", як ви можете витягти корисні функції з цього стовпця, якщо такі є? Спасибі заздалегідь!

4
Додавання функцій до моделі часових рядів LSTM
читав трохи про LSTM та їх використання для часових рядів, і це було цікаво, але важко водночас. Одне, що у мене виникли труднощі з розумінням, - це підхід до додавання додаткових функцій до того, що вже є переліком функцій часових рядів. Припустимо, що у вас є такий набір даних так: …

4
Чому розмір міні-партії краще, ніж одна «партія» з усіма навчальними даними?
Я часто читаю, що для моделей Deep Learning звичайною практикою є застосування міні-партій (як правило, невеликих, 32/64) протягом кількох навчальних епох. Я не можу зрозуміти причину цього. Якщо я не помиляюся, розмір партії - це кількість екземплярів тренувань, які модель бачила під час ітерації тренувань; і епоха - це повна …

10
Чому моделі машинного навчання називають чорними скриньками?
Я читав цю публікацію в блозі під назвою: Фінансовий світ хоче відкрити чорні скриньки AI , де автор неодноразово називає моделі ML як "чорні скриньки". Подібна термінологія була використана в декількох місцях при посиланні на моделі ML. Чому так? Це не так, як інженери ML не знають, що відбувається всередині …

10
Чи можуть алгоритми машинного навчання прогнозувати спортивні бали чи ігри?
У мене є безліч наборів даних NFL, які, на мою думку, можуть стати гарним побічним проектом, але я з ними ще нічого не робив. Заходжу на цей сайт, змусив мене подумати про алгоритми машинного навчання, і мені цікаво, наскільки вони хороші при прогнозуванні результатів футбольних ігор або навіть наступної гри. …

11
Наука даних в C (або C ++)
Я Rмовний програміст. Я також в групі людей, яких вважають науковцями даних, але які виходять з наукових дисциплін, відмінних від CS. Це добре справляється з моєю роллю вченого даних, однак, розпочинаючи свою кар’єру Rі маючи лише базові знання інших сценаріїв / веб-мов, я почувався дещо неадекватним у двох ключових сферах: …

5
ГБМ проти XGBOOST? Ключові відмінності?
Я намагаюся зрозуміти ключові відмінності між GBM та XGBOOST. Я спробував google це, але не міг знайти жодних хороших відповідей, що пояснювали б відмінності між двома алгоритмами та чому xgboost майже завжди працює краще, ніж GBM. Що робить XGBOOST настільки швидким?

3
Коли використовувати що - машинне навчання [закрито]
Нещодавно в класі машинного навчання від професора Оріола Пухоля з UPC / Барселона він описав найпоширеніші алгоритми, принципи та концепції, які слід використовувати для широкого кола завдань, пов'язаних з машинним навчанням. Ось я поділюсь ними з вами і прошу вас: чи є якась комплексна рамка, яка відповідає завданням підходів або …

2
Як інтерпретувати висновок важливості XGBoost?
Я керував моделлю xgboost. Я точно не знаю, як інтерпретувати результат xgb.importance. Яке значення посилення, покриття та частоти і як їх інтерпретувати? Крім того, що означає Split, RealCover та RealCover%? У мене є деякі додаткові параметри тут Чи є якісь інші параметри, які можуть розповісти мені більше про імпорт функцій? …

13
Наука даних, пов’язаних із смішними цитатами
Користувачі різних спільнот звикли цитувати смішні речі про свої поля. Можливо, буде цікаво ділитися своїми смішними речами про машинне навчання, глибоке навчання, наукові дані та речі, з якими ви стикаєтеся щодня!

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.