Запитання з тегом «algorithms»

Алгоритм - це сукупність одного або декількох обчислень, які дадуть розрахунковий результат. Усі методи статистики є алгоритмами. Алгоритми можуть бути простими, такими як обчислення відсотків, або можуть бути дуже складними і вимагати від комп'ютера швидких і точних результатів.

5
Коли модель недостатня?
Логіка часто стверджує, що, якщо не вистачає моделі, її здатність до узагальнення збільшується. Однак, очевидно, що в якийсь момент недостатність моделі призводить до погіршення моделей незалежно від складності даних. Звідки ви знаєте, коли ваша модель досягла правильного балансу і не відповідає недостатнім даним, який вона намагається моделювати? Примітка. Це відповідь …

5
ГБМ проти XGBOOST? Ключові відмінності?
Я намагаюся зрозуміти ключові відмінності між GBM та XGBOOST. Я спробував google це, але не міг знайти жодних хороших відповідей, що пояснювали б відмінності між двома алгоритмами та чому xgboost майже завжди працює краще, ніж GBM. Що робить XGBOOST настільки швидким?

3
Коли використовувати що - машинне навчання [закрито]
Нещодавно в класі машинного навчання від професора Оріола Пухоля з UPC / Барселона він описав найпоширеніші алгоритми, принципи та концепції, які слід використовувати для широкого кола завдань, пов'язаних з машинним навчанням. Ось я поділюсь ними з вами і прошу вас: чи є якась комплексна рамка, яка відповідає завданням підходів або …

5
Чи є алгоритми дерева рішень лінійними чи нелінійними
Нещодавно в інтерв'ю мого друга запитали, чи алгоритми дерева рішень є лінійними чи нелінійними. Я намагався шукати відповіді на це питання, але не зміг знайти жодного задовільного пояснення. Чи може хтось відповісти та пояснити рішення цього питання? Також які ще є приклади нелінійних алгоритмів машинного навчання?

3
Як масштабувати розробку алгоритму?
Працюючи над аналітичним аналізом даних та розробкою алгоритмів, я знаходжу, що більшу частину свого часу я проводжу в циклі візуалізації, записую якийсь код, працює за невеликим набором даних, повторюю. Дані, які я маю, зазвичай є типом злиття з комп'ютерним зором / сенсором, а алгоритми важкі для зору (наприклад, виявлення та …
18 algorithms 

4
Кластеризація на основі балів подібності
Припустимо, що ми маємо набір елементів E і подібність ( не відстань ) функції sim (ei, ej) між двома елементами ei, ej ∈ E . Як ми могли (ефективно) кластеризувати елементи E , використовуючи sim ? k- значить, наприклад, вимагає заданого k , для кластеризації Canopy потрібно два порогових значення. …

1
Алгоритми кластеризації тексту
У мене є проблема об’єднання величезної кількості речень у групи за їх значеннями. Це схоже на проблему, коли у вас є багато речень і хочете згрупувати їх за значеннями. Які алгоритми пропонуються для цього? Я не знаю кількість кластерів заздалегідь (а оскільки надходить більше даних, кластери також можуть змінюватися), які …

2
Відмінність рекомендацій, що базуються на предметах та користувачах у Mahout
Мені хотілося б знати, чим саме рекомендації Mahout, що базуються на користувача та на основі предметів, відрізняються один від одного. Це визначає це На основі користувачів : рекомендуйте елементи, знайшовши подібних користувачів. Це часто важче масштабувати через динамічний характер користувачів. На основі предметів: обчисліть схожість між елементами та дайте рекомендації. …

2
K-засоби проти онлайн-K-засоби
K-засоби - це добре відомий алгоритм кластеризації, але існує також он-лайн варіант такого алгоритму (онлайн-K-засоби). Які плюси і мінуси цих підходів і коли слід віддавати перевагу кожному?

2
Ефективний алгоритм для обчислення кривої ROC для класифікатора, що складається з ансамблю роз'єднаних класифікаторів
Припустимо, у мене є класифікатори C_1 ... C_n, які не роз'єднуються в тому сенсі, що жодне двоє не поверне істину на одному вході (наприклад, вузли в дереві рішення). Я хочу створити новий класифікатор, який є об'єднанням якогось підмножини (наприклад, я хочу визначити, які листя дерева рішень даватимуть позитивну класифікацію). Звичайно, …
13 algorithms 

1
У чому різниця між глобальними та універсальними методами стиснення?
Я розумію, що методи стиснення можуть бути розділені на два основні набори: глобальний місцеві Перший набір працює незалежно від даних, що обробляються, тобто вони не покладаються на будь-які характеристики даних і, таким чином, не потребують жодної попередньої обробки на будь-якій частині набору даних (перед самим стисненням). З іншого боку, місцеві …

1
Як визначити, чи послідовність символів - це англійське слово або шум
Які функції ви спробуєте витягнути зі списку слів для майбутнього передбачення, чи це існуюче слово чи просто безлад символів? Опис завдання, який я там знайшов . Ви повинні написати програму, яка зможе відповісти, чи є слово англійською. Це буде просто - вам просто потрібно буде пошукати слово в словнику - …

1
Координатний спуск Fisher Scoring v / s для MLE в R
Основна функція R glm()використовує Fisher Scoring для MLE, тоді як, glmnetсхоже, використовується метод спуску координат для вирішення того ж рівняння. Координатний спуск є більш ефективним за часом, ніж Fisher Scoring, оскільки Fisher Scoring обчислює похідну матрицю другого порядку, окрім деяких інших операцій з матрицею. що робить дорогим виконання, тоді як …

2
Розв’язування системи рівнянь із розрідженими даними
Я намагаюся вирішити набір рівнянь, який має 40 незалежних змінних (x1, ..., x40) та одну залежну змінну (y). Загальна кількість рівнянь (кількість рядків) становить ~ 300, і я хочу вирішити для набору 40 коефіцієнтів, що мінімізує загальну помилку суми квадрата між y та передбачуваним значенням. Моя проблема полягає в тому, …

4
Чи справді логістична регресія є алгоритмом регресії?
Звичайне визначення регресії (наскільки мені відомо) передбачає безперервну змінну виводу з заданого набору вхідних змінних . Логістична регресія - це алгоритм бінарної класифікації, тому він дає категоричний вихід. Це справді алгоритм регресії? Якщо так, то чому?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.