Запитання з тегом «sparse»

Рідка матриця - це матриця, де багато елементів - нулі. Тег також може бути використаний для поодинокості в інших контекстах, таких як регресійні моделі з рідкістю або принцип "ставка на рідкість".

7
Евклідова відстань, як правило, не корисна для розріджених даних?
Десь я бачив, що класичні відстані (наприклад, евклідова відстань) стають слабко дискримінантними, коли ми маємо багатовимірні та розріджені дані. Чому? Чи є у вас приклад двох розріджених векторів даних, де евклідова відстань не працює добре? У цьому випадку яку подібність ми повинні використати?

3
Наскільки саме рідкий PCA кращий за PCA?
Я дізнався про PCA кілька лекцій тому на уроці, і, переконуючись більше про цю захоплюючу концепцію, я дізнався про рідкісний PCA. Мені хотілося запитати, чи не помиляюсь, це таке рідкісне PCA: У PCA, якщо у вас є точок даних із змінними, ви можете представляти кожну точку даних у розмірному просторі …

4
Чи є реалізація Random Forest, яка добре працює з дуже рідкими даними?
Чи є R випадкова реалізація лісу, яка добре працює з дуже рідкими даними? У мене є тисячі або мільйони булевих вхідних змінних, але лише сотні або близько того будуть ПРАВИЛЬНИми для будь-якого прикладу. Я відносно новий в R і помітив, що існує пакет "Матриця" для роботи з розрідженими даними, але …

1
Різниця між відсутніми даними та розрідженими даними в алгоритмах машинного навчання
Які основні відмінності між розрідженими даними та відсутніми даними? І як це впливає на машинне навчання? Більш конкретно, який вплив мають рідкісні та відсутні дані на алгоритми класифікації та тип регресії (прогнозування чисел) алгоритмів. Я говорю про ситуацію, коли відсоток відсутніх даних є значним, і ми не можемо скинути рядки, …

1
Алгоритми кластеризації, які працюють на розріджених матрицях даних [закрито]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 5 років тому . Я намагаюся скласти список алгоритмів кластеризації, які є: Реалізовано в R Оперуйте над матричними матрицями даних (не (не) матрицями подібності), такими, які …
18 r  clustering  sparse 

4
Норми
норма є унікальною (принаймні частково) , тому що знаходиться на кордоні між неопуклі і опуклі. норма є «найбільш розрідженим» опукла норма (правда?). p = 1 L 1L1L1L_1p=1p=1p=1L1L1L_1 Я розумію, що норма Евкліда має коріння в геометрії, і вона має чітку інтерпретацію, коли розміри мають однакові одиниці. Але я не розумію, …

1
Чи несприятливий набір тренувань негативно впливає на SVM?
Я намагаюся класифікувати повідомлення на різні категорії за допомогою SVM. Я склав список бажаних слів / символів із навчального набору. Для кожного вектора, який представляє повідомлення, я встановлюю відповідний рядок, 1якщо слово є таким: "корпус" є: [Мері, маленький, баранина, зірка, мерехтіння] перше повідомлення: "у Мері було трохи ягняти" -> [1 …

1
Що таке норми і наскільки вони мають відношення до регуляризації?
Останнім часом я бачу багато робіт про розріджене уявлення, і більшість із них використовують норму і роблять деяку мінімізацію. Моє запитання: що є норма , а змішаною нормою? І наскільки вони мають відношення до регуляризації?ℓ p ℓ p , qℓpℓp\ell_pℓpℓp\ell_pℓp,qℓp,q\ell_{p, q} Дякую

1
Чи можливий масштабний PCA?
Класичний аналіз основного компонента (PCA) - це зробити на матриці вхідних даних, стовпці якої мають нульове середнє значення (тоді PCA може "максимізувати дисперсію"). Цього можна легко досягти шляхом центрування стовпців. Однак, коли вхідна матриця буде рідкою, централізована матриця тепер буде більш рідкою, і - якщо матриця дуже велика - таким …

1
Як я можу включити інноваційний зовнішній вигляд під спостереження 48 у свою модель ARIMA?
Я працюю над набором даних. Після використання деяких методів ідентифікації моделі я вийшов із моделлю ARIMA (0,2,1). Я використав detectIOфункцію в пакеті TSAв R, щоб виявити інноваційний зовнішній вигляд (IO) під час 48-го спостереження за моїм оригінальним набором даних. Як я включу цей зовнішній вигляд у свою модель, щоб я …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

4
Регуляризація спорідненості для стохастичних матриць
Загальновідомо (наприклад, в області стиснення зондування), що норма є "спорідненою", в тому сенсі, що якщо ми мінімізуємо функціональний (для нерухомої матриці і вектора ) для досить великих \ lambda> 0 , ми, мабуть, для багатьох варіантів A , \ vec {b} і \ lambda буде мати багато точно нульових записів …

2
Створіть симетричну позитивну певну матрицю із заздалегідь заданим малюнком обмеженості
Я намагаюся генерувати кореляційну матрицю (симетричний psd) із заздалегідь заданою структурою sparsity (заданою графіком на вузлах). Вузли, які з'єднані на графіку, мають кореляцію , решта всі - 0, а діагональ - 1.p×pp×pp\times ppppρ∼U(0,1)ρ∼U(0,1)\rho \sim U(0,1) Я кілька разів намагався створити цю матрицю, але лише рідко отримую дійсну кореляційну матрицю. Чи …

1
Яких вказівок слід дотримуватися для використання Нейронних мереж із рідким входом
У мене дуже рідкісні входи, наприклад, розташування певних функцій у вхідному зображенні. Далі кожна функція може мати декілька детектувань (не впевнений, чи це матиме відношення до дизайну системи). Це я буду представляти як «двійкове зображення» каналу k із пікселями ON, що представляють наявність цієї функції, і навпаки. Ми можемо бачити, …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.