Запитання з тегом «computer-vision»

Питання, що стосуються представлення зображення, сегментації, категоризації візуальних об'єктів та алгоритмів обробки зображень загалом.

7
Довідки з нейронної мережі (підручники, онлайн-курси) для початківців
Я хочу вивчити нейронні мережі. Я - комп'ютерний лінгвіст. Я знаю підходи до статистичного машинного навчання і можу кодувати в Python. Я хочу почати з її концепцій, і знаю одну або дві популярні моделі, які можуть бути корисні з точки зору обчислювальної лінгвістики. Я переглянув Інтернет для ознайомлення і знайшов …

4
Що таке інваріантність перекладу в комп'ютерному зорі та конволюційній нейромережі?
У мене немає фону з комп’ютерним зором, але коли я читаю деякі статті та документи, пов'язані з обробкою зображень та конволюційними нейронними мережами, постійно стикаюся з терміном translation invariance, або translation invariant. Або я читаю багато, що забезпечує згортання translation invariance? !! що це означає? Я сам завжди перекладав це …

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
Чи можна надати зображення змінного розміру як вхід до згорткової нейронної мережі?
Чи можемо ми дати зображення із змінним розміром як вхід у згорнуту нейронну мережу для виявлення об'єктів? Якщо можливо, як це зробити? Але якщо ми спробуємо обрізати зображення, ми втратимо частину зображення, а якщо спробуємо змінити розмір, то чіткість зображення буде втрачена. Чи означає це, що використання властивості властивості мережі …

2
Що таке мінімізація енергії в машинному навчанні?
Я читав про оптимізацію недоброзичливої ​​проблеми в комп’ютерному зорі і натрапив на пояснення нижче щодо оптимізації у Вікіпедії. Я не розумію, чому вони називають цю оптимізацію " мінімізацією енергії " в "Комп'ютерному баченні"? Проблема оптимізації може бути представлена ​​наступним чином: Дано: функція від деякого набору A до реальних чиселf:A→Rf:A→Rf: A …

3
втрати шарніру проти логістичних збитків, переваги та недоліки / обмеження
Втрату шарніру можна визначити за допомогою а втрата журналу може бути визначена якмакс ( 0 , 1 - уiшТхi)макс(0,1-уiшТхi)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)журнал ( 1 + розд( - уiшТхi) )журнал(1+досвід⁡(-уiшТхi))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) У мене є такі питання: Чи є якісь недоліки втрати шарніру (наприклад, чутливі до виснажувачів, як зазначено в http://www.unc.edu/~yfliu/papers/rsvm.pdf )? Які …

1
Як зменшити кількість помилкових позитивних результатів?
Я намагаюся вирішити завдання, яке називається пішохідним виявленням, і треную двійковий клацифер на двох позитивних категоріях - люди, негативи - на тлі. У мене є набір даних: кількість позитивів = 3752 кількість від’ємника = 3800 Я використовую поїзд \ test split 80 \ 20% і RandomForestClassifier форму scikit-learn з параметрами: …

1
Як формувати криву точності нагадування, коли у мене є лише одне значення для PR?
У мене є завдання пошуку даних, де я створюю систему пошуку зображень на основі вмісту. У мене 20 зображень 5 тварин. Так загалом 100 зображень. Моя система повертає 10 найбільш релевантних зображень до вхідного зображення. Тепер мені потрібно оцінити працездатність моєї системи за допомогою кривої Precision-Recall. Однак я не розумію …

5
Яку функцію втрати слід використовувати для двійкового виявлення при виявленні обличчя / без обличчя в CNN?
Я хочу використовувати глибоке навчання для тренування бінарного виявлення обличчя / без обличчя, яку втрату я повинен використовувати, я думаю, що це SigmoidCrossEntropyLoss або Hinge-loss . Це правильно, але мені також цікаво, чи варто використовувати софтмакс, але лише з двома класами?

3
Чутливість до масштабної нейромережевої шкали
Для прикладу, припустимо, ми будуємо оцінку віку, грунтуючись на картині людини. Нижче у нас двоє людей у ​​костюмах, але перша явно молодша за другу. (джерело: tinytux.com ) Існує маса особливостей, які це натякають, наприклад, структура обличчя. Однак найбільш характерною особливістю є співвідношення розміру голови до розміру тіла : (джерело: wikimedia.org …

1
Навчання нейронної мережі згортки
Зараз я працюю над програмним забезпеченням для розпізнавання облич, яке використовує нейронні мережі згортки для розпізнавання облич. Спираючись на свої читання, я зрозумів, що звивиста нейронна мережа має загальну вагу, щоб заощадити час під час тренувань. Але як адаптувати зворотне розповсюдження, щоб його можна було використовувати в нейромережі згортки. Для …

2
Чи може згорткова нейронна мережа приймати як вхідні зображення різних розмірів?
Я працюю в мережі згортки для розпізнавання зображень, і мені було цікаво, чи можу я вводити зображення різного розміру (хоча не дуже різного). Про цей проект: https://github.com/harvardnlp/im2markup Вони кажуть: and group images of similar sizes to facilitate batching Тож навіть після попередньої обробки зображення все ще мають різні розміри, що …

1
Як визначити кількість згорткових операторів у CNN?
У завданні комп’ютерного зору, такому як класифікація об'єктів, за допомогою Convolutional Neural Networks (CNN), мережа забезпечує привабливу продуктивність. Але я не впевнений, як налаштувати параметри в згорткових шарах. Наприклад, зображення сірого масштабу ( 480x480), перший згортковий шар може використовувати конволюційний оператор типу 11x11x10, де число 10 означає кількість згорткових операторів. …

2
Якір швидше RCNN
У роботі "Швидше RCNN", коли йдеться про анкерування, що вони означають, використовуючи "піраміди посилальних коробок" і як це робиться? Чи це просто означає, що в кожній з анкерних точок W * H * k формується обмежувальне поле? Де W = ширина, H = висота і k = кількість співвідношень сторін …

3
Як класифікувати незбалансований набір даних за допомогою конволюційних нейронних мереж (CNN)?
У мене є незбалансований набір даних у задачі бінарної класифікації, де сума позитивів проти негативів становить 0,3% проти 99,7%. Розрив між позитивом і негативом величезний. Коли я треную CNN зі структурою, що використовується в проблемі MNIST, результат тестування показує високий показник помилкових негативних значень. Також крива помилок тренінгу швидко спадає …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.