Запитання з тегом «computer-vision»

Computer Vision - це підполе інформатики, яке займається аналізом та розумінням зображень. Сюди входить виявлення таких об’єктів, як обличчя на зображеннях або сегментування зображень.

2
Як обчислити mAP для завдання виявлення для виклику PASCAL VOC?
Як обчислити mAP (середню середню точність) для завдання виявлення для лідерів Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Там сказано - на сторінці 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Середня точність (AP). Для виклику VOC2007 була використана інтерпольована середня точність (Salton and Mcgill 1986) для оцінки як класифікації, так і виявлення. Для заданого завдання та класу крива …

4
Чим відрізняється Inception v2 від Inception v3?
У статті, що заглиблюється глибше, згортається опис GoogleNet, який містить оригінальні модулі створення: Зміна початкової версії v2 полягала в тому, що вони замінили згортки 5x5 двома послідовними згортками 3x3 та застосували об'єднання: Чим відрізняється Inception v2 від Inception v3?

3
Що означає позначення mAP @ [. 5: .95]?
Для виявлення загальним способом визначення правильності однієї об’єктної пропозиції є Перетин над Союзом (IoU, IU). Для цього береться набір запропонованих пікселів об'єкта та набір справжніх пікселів об'єкта B і обчислюється:ААAББB Яo U( A , B ) = A ∩ BA ∪ BЯоU(А,Б)=А∩БА∪БIoU(A, B) = \frac{A \cap B}{A \cup B} Як …

3
Чому згортки завжди використовують непарні числа як filter_size
Якщо ми розглянемо 90-99% паперів, опублікованих за допомогою CNN (ConvNet). Переважна більшість із них використовує непарні номери фільтрів : {1, 3, 5, 7} для найбільш використовуваних. Ця ситуація може призвести до певної проблеми: За таких розмірів фільтрів, як правило, операція згортання не є ідеальною, якщо прокладка 2 (звичайна прокладка), а …

3
Чи є якісні нестандартні мовні моделі для python?
Я прототипую додаток, і мені потрібна мовна модель, щоб обчислити здивування в деяких створених пропозиціях. Чи є якась навчена мовна модель в python, яку я можу легко використовувати? Щось на кшталт простого model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
Яка різниця між розведеною згорткою і деконволюцією?
Ці дві згорткові операції зараз дуже поширені в глибокому навчанні. Про розширений згортковий шар я читав у цій статті: WAVENET: ЗАГАЛЬНА МОДЕЛЬ ДЛЯ RAW AUDIO і Деконволюція знаходиться в цій статті: Повністю згорткові мережі для семантичної сегментації Як здається, обидва знімають зображення, але в чому різниця?

5
Непідконтрольна сегментація зображень
Я намагаюся реалізувати алгоритм, коли задано зображення з декількома об'єктами на площинній таблиці, бажаним є вихід масок сегментації для кожного об’єкта. На відміну від CNN, мета тут - виявити об'єкти в незнайомому середовищі. Які найкращі підходи до цієї проблеми? Також чи доступні приклади реалізації в Інтернеті? Редагувати: Вибачте, питання може …

2
Як я можу виявити, чи було фотографії фотошоп?
Я хотів би перевірити JPG-файли, чи маніпулювали ними для зміни вмісту. Що я вважаю НЕ фотошопом: Обрізання Обертовий (Масштабування) Роздільна здатність зображення Автоматичні зміни можуть робити смартфони Що я вважаю фотошопом: Додавання нового зображення поверх частин старого зображення Зміна тексту частини зображення Як це можна автоматично перевірити? (І чи є …

1
кількість параметрів для шарів згортки
У цій високо цитованій роботі автори дають наступне обговорення щодо кількості вагових параметрів. Мені не дуже зрозуміло, чому він має параметри . Я думаю, що це має бути оскільки кожен із вхідних каналів має той же фільтр, у якого є параметрів.49С249C249C^249 С49C49CСCC494949

2
Чи є дослідження, які досліджують випадання від інших регуляризацій?
Чи опубліковані будь-які статті, які показують відмінності методів регуляризації для нейронних мереж, бажано для різних доменів (або принаймні різних наборів даних)? Я запитую, тому що в даний час я відчуваю, що більшість людей, здається, використовують лише випадання для регуляризації в комп’ютерному зорі. Я хотів би перевірити, чи не було б …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.