Що таке перекомпонування Lanczos?
Хоча теорія описана в першій статті та статті у Вікіпедії , «відчуття» методів перекомпонування найкраще отримувати шляхом обчислення їх на простих або стандартних зображеннях. Це може бути обширною темою, що вимагає широких експериментів, але деякі спрощення доступні:
Ці оператори працюють окремо в кожному кольоровому каналі. Тому досить вивчити, як вони працюють на однотонний («чорно-білий») образ.
Більшість операторів згортання, які використовуються при обробці зображень, працюють однаково в напрямку x і y і незалежно в обох напрямках. Насправді вони справді одновимірні оператори, застосовані спочатку до рядків, а потім до стовпців. Це означає, що ми можемо вивчити їх, вивчаючи зображення "1D", які можна детально побудувати.
Все, що нам потрібно знати про лінійний оператор (який включає всі оператори згортки), можна зробити висновок про те, як оператор працює над найпростішим непостійним зображенням з усіх: це раптовий перехід від одного значення до іншого.
Давайте розглянемо ілюстрацію декількох популярних методів перекомпонування. Насправді нам потрібні дві ілюстрації: одна, щоб показати те, що відбувається в «знижувальному стані», де новий образ грубіший за старий, а інша - для «побіжної вибірки», де нові образи є доопрацюванням старих. Почнемо з останнього, оскільки воно показує більше деталей.
Підвищення розміру
Оригінальне зображення розміром 7 на 7 ліворуч є дійсно одномірним, оскільки кожен рядок однаковий. Перестановка відбувається в стовпцях. Розмір інших п’яти зображень становить 80 на 80, докладно показуючи, як кожен метод інтерполює між оригінальними грубими пікселями. Відбір проб найближчого сусіда зберігає різкий поділ між темним і світлим, тоді як інші чотири методи певною мірою розмивають область, що втручається. Зокрема, повторний пробірник Ланцоса створює деякі ділянки, які темніше будь-яких в оригіналі, а інші - світліші за будь-які в оригіналі. (Це може мати наслідки для роботи ГІС, оскільки така екстраполяціявихідних значень потенційно може спричинити недійсність нових значень. Вони також можуть виходити за межі діапазону оригінальної кольорової карти, іноді спричиняючи екстремальні значення зображення, що перекомпонується, неправильно відображатись. Наприклад, це проблема з перестановкою бікубічної згортки в ArcGIS.)
(Примітка: Метод "бікубічних", показаний тут, є бікубічним сплайном, а не "бікубічною згорткою" ArcGIS.)
Використання легкості для зображення значень зображення, хоча й природної, не дуже точна. Наступна ілюстрація виправляє це шляхом графіки значень комірок (вертикальна вісь) за стовпцем (горизонтальна вісь).
Нижчі значення на графіках відповідають темнішим частинам зображень. Продумане вивчення оригіналу розкриває приховане припущення: хоча оригінальне зображення виглядає як різкий стрибок від темного до світлого, стрибок насправді відбувається над однією сьомою (1/7) розміру стовпців. Хто повинен сказати, що насправді відбувається в цей проміжок в оригінальній сцені, на якій зображено зображення? Тому ми не повинні надто критично ставитися до відмінностей між методами перекомпонування, які відбуваються протягом цього короткого інтервалу: кожен дає різні, але потенційно однаково достовірні відображення того, що може статися на початковій сцені. У цьому сенсі вже не видно, що вибірка найближчого сусіда є найбільш вірним методом інтерполяції.
Одним із висновків, який ми повинні зробити, є те, що точність будь-якого методу перегляду залежно від характеру основної сцени . Якщо сцена складається з значень, які повинні плавно змінюватися від однієї точки до іншої, то метод найближчого сусіда, ймовірно, буде найменш вірним способом перекомпонування серед показаних.
Зниження часу
Тут ми бачимо результат зменшення зображення 16 на 16 на 8 на 8 зображень (агрегація 2 на 2). Найближчий сусід точно зберігає гостру межу. Ланцос відрізняється від інших посиленням видимої гостроти. При пильному погляді видно, що він затьмарює темну область з одного боку кордону, а з іншої сторони освітлює світлу область. Графіки пояснюють це:
Білінеарні, бікубічні та гауссові перепробовувачі показують характеристики операторів згортки, які мають усі позитивні ваги (або дуже малі від'ємні ваги): вони мають середнє значення або "мазати" сусідні значення. У режимі пониження сигналу це призводить до розмитості різких особливостей. Ступінь розмиття залежить від ширини ядра. Як і ці інші, повторний пробірник Ланцоса також розмиває стрибок, але він "перекриває" його з обох сторін. Це посилення контрасту, що бачиться трохи вище на самих зображеннях. Через таку тенденцію до збільшення контрасту (локальні відмінності між максимумами та мінімумами на зображенні), повторний пробовідбірник Ланцоса часто називають "фільтрам різкості". Ці графіки показують, що ця характеристика потребує нюансного розуміння, оскільки, очевидно, це фактично не зменшує усереднення значень з обох сторін стрибка. У пікселі 4 його значення 0,56 можна порівняти зі значеннями, обчисленими іншими фільтрами згортки.
Як його використання впливає на вихід?
Давайте розглянемо, що відбувається в більш складному зображенні.
Оригінал, що є зображенням 13 на 13, тепер включає візерунок з максимально можливою просторовою частотою (чергування світлого та темного з кожним стовпцем праворуч). Ми не можемо сподіватися на повторне відтворення таких функцій при зменшенні дискретизації: менша кількість пікселів просто не може вмістити всю цю інформацію. Давайте тоді зосередимось на тому, що відбувається, коли подібне зображення збільшене до вибірки. Якщо ми дбаємо про вірне відтворення сцени, ми хочемо, щоб ця високочастотна картина була відтворена точно.
Менші зображення перекомпоновані на 25 - 25 пікселів: майже, але не зовсім - уточнення 2: 1. На мій погляд, Ланцос і білінеарні методи відтворюють смуги найбільш різко серед чотирьох поглиначів згортки. Найближчий сусід, звичайно, найвірніший (адже він взагалі не може оцінити середні значення).
Ці графіки тих же результатів показують, що реамплектор Ланцоса зміг підтримувати контраст смуг (як видно з розмірів вертикальних перепадів від мінімуму до максимуму) за рахунок введення зміни інтенсивності в межах світла постійної величини область в середині зображення (пікселі 5, 6, 7 оригіналу). Ця варіація проявляється у вигляді смугастих артефактів у світлій частині зображення (середина). З представлених тут повторних пробників, введення таких хибних деталей є одними.
Для чого це корисно в просторовому застосуванні?
Очевидно, що повторне виділення Ланцоса не є панацеєю чи всебічним рішенням від повторного відтворення. Він перевершує багато інших перепробірків згортки у підтримці (або навіть посиленні) локального контрасту. Це може бути корисно, коли перекомпоноване зображення призначене для перегляду ідентифікації детальних ознак або меж. Коли згодом повторно обрамлене зображення буде проаналізовано чи оброблено, повторне розміщення Ланцоса може збільшити можливість виявлення ребер та лінійних ознак.
Однак, коли повторно образоване зображення буде проаналізовано іншими способами, проте переваги повторного моделювання Ланцоса є сумнівними. Зазвичай це (штучно) збільшує локальні міри просторової мінливості, такі як фокусні діапазони та фокальні стандартні відхилення. Це не вплине на просторові засоби в цілому - як і інші перепробірки згортки, як правило, нормалізується (це означає, що це середньозважена середня величина, без упереджених змін) - але це може збільшити деякі місцеві середні показники та зменшити інші порівняно з інші перепробірки.
Тут (обов'язково коротка) оцінка передбачає, що повторний вибірник Lanczos, як правило, не повинен використовуватися для зменшення тиску: для цієї програми, як видається, не пропонується нічого, що мають більш прості (і частіше доступні) методи, що зберігають потенційний недолік екстраполяції за межі початкового діапазону значень даних.
Післямова: загальний коментар
Описане тут розслідування є прикладом того, що хто може зробити, коли у них виникає питання про те, як працює операція ГІС. Він використовує сам ГІС як предмет дослідження: щоб знати, що робить якась операція чи аналітичний метод, просто застосувати її в контрольованих експериментальних умовах. У цьому випадку це означає побудову простих тестових зображень, перекомпонування їх відповідно до доступних методів та вивчення результатів.
Існує три критичні аспекти цього підходу до вивчення того, як працює ГІС:
- Теорія . Експерименти зазвичай не можна робити «сліпими»: це допомагає знати певну теорію. Нам зазвичай не потрібно багато знати, але нам потрібні основи. У цьому випадку теорія згортків значно скоротила кількість і типи зображень, з якими нам потрібно експериментувати. Нам не потрібно було нічого знати про аналіз Фур’є та ін. (Не помиляйтесь, такі знання корисні. Але відсутність спеціалізованих знань такого роду не повинно нас зупинити.)
- Практика . Використовуючи наш ГІС для проведення експерименту, ми можемо побачити, що він насправді робить . Це дозволяє уникнути розривів між теорією (яка говорить нам про те, що програмне забезпечення повинно робити) та практикою (що це насправді робить).
- Кількісне визначення . Якщо питання не стосується візуального сприйняття, для оцінки результатів ми не повинні покладатися лише на перегляд карт (або, в даному випадку, зображень). Для отримання найкращої інформації нам потрібно кількісно оцінити результат (зроблений тут із графіками), а часто описувати та узагальнювати його статистичними методами.