Статистичний показник, якщо зображення складається з просторово пов'язаних окремих регіонів


14

Розглянемо ці два зображення в градаціях сірого:

річка випадкові

На першому зображенні зображено звивистий річковий візерунок. Друге зображення показує випадковий шум.

Я шукаю статистичний показник, за допомогою якого можна визначити, чи вірогідно, що на зображенні є річковий малюнок.

Зображення річки має дві області: річка = велике значення та всюди - низьке значення.

В результаті цього гістограма є бімодальною:

введіть тут опис зображення

Тому зображення з річковим малюнком повинно мати велику дисперсію.

Однак це робить випадкове зображення вище:

River_var = 0.0269, Random_var = 0.0310

З іншого боку, випадкове зображення має низьку просторову неперервність, тоді як зображення річки має високу просторову безперервність, що чітко показано на експериментальній варіограмі: введіть тут опис зображення

Таким же чином, як дисперсія "підсумовує" гістограму в одне число, я шукаю міру просторової суміжності, яка "узагальнює" експериментальну варіограму.

Я хочу, щоб цей захід "карав" високу напівваріантність при малих відставаннях важче, ніж при великих відставаннях, тому я придумав:

 svar=h=1nγ(h)/h2

Якщо я додаю лише від відставання = 1 до 15, я отримую:

River_svar = 0.0228, Random_svar = 0.0488

Я думаю, що зображення річки має мати велику дисперсію, але малу просторову дисперсію, тому я ввожу коефіцієнт дисперсії:

 ratio=var/svar

Результат:

River_ratio = 1.1816, Random_ratio = 0.6337

Моя ідея - використовувати це співвідношення як критерій прийняття рішення, чи зображення є зображенням річки чи ні; високе співвідношення (наприклад> 1) = річка.

Будь-які ідеї, як я можу покращити речі?

Заздалегідь дякую за будь-які відповіді!

EDIT: Виконуючи поради Уубера та Gschneider, ось Моранс І двох зображень, обчислених за допомогою ваги матриці зворотної відстані 15x15 за допомогою функції Matlab Фелікса Гебелера :

Річка_М Випадковий_М

Мені потрібно узагальнити результати в одне число для кожного зображення. Згідно з Вікіпедією: "Значення варіюються від -1 (вказує на ідеальну дисперсію) до +1 (ідеальна кореляція). Нульове значення вказує на випадкову просторову схему." Якщо підсумувати квадрат Моранів I за всі пікселі я отримаю:

River_sumSqM = 654.9283, Random_sumSqM = 50.0785 

Тут є величезна різниця, тому Моранс, здається, є дуже хорошою мірою просторової безперервності :-).

Ось гістограма цього значення для 20 000 перестановок зображення річки: гістограма перестановок

Очевидно, що значення River_sumSqM (654,9283) малоймовірне, тому зображення річки не є просторовим випадковим чином.


4
Цікаве запитання. Одним із порад, який одразу спадає на думку, є зосередитись на короткодіапазонній частині варіограми: це найважливіша частина і зробить найкращу роботу, виділивши пари подібних зображень. (Тісно пов’язані статистичні дані - це Моран І і Гірі С. ) Однак важко дати конкретні поради, якщо тільки ви не зможете більш чітко охарактеризувати види зображень, які ви очікуєте на обробку.
whuber

2
+1 Бубер, Моран, здається, в цьому випадку гарний початок. Тоді, можливо, подумайте про тест на перестановку, щоб побачити, наскільки "екстремальний" ваш образ.
Gschneider

@Gschneider Тест на перестановку - це гарна ідея, тим більше, що перестановок не потрібно проводити! Підрахунок розподілу варіограми (або I або Geary's C чи іншого) Морану нескладно під перестановками значень на зображенні: існує стільки значень, що застосовується CLT. (Наприклад, варіограма буде мати вигляд зелених точок; вдвічі їх постійна висота - це дисперсія значень зображення.) Проблема стає більш складною, коли "річковий" візерунок потрібно відрізняти від інших шаблонів, таких як "озеро" або "річки" можуть мати різну ширину.
whuber

Вибачте, але я не впевнений, що я слідую: чи ви скажете мені перетворювати зображення, яке тестується, піксель на піксель якось випадковим чином, а потім порівнювати значення I Морану перестановленого зображення із значенням тестуваного зображення?
Енді

Я мав на увазі спочатку визначити якусь (мабуть, просту) структуру сусідства і обчислити Моран І. Потім можна обчислити K, скажімо, 200 000, можливі перестановки пікселів, обчисливши I Морану для кожної перестановки. Як тільки ви отримаєте ці 200 000 Моранського я, подивіться, де лежить ваша спостережувана статистика. Але, метод Уубера звучить простіше :).
Gschneider

Відповіді:


1

Я думав, що розмиття Гаусса діє як фільтр низьких частот, залишаючи позаду великомасштабну структуру та видаляючи компоненти з високим числом хвиль.

Ви також можете подивитися на масштаб вейвлетів, необхідний для створення зображення. Якщо вся інформація живе в невеликих масштабах вейвлетів, то, швидше за все, це не річка.

Ви можете розглянути якусь автокореляцію однієї лінії річки із самою собою. Отже, якщо ви взяли ряд пікселів річки, навіть із шумом, і знайшли функцію перехресної кореляції з наступним рядом, то ви могли б знайти місце розташування та значення піку. Це значення буде набагато вище, ніж те, що ви збираєтеся отримати при випадковому шумі. Стовпчик пікселів не видасть багато сигналу, якщо ви не вибрали щось із регіону, де знаходиться річка.

http://en.wikipedia.org/wiki/Gaussian_blur

http://en.wikipedia.org/wiki/Cross-correlation


1
Тут кілька цікавих ідей! Чи можу я переконати вас деталізувати цю відповідь, застосувавши один або кілька ваших підходів до зразкових зображень, щоб (1) показати, як працюють ваші методи та (2) оцінити, наскільки вони ефективні?
whuber

1
Це з моєї дипломної роботи. (Машинобудування) Я поставив розмиття Гаусса на положення нелінійного маятника, а потім застосував метод згортання, щоб відступити позицію від зображення та порівняти його з аналітичним. Я спробував це з кількома рівнями шуму. Поки шум був нижче порогового значення, пов’язаного з розміром гаусса, відбулася дуже хороша реконструкція. Посилання Малюнок 11 був відповідним графіком для реконструкції. На рисунку 6 та рівнянні 2 вказано реакцію на шум.
EngrStudent

Спасибі! Отже, схоже, що ви в змозі скласти цю відповідь і продемонструвати, наскільки вона насправді ефективна. :-)
whuber

Вибачте за подвійний коментар. Я думаю, що "розумно" використовувати частину об'єкта як псевдо "мати-вейвлет" для себе. Це здається самореференційним, але також поетичним. Самопримикання.
EngrStudent

1

Це трохи пізно, але я не можу протистояти одній пропозиції та одному спостереженню.

По-перше, я вважаю, що більш підходящий підхід "для обробки зображень" може виявитися краще, ніж аналіз гістограми / варіограми. Я б сказав, що пропозиція EngrStudent "згладжує" на правильному шляху, але частина "розмиття" є контрпродуктивною. Для цього потрібне більш гладке збереження краю , наприклад, двосторонній фільтр або серединний фільтр . Вони є більш складними, ніж фільтри з ковзними середніми, оскільки вони за необхідністю нелінійні .

Ось демонстрація того, що я маю на увазі. Нижче наведено два зображення, що наближають два сценарії, а також їх гістограми. (Зображення кожні 100 на 100, з нормалізованою інтенсивністю).

Сирі зображення сирі образи

До кожного з цих зображень я застосовую медіанський фільтр 5 на 5 разів 15 разів *, який розгладжує візерунки, зберігаючи краї . Результати показані нижче.

Згладжені зображення згладжені зображення

(* Використання більшого фільтра все одно підтримувало б різкий контраст по краях, але згладжувало їх положення.)

Зверніть увагу, як на зображенні "річка" все ще є бімодальна гістограма, але вона тепер непогано розділена на 2 компоненти *. Тим часом зображення "білого шуму" все ще має однокомпонентну унімодальну гістограму. (* Легко встановлено порогове значення, наприклад , метод Оцу , щоб зробити маску і доопрацювати сегментацію.)


xf[y]

(Вибачте за рент ... спочатку моє навчання проходило як геоморфолог)


Зі сторони, як правило, дуже обережно бути дуже обережним у застосуванні "методів варіограми" до природних зображень, які зазвичай не є нерухомими. Це стосується моєї відповіді тут .
GeoMatt22

0

Пропозиція, яка може бути швидкою перемогою (або взагалі не може працювати, але її легко усунути) - ви спробували переглянути співвідношення середнього значення до дисперсії гістограм інтенсивності зображення?

Візьміть зображення випадкового шуму. Якщо припустити, що він генерується випадковим чином випромінюваних фотонів (або подібних), що потрапляють на камеру, і кожен піксель однаковою мірою може бути вражений, і що у вас є неочищені показання (тобто значення не переосмислені, або змінено масштаб відомим способом, який ви можете скасувати) , тоді кількість показань у кожному пікселі має бути розподілена пуассоном; ви підраховуєте кількість подій (фотони, що потрапляють на піксель), які трапляються за фіксований період часу (час експозиції) кілька разів (за всі пікселі).

У випадку, коли є річка з двома різними значеннями інтенсивності, у вас є суміш двох розподілів пуассона.

Справді швидким способом протестувати зображення, можливо, слід переглянути співвідношення середньої та дисперсійної інтенсивності. Для розподілу пуассона середнє значення буде приблизно дорівнює дисперсії. Для суміші двох пуассонових розподілів дисперсія буде більшою, ніж середня. Вам знадобиться перевірити співвідношення двох проти певного попередньо встановленого порогу.

Це дуже грубо. Але якщо це працює, ви зможете обчислити необхідну достатню статистику лише за один прохід над кожним пікселем у вашому зображенні :)

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.