Розуміння компонентів Cb і Cr кольорового простору YCbCr


11

Я знайомий з добавками (RGB), субстрактивними (CMYK) та HSV-подібними кольоровими просторами , але стаття, яку я зараз намагаюся зрозуміти, працює на кольоровому просторі YCbCr для сегментації зображення / визначення об'єкта.

Я витрачаю більшу частину свого ранку на пошуки чогось, що пояснило б YCbCr природно, але я просто не розумію цього. Я отримав хороший, інтуїтивне пояснення загальної ідеї позаду цього колірного простору тут , і пояснення того , як вона використовується для кодування зображення / стиснення від цих хлопців (всі на photo.SE).

Формули для обчислення YCbCr від RGB легко доступні у Вікіпедії .

Я отримав мотивацію до цього уявлення, я зрозумів, що компонент Y містить найважливішу (для людського ока) інформацію про зображення в сірому масштабі.

Я зрозумів, що Cb і Cr несуть інформацію про кольори , і що (через чутливість очей людини (не)) їх можна стиснути без видимих ​​втрачених якостей. Але що насправді представляє кожен із компонентів хромування?

Оскільки автори статті зазначають, що "інформація про хромування є першорядною у визначенні об'єктів" у їхньому підході, і я не можу повністю зрозуміти, що я читаю з моїм поточним "Y - це інтенсивність, Cb і Cr якось передають інформацію про кольори" рівень розуміння YCbCr.

Я шукаю відповідь у рядках "Cb - це ..., а Cr - це ..." або "якщо ви уявляєте, що переглядаєте / з XY, ви насправді дивитесь на компонент Cb ...", або якийсь інший спосіб, який допоможе мені зрозуміти інформацію, що передається кожним із компонентів окремо, а не лише те, що вони разом несуть кольорову інформацію.

EDIT

Наведіть приклади інтуїтивних пояснень для інших кольорових просторів типу, який я шукаю:

RGB : Ніби світить кольоровий ліхтарик на чорній стіні: Якщо ви світитеся синім ліхтариком, ви бачите синє відображення. Якщо додати червоний ліхтарик, він покаже пурпуровий відбиток, який є сумішшю синього та червоного.

CMYK : Як і змішуючи акварель, ви "додаєте кольорам, на яких поверхня відображається" (тобто віднімає колір від фону), тому якщо ви змішаєте жовтий з блакитним, якщо він буде відображати зелений і, таким чином, ви отримаєте зелений колір.

ВПГ : Маленьких дітей приваблюють сильно насичені предмети, а не яскраві (значення). Компонент Hue - це те, що "дає колір", тоді як низька насиченість означає, що колір "розбавляється" білим кольором. Зміна вартості робить всю річ яскравішою або темнішою.

Завдяки цим визначенням я зміг отримати інтуїтивне відчуття щодо того, що означає представлення кольорів у кожному кольоровому просторі, не запам'ятовуючи графіки для кожного з них.

Відповіді:


7

YUV (або YCbCr) схожий на HSV, але в різних координатах. (Різниця між YUV та YCbCr є незначною - переважно пов'язана з точними формулами).

The V компонент такий же. (S,H) можна вважати полярними координатами та (U,V) як декартовий. H - кут і S- радіус. Приблизною конверсією було б:

U=Scos(H)

V=Ssin(H)

Ви можете ознайомитись із цим посиланням для отримання додаткової інформації.

Ще одна річ, яку слід додати до списку інтуїції:

Насичення - це чистий колір з спектральної точки зору . Наприклад, лазер має дуже вузький спектр, що передбачає високу насиченість.


Ви можете додати пояснення різниці між YUV та YCbCr, для повноти?
пенелопа

@Andrey Rubshtein, Якщо лазер має високу насиченість, чи справжнє зворотне? Іншими словами, якщо я вимірюю RGB і перетворюю на HSV, чи означає, що висока насиченість означає, що він повинен походити з когерентного джерела лазера? Дякую.
Френк

@Frank, не обов'язково лазер. Але важко мати насичений колір із широким спектром, оскільки чим він ширший, тим важче мати високу реакцію лише в одному компоненті.
Андрій Рубштейн

@Andrey Rubshtein, Дякую за вашу відповідь. Mks одиниць інтенсивності насичення - це енергія на одиницю часу на одиницю площі. . Одиниці коливання енергії насичення mks є енергією на одиницю площі. де тверді лазерні імпульси твердих тіл довгі, 10 - 50 нс (наносекунд). Чи означає, що висока насиченість з дуже вузьким спектром означає, що він повинен походити з когерентного джерела лазера?
Френк

@Andrey Rubshein Ви абсолютно правильні. Я щойно з'ясував, що світлодіоди випромінюють світло, яке є майже однотонним, як і натрієві світильники низького тиску. Чи є відмінні характеристики когерентних лазерних покажчиків, які можна було б використати для визначення лазерних променевих вказівників, крім загального зображення, що спостерігається через вікно кабіни авіакомпанії Boeing 737?
Френк

2

Не впевнений, що ви маєте на увазі під собою "насправді", оскільки ні RGB, ні YUV не представляють ані частоту фотонів, ані типові реакції стрижня / конуса людських очей. Але ви можете побачити, як вони вам схожі, синтезуючи деякі кольорові патчі YCrCb, такі як (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1) тощо.

Ось сторінка Вікіпедії, яка включає діаграму:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

ДОБАВЛЕНО: RGB і подібні були майже розроблені (або еволюціонували), щоб відповідати можливому інтуїтивно зрозумілому сприйняттю людини (а назви кольорів виявляються культурними). YUV - навпаки, розроблений таким чином, що шум у УФ-зоні (доданий до галасливої ​​підсмуги NTSC) було б важко помітити і, отже, важче описати. YCrCb - це зміна одного кольорового відображення. Тому не шукайте існуючого "інтуїтивного" розуміння, яке може не існувати. Можливо, створіть власну, "вивчивши" діаграму та побудувавши нові абсолютно нейронні зв’язки, які зараз можуть не існувати у вашому мозку (або щось подібне.)


Я додав приклади для інших кольорових просторів типу, який я хотів би отримати для YCbCr. Сподіваюся, що це робить тип пояснень, які я прагну чіткіше.
пенелопа

0

Коли ви розумієте HSV / HSB, це не має труднощів зрозуміти YCbCr. Канал B у HSB відповідає кольоровості (chroma = насиченість http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/). Ви можете взяти rgb-зображення і перетворити його в масштаб сірого або ви можете перетворити кожен канал RGB в масштаб сірого, і вони об'єднають їх в один канал. Для спрощення давайте піксель зі 100% червоним, 100% зеленим та 70% синім. Ви підрахуєте середню ... (100 + 100 + 70) / 3 і отримаєте значення 90%, що означає 90% яскравості. Так у відтінків сірого він дуже світло-сірого кольору. Тепер, якщо ми хотіли б виразити оригінальні кольори до каналу сірого, нам знадобиться 3 формули для кожного кольору (червоний, зелений, синій). Ви можете обчислити різницю значення R проти відтінків сірого, G проти відтінків сірого та B проти сірого. Для цього знадобиться 4 канали (RGB + chroma). Але ми можемо зробити те ж саме з 3-ма каналами. Ми можемо зробити невелику корекцію зеленого каналу. Розрахуємо різницю на зелений канал. Оригінальний зелений - 100%, нове значення зеленого, перетвореного на сіре - 90%. Різниця становить -10%. Тож давайте змінимо R і B каналів цього пікселя на цю різницю. Ми просто зробили гамма-корекцію або всі канали. Значення зеленого каналу будуть такими ж, як і для зображення в градаціях сірого. Тож ми більше не розраховуємо із зеленим каналом. Зелений колір "закодований" у каналі Y ... chroma. Решта кольорів (R, B) також регулюються. R` = 90% початкового або 100% Y, оскільки R і B рівні в цьому прикладі. B-з'єднання має різницю + 20% у відношенні до оригіналу, але після того, як воно було змінено гамма-корекцією, воно має різницю + 30% у напрямку Y. Щоб спростити його ще більше, це подібна формула, де потрібно внести додавання для всіх трьох сполук. Різниці, які ви отримуєте для червоного та синього, - це Cb та Cr. Символи просто кажуть, що ви порівняли Синій канал із хромальним каналом та Червоний канал із каналом Хромма. Звідси Cb і Cr.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.