Який найкращий спосіб виявити кути рахунку-фактури / квитанції / аркуша паперу на фотографії? Це потрібно використовувати для подальшої перспективної корекції перед OCR.
Мій поточний підхід:
RGB> Grey> Виявлення канти канти з пороговим значенням> Dilate (1)> Видалення невеликих предметів (6)> очищення об'єктів бордюру> підбір блоків великих розмірів на основі опуклої області. > [виявлення кута - не реалізовано]
Я не можу допомогти, але думаю, що для управління цим типом сегментації повинен бути більш надійний «розумний» / статистичний підхід. У мене не так багато прикладів тренувань, але я, напевно, можу зібрати 100 зображень разом.
Ширший контекст:
Я використовую матлаб для прототипу і планую впровадити систему в OpenCV і Tesserect-OCR. Це перша з ряду проблем обробки зображень, які мені потрібно вирішити для цього конкретного додатка. Тож я хочу розгорнути власне рішення та ознайомитися з алгоритмами обробки зображень.
Ось кілька прикладних зображень, з якими я хотів би впоратися з алгоритмом: Якщо ви хочете прийняти виклик, великі зображення розміщені на веб- сайті http://madteckhead.com/tmp
(джерело: madteckhead.com )
(джерело: madteckhead.com )
(джерело: madteckhead.com )
(джерело: madteckhead.com )
У найкращому випадку це дає:
(джерело: madteckhead.com )
(джерело: madteckhead.com )
(джерело: madteckhead.com )
Однак це не вдається легко в інших випадках:
(джерело: madteckhead.com )
(джерело: madteckhead.com )
(джерело: madteckhead.com )
Заздалегідь дякую за всі чудові ідеї! Я ТАК люблю!
EDIT: Прогрес в ході трансформації
Питання: Який алгоритм кластеризує лінії хоуга, щоб знайти кути? Дотримуючись порад із відповідей, я зміг скористатися Hough Transform, вибрати лінії та відфільтрувати їх. Мій сучасний підхід досить грубий. Я зробив припущення, що рахунок-фактура завжди буде менше 15 градусів, не вирівнюючи зображення. Я закінчую розумні результати для рядків, якщо це так (див. Нижче). Але я не зовсім впевнений у підходящому алгоритмі кластеризації ліній (або голосування) для екстраполяції за кутами. Лінії Хафа не є суцільними. І в галасливих зображеннях можуть бути паралельні лінії, тому потрібна певна форма або відстань від метрики початку лінії. Якісь ідеї?
(джерело: madteckhead.com )