Единое окно доступа к образовательным ресурсам

Компьютерная обработка и распознавание изображений: Учебное пособие

Голосов: 5

В пособии приведены методы компьютерной обработки и распознавания изображений. Рассмотрены математические модели изображений, критерии качества изображений. Описываются основные алгоритмы цифровой обработки и распознавания изображений, в том числе основы яркостных преобразований, преобразования цветовых координатных пространств, пространственной и частотной фильтрации, морфологических операций, кодирования, сегментации и классификации, а также анализа изображений. Предназначено для студентов, обучающихся по направлению подготовки 200600 - "Фотоника и оптоинформатика".

Приведенный ниже текст получен путем автоматического извлечения из оригинального PDF-документа и предназначен для предварительного просмотра.
Изображения (картинки, формулы, графики) отсутствуют.
    оценки математического ожидания неравномерности из исходного сигнала
и последующей операции линейного контрастирования.
    Особый интерес представляет то обстоятельство, что в насыщенных
областях изображения при низкой яркости изображения оценивается
относительно высокий контраст мелких деталей изображения. То есть в
областях изображения с низкими уровнями яркостного компонента, где
становятся мало различимыми мелкие детали, сигнал компонента
насыщенности имеет высокое значение, и, следовательно, улучшает
условия наблюдаемости в темных областях. Для улучшения яркостного
сигнала можно использовать информацию сигнала насыщенности в
областях низких уровней яркости. При этом сигнал яркости может быть
сложен со взвешенным сигналом контурного оператора негатива сигнала
насыщенности.
    Эффективным способом повышения цветового контраста в условиях
низкой освещенности является накопление сигнала на матрице ПЗС. На
рисунке 5.11 приведен пример, иллюстрирующий улучшение изображения
при наблюдении за неподвижными объектами в условиях низкой
освещенности.




    а) б)
    в) г)
Рисунок 5.11 a) Исходное изображение без накопления, б) исходное
изображение с накоплением 0,5 с; в) улучшенное изображение а; г) улучшенное
изображение б).

                                    61


    6      ОСНОВЫ ФИЛЬТРАЦИИ ИЗОБРАЖЕНИЙ
     Изображения,    полученные     на   выходе    оптико -электронных
преобразователей, искажены помехами. Это затрудняет как визуальный
анализ изображений человеком - оператором, так и их автоматическую
компьютерную обработку. При обработке изображений помехами
являются и некоторые области самого изображения. Например, при
анализе объектов на сложном фоне, фон тоже представляет собой помеху.
При цифровой обработке изображений необходимо устранять
геометрические искажения изображений, подавлять шумы различной
природы, производить апертурную коррекцию. Ослабление действия
помех достигается фильтрацией.
     Фильтрация изображений производится в пространственной и
частотной областях. При пространственной фильтрации изображений
преобразование выполняется непосредственно над значениями отсчетов
изображения. Результатом фильтрации является оценка полезного сигнала
изображения. Изображение представляет собой двумерную функцию
пространственных координат, изменяющуюся медленнее, чем двумерная
функция, описывающая помеху. Поэтому при оценке полезного сигнала в
каждой точке кадра рассматривают окрестность этой точки (некоторое
множество соседних с ней точек), используя общие характеристики
сигнала в этой окрестности. В других случаях признаком полезного
сигнала являются резкие перепады яркости. Однако, как правило, частота
этих перепадов относительно невелика, так что на значительных
промежутках между ними сигнал либо постоянен, либо изменяется
медленно. И в этом случае свойства сигнала проявляются при наблюдении
его не только в отдельной точке, но и при анализе ее окрестности.
Заметим, что понятие окрестности является достаточно условным. На
рисунке 6.1 представлена иерархия окрестностей отсчета, обозначенного
«0».
                  9    8    7   6        7   8   9

                  8    5    4   3        4   5   8

                  7    4    2   1        2   4   7

                  6    3    1   0        1   3   6

                  7    4    2   1        2   4   7

                  8    5    4   3        4   5   8

                  9    8    7   6        7   8   9


Рисунок 6.1 Конфигурации окрестности элемента «0» в кадре изображения в
иерархической последовательности.

                                    62


     «1» обозначена окрестность первого порядка, для которой расстояние
между элементами равно 1. «2» обозначена окрестность второго порядка, к
которой относятся диагональные элементы, расстояние от которых до
центрального отсчета «0» равно        2 . Окрестность третьего порядка
представлена элементами, отстоящими от центрального элемента на
расстояние, равное 2, и так далее.
    В соответствии с рисунком 6.1 формируется иерархия конфигураций
окрестности центрального отсчета рассматриваемого фрагмента (окна)
кадра по возрастанию расстояний от него до отсчета окрестности.
    Окрестность может быть образована лишь ближайшими соседями, но
может содержать и достаточно много элементов кадра. При рассмотрении
окрестности большого размера, иногда устанавливается различная степень
влияния далеких и близких от центра окрестности точек на сигнал,
формируемый на выходе фильтра в данной точке кадра. Таким образом,
идеология фильтрации основывается на использовании как данных
текущей точки, так и ее окрестности. В этом проявляется существенное
отличие фильтрации от рассмотренных выше поэлементных процедур:
фильтрация не может быть поэлементной процедурой обработки
изображений.
     Традиционная фильтрация в частотной области требует выполнения
следующей последовательности преобразований [28]:
−    двумерное     дискретное      преобразование     изображения    из
     пространственной области в частотную (например, посредством
     дискретного преобразования Фурье),
−    преобразование дискретного спектра сигнала изображения,
−    обратное двумерное дискретное преобразование, позволяющее
     восстановить полезный сигнал изображения в пространственной
     области.
     Задача заключается в том, чтобы найти такую вычислительную
процедуру, которая обеспечила бы получение наилучших результатов.
Общепринято при решении этой задачи опираться на использование
вероятностных моделей изображения и помехи, а также на применение
статистических критериев оптимальности. Причины этого понятны - это
случайные законы распределения полезного сигнала и помехи и
стремление получить минимальное в среднем отличие результата
обработки от результата обработки идеального сигнала. Многообразие
методов и алгоритмов связано с большим разнообразием сюжетов,
обусловливающих множество различных математических моделей,
используемых для описания сигналов. Кроме того, применение различных
критериев оптимальности также ведет к разнообразию методов
фильтрации. Наконец, даже при совпадении моделей и критериев часто из-
за математических трудностей не удается найти оптимальную процедуру.
Сложность нахождения точных решений порождает различные варианты
приближенных методов и процедур.

                                  63


    В практике цифровой обработки изображений широко используется
масочная фильтрация. Ее линейная разновидность является одним из
вариантов    двумерной     фильтрации     с   конечной    импульсной
характеристикой (КИХ) фильтра. В качестве маски используется
множество весовых коэффициентов, заданных во всех точках окрестности
S , обычно симметрично окружающих текущую точку кадра.
Распространенным видом окрестности, часто применяемым на практике,
является квадрат 3 × 3 с текущим элементом в центре. Применяют
различные маски, одним из эвристических вариантов является
равномерная маска, все девять весовых коэффициентов которой равны 1/9.
Такой выбор коэффициентов отвечает условию сохранения средней
яркости, вследствие чего выходной сигнал оказывается вписанным в
диапазон входного сигнала.
    Применение процедур фильтрации приводит к существенному
снижению уровня шума в изображении.
      6.1         Основы пространственной фильтрации изображений
      6.1.1         Линейная пространственная фильтрация
     Пространственная                    фильтрация   изображения     f (x , y ) ,
x ∈ [0 , ( N − 1)], y ∈ [0 , (M − 1)] позволяет применять фильтры с КИХ [39].
Поскольку в изображении понятия прошлого и будущего времени
становятся условными, мы можем использовать амплитуды отсчетов как в
направлении увеличения индексов, так и в направлении уменьшения
индексов. Пространственная фильтрация выполняется как операция
двумерной свертки импульсной характеристики фильтра h( s ,t ) с
изображением             f ( x , y ) , где s – координата характеристики в
горизонтальном направлении вдоль оси x, s ∈ [−n / 2 ,n / 2], t - координата
характеристики в вертикальном направлении вдоль оси y, t ∈ [− m / 2 ,m / 2] :
                                             m/ 2      n/ 2
g ( x , y ) = f ( x , y ) * h( x , y ) =      ∑        ∑ f (s , t )h( x − s , y − t ) =
                                           t =−m / 2 s =−n / 2
                                                                                          (6.1)
  m/ 2       n/ 2
   ∑          ∑ f ( x − s , y − t )h(s , t ).
t =−m / 2 s =−n / 2
    Прямоугольная область размером n × m , на которой задана
импульсная характеристика, называется маской или ядром фильтра.
Рассмотрим, как соотносятся координаты изображения и импульсной
характеристики фильтра на примере.
    Пусть m = 3 , n = 3 . Элементы импульсной характеристики фильтра и
соответствующей области изображения представлены на рисунке 6.2.
Начало координат фильтра устанавливается в центр импульсной
характеристики, как показано на рисунке 6.2. Отсчеты импульсной
характеристики отражаются относительно начала координат (что


                                                         64


равносильно повороту маски на 180°), и центр маски смещается в
положение ( x , y ) .
             s = -1          s =0             s =1                             s = -1       s =0        s =1
t = -1       f ( −1,−1 ) f ( 0 ,−1 ) f ( 1,−1 )                              h( 1,1 )       h( 0,1 )    h( −1,1 )


t =0         f ( −1,0 )      f ( 0,0 )        f ( 1,0 )                      h( 1,0 )       h( 0 ,0 )   h( −1,0 )


t =1         f ( −1,1 )      f ( 0 ,1 )       f ( 1,1 )                      h( 1,−1 )      h( 0 ,−1 ) h( −1,−1 )


Рисунок 6.2 Положение отсчетов импульсной характеристики при свертке с
изображением f ( x , y ) .

       Отклик фильтра g ( x , y ) вычисляется как сумма произведений
отсчетов изображения на соответствующие отсчеты повернутой
импульсной характеристики. Эта операция выполняется для каждого
отсчета изображения.
       Если импульсная характеристика фильтра симметрична, то есть
h( s ,t ) = h( − s ,−t ) , то вместо свертки можно выполнять корреляцию:
                                             m/ 2             n/ 2
g ( x , y ) = f ( x , y ) ⊗ h( x , y ) =      ∑               ∑ f (x + s , y + t )h(s , t ) .                  (6.2)
                                           t =−m / 2 s =−n / 2
      Эта операция не требует отражения импульсной характеристики, а
представляет собой вычисление в скользящей по изображению маске
фильтра произведений отсчетов изображения на соответствующие
коэффициенты фильтра и их суммирование (в соответствии с рисунком
6.3).
                                                                -1    0     1
                                           h(s,t)    -1
                                                 0
                                                                                    s
                                             1

                                                          t
                                      0                                                         x


                                                                 x



         y                                                            f(x,y)



Рисунок 6.3 Корреляция изображения f ( x , y ) с маской h( s ,t ) .

                                                               65


       Для обработки краевых эффектов необходимо увеличить изображение
по строкам и столбцам на n/2 отсчетов слева и справа и на m/2 отсчетов
сверху и снизу. При этом расширение может выполняться разными
способами: дополнением нулями, повторением граничных элементов,
периодическим повторением ( x mod N , y mod M ) или зеркальным
отражением граничных элементов. Размер выходного изображения при
этом сохраняется равным размеру входного изображения.
      При построении линейных КИХ фильтров часто используют
непараметрический подход.
      Линейные сглаживающие фильтры. Для уменьшения шумов широко
применяются НЧ фильтры, поскольку шум представляет собой ВЧ сигнал.
В частности, для НЧ фильтрации применяется усреднение сигнала в маске,
например, при n=m=3:
          ⎡1 1 1⎤                      ⎡1 1 1⎤                    ⎡1 2 1 ⎤
       1⎢                          1 ⎢                        1 ⎢
h1 = 1 1 1⎥ ; h2 =                      1 2 1⎥ ; h3 =               2 4 2⎥ .  (6.3)
       9  ⎢           ⎥           10   ⎢          ⎥          16   ⎢      ⎥
          ⎢1 1 1⎥
          ⎣           ⎦                ⎢1 1 1⎥
                                       ⎣          ⎦               ⎢1 2 1 ⎥
                                                                  ⎣      ⎦
      Нормировка необходима для того, чтобы привести значения отклика
фильтра к диапазону входных данных. Нормирующий коэффициент
определяется из условия равенства единице суммы всех коэффициентов
КИХ в соответствии с уравнением:
          ⎛ m/ 2          n/ 2         ⎞
k =1/⎜ ∑                  ∑   h(s , t )⎟ .                                   (6.4)
          ⎜                            ⎟
          ⎝ t =− m / 2 s =− n / 2      ⎠
      Линейная фильтрация широко применяется при подавлении шумов в
изображении, для компенсации неравномерности чувствительности,
создания эффектов размытия изображений.
      Она также широко применяется в задачах выделения контуров на
изображении, подчеркивания верхних пространственных частот [40,41]. В
этом случае коэффициенты КИХ фильтра вычисляются на основе
дифференцирования амплитуды сигнала, что эквивалентно дискретным
разностям амплитуд отсчетов:
∂f ( x , y ) / ∂x ~ Δf x ( x , y ) = f ( x , y ) − f ( x − 1, y )             (6.5)
∂f ( x , y ) / ∂y ~ Δf y ( x , y ) = f ( x , y ) − f ( x , y − 1) .
     Производные можно брать не только по горизонтали и вертикали, но и
в     произвольном   направлении.       Соответствующие     импульсные
характеристики фильтров имеют вид:
⎡− 1⎤
⎢ 1 ⎥ , [− 1 1],                                                   (6.6)
⎣ ⎦
⎡ 0 1 ⎤ ⎡ − 1 0⎤
⎢ − 1 0⎥ , ⎢ 0 1⎥ .                                                (6.7)
⎣        ⎦ ⎣     ⎦
     КИХ (6.7), формирующие производные в ортогональных
направлениях с наклоном +45о и -45о, используются в операторе Робертса.

                                        66


    Доктор Джудит Превитт для обнаружения границ медицинских
изображений применила оператор, маски которого получили ее имя [42]:
⎡− 1 0 1⎤ ⎡ 1 1 1 ⎤
⎢− 1 0 1⎥ , ⎢ 0 0 0 ⎥ .                                           (6.8)
⎢        ⎥ ⎢              ⎥
⎢− 1 0 1⎥ ⎢− 1 − 1 − 1⎥
⎣        ⎦ ⎣              ⎦
    Широко применяется в обработке изображений для выделения
контуров оператор Собеля:
⎡− 1 − 2 − 1⎤ ⎡ − 1 0 1 ⎤
⎢0    0    0 ⎥ , ⎢ − 2 0 2⎥ .                                     (6.9)
⎢            ⎥ ⎢          ⎥
⎢1
⎣     2    1 ⎥ ⎢ − 1 0 1⎥
             ⎦ ⎣          ⎦
    Для выделения контуров применяются также вторые производные
амплитуды сигнала. Оператор Лапласа, имеющий вид:
  2                2      2   2          2
∇ f ( x , y ) = ∂ f ( x , y ) / ∂x + ∂ f ( x , y ) / ∂y ,
можно применить в виде линейного КИХ фильтра с импульсной
характеристикой:
⎡0 1 0 ⎤
⎢1 − 4 1⎥ .                                               (6.10)
⎢             ⎥
⎢0 1 0 ⎥
⎣             ⎦
Линейные КИХ фильтры просты в реализации.
      6.1.2    Нелинейная пространственная фильтрация
        В результате применения линейных сглаживающих фильтров
происходит подавление шумов, но одновременно размываются границы
между областями с разной амплитудой сигнала. Для уменьшения «смаза»
границ разработаны различные нелинейные фильтры. Как и линейные
КИХ фильтры, нелинейные фильтры работают в скользящем окне. Но, при
линейной фильтрации вычисляется линейная комбинация отсчетов
сигнала, а при нелинейной фильтрации выполняются нелинейные
преобразования отсчетов сигнала в определяемой маской фильтра
окрестности элементов.
              6.1.2.1 Сигма-фильтр
        Сигма-фильтр предназначен для подавления шумов в изображении с
сохранением контуров (резких границ областей) [43]. Центральный
элемент маски замещается взвешенным средним значением, вычисленным
только по тем амплитудам отсчетов, значения которых попадают в ± kσ -
область относительно яркости центрального элемента. σ выбирается либо
как СКО подавляемого шума, либо как СКО в маске, либо устанавливается
равной СКО, полученному по всему изображению:
g ( x , y ) = ∑ h(s ,t ) f ( x − s , y − t ) ,                   (6.11)
          s ,t∈S
где S-окрестность составляют те значения координат маски, в которых
выполняется наложенное условие:
                                  67


S = {(s ,t ) : f ( x − s , y − t ) − f ( x , y ) ≤ kσ},            (6.12)
h(s , t ) -КИХ линейного сглаживающего фильтра, подобного (6.3).
       При k = 2 диапазон заменяемых значений составляет ± 2σ , в случае
нормального распределения шума вероятность попадания амплитуды за
пределы диапазона равна 4,55%.
       Фильтры, основанные на порядковых статистиках, также относятся к
нелинейным фильтрам. Наиболее эффективными по совокупности
воздействий: сглаживания шума на однородных участках изображения,
сохранения скачков изменения яркости, минимального искажения формы
границы, подавления импульсного шума, вычислительной эффективности
является медианный фильтр.
     6.1.2.2     Медианный фильтр
    Медианный фильтр (МФ) (предложен Тьюки в 1974 г.) заменяет
центральный элемент маски медианой упорядоченной (по невозрастанию
или по неубыванию амплитуды) выборки, сформированной из всех
амплитуд отсчетов, покрываемых маской фильтра. При применении МФ
происходит последовательная обработка каждой точки кадра, в результате
чего образуется последовательность оценок. При медианной фильтрации
используется скользящее двумерное окно. В принципе, для каждого
отсчета выполняется независимая оценка медианы в окне. В целях
ускорения оценки целесообразно алгоритмически на каждом шаге
использовать        ранее           выполненные     вычисления.   Размер   окна
устанавливается нечетным и равным m × n . Отсчеты изображения,
оказавшиеся в пределах окна, образуют рабочую выборку текущего
отсчета. Если упорядочить последовательность { f i , i = [1,mn] } по
неубыванию, то ее медианой будет тот элемент выборки, который
занимает      центральное               положение     в    этой   упорядоченной
последовательности. Этот элемент является (mn + 1) / 2 наибольшим и
(mn + 1) / 2 наименьшим значением в выборке и определяет результат
медианной фильтрации для текущей точки кадра. Введем формальное
обозначение описанной процедуры в виде:
g med = med( f1 , f 2 ,..., f n ) .                                       (6.13)
    Рассмотрим             пример.         Предположим,     что   упорядоченная
последовательность             Y      в    окне   размером    3x3  имеет    вид:
Y={99,140,97,150,255,155,158,99,175}, где элемент 255 соответствует
центру окна ( x , y ) . Большое значение яркости в этой точке кадра является
результатом воздействия импульсной помехи. Упорядоченная по
неубыванию выборка имеет вид: {97,99,99,140,150,155,158,175,255},
следовательно, в соответствии с процедурой (6.13), на выходе медианного
фильтра получаем g med =150. Видим, что учет яркостей элементов
окрестности при фильтрации в текущей точке привел к подавлению
импульсной помехи. Если импульсная помеха не является точечной, а
занимает некоторую область, то она также может быть подавлена, если
                                      68


размер этой локальной области будет меньше, чем половина размера
апертуры МФ. Поэтому для подавления импульсных помех, поражающих
локальные участки изображения, следует увеличивать размеры апертуры
МФ.
    Из (6.13) следует, что действие МФ состоит в “игнорировании” как
положительных, так и отрицательных выбросов значений входной
выборки. Такой принцип подавления помехи может быть применен и для
ослабления шума на изображении. Однако исследование подавления шума
при помощи медианной фильтрации показывает, что ее эффективность при
решении этой задачи ниже, чем у линейной фильтрации. Медианная
фильтрация лучше сохраняет границы изображения, чем любая линейная
фильтрация. Механизм этого явления очень прост и заключается в
следующем. Предположим, что окно фильтра находится вблизи границы,
разделяющей светлый и темный участки изображения, при этом его центр
располагается в области темного участка. Тогда рабочая выборка будет
содержать большее количество элементов с малыми значениями яркости,
следовательно, и медиана будет находиться среди элементов с малыми
значениями яркости. И наоборот, если центр окна смещен в область более
высокой яркости, то и медиана будет находиться в области более высокой
яркости. Это позволяет при применении МФ сохранить перепады яркости.
    Медианные фильтры подавляют импульсные шумы. К таким шумам
относится и шум типа «соль и перец», отсчеты которого имеют значения,
соответствующие максимальному («соль») и минимальному («перец»)
уровням квантования в сигнале изображения. Резкие изменения амплитуды
сохраняются медианным фильтром, а импульсная помеха, размер которой
≤ mn / 2 , таким фильтром подавляется. Однако при увеличении маски
фильтра можно потерять информацию о малоразмерных областях
изображения и произвести искажение границ областей, особенно в
угловых положениях. На рисунке 6.4 приведен синтезированный пример,
иллюстрирующий исчезновение линии толщиной 1 элемент на
изображении, полученном после применения медианного фильтра
размером 3× 3 .




    а)б)в)
Рисунок 6.4 Применение медианного фильтра с окном 3× 3 элемента. а)
исходное изображение; б) выходное изображение; в) изображение разности
изображений а) и б).

                                 69


    Несмотря на подавление сигнала и в некоторых других областях
(черные точки на разностном изображении рисунке 6.4 в) границы
областей не размыты.
    Цифровое цветное изображение, представленное в RGB цветовом
координатном пространстве, является трехкомпонентным двумерным
сигналом. Каждый элемент цифрового растрового цветного изображения
размера MxN может быть представлен вектором:
C(x,y)=[R(x,y),G(x,y),B(x,y)],
где x- номер столбца, y- номер строки, x ∈ [0 , N − 1] , y ∈ [0 , M − 1] . R(x,y),
G(x,y), B(x,y)- R, G, B-компоненты элемента с координатами растра (x,y).
     При создании векторных медианных фильтров вводят меру
расстояния между векторами [44]. Функция расстояния между двумя
векторами Ci и Cj в пространстве RGB в общем виде задается формулой:
                                             1/ γ
                  ⎛ 3          γ⎞
d ij = Ci − C j = ⎜ ∑ Cik − C k ⎟ ,
               γ ⎜            j ⎟
                  ⎝ n =1        ⎠
где k- номер компонента вектора, γ - характеристика метрики.
     В случае евклидова расстояния (метрика L 2 , γ =2)
                                   2                     2               2
d ij = C i − C j = ( Ri − R j ) + (Gi − G j ) + ( Bi − B j ) . (6.14)
      Множество входных векторов в скользящем окне фильтрации
обозначим
W = {C 0 , C1 ,..., C p −1} ,
где C = ( Ri ,Gi ,Bi ) , i ∈ [0 , p − 1] .
       i
Расстояние для j-го вектора оценивается как сумма расстояний от j-го
вектора до каждого из векторов в окне:
       p −1
Dj =   ∑ d ij .                                                                         (6.15)
       i =0
Последовательность расстояний                   {D0 , D1 ,..., D p −1}       упорядочивают по
возрастанию, и в качестве отклика фильтра используют вектор C i ,
соответствующий минимальному расстоянию Di = min { D j }. Другие
                                                                              j
медианные векторные фильтры отличаются мерой расстояний и весовыми
функциями, используемыми для взвешивания суммы в (6.15).
    Другой подход основан на каскадной схеме многоканальной
фильтрации, которая позволяет подавить импульсную помеху и в большей
степени сохранить границы объектов, поскольку МФ выполняется в
направлении границы и в минимально возможном окне [45].
    Поскольку применение МФ приводит все же к подавлению ВЧ
изображения, вызывая размывание краев и текстур, в настоящее время
получают все большее развитие схемы адаптивной фильтрации [28,46],

                                                    70



    
Яндекс цитирования Яндекс.Метрика