Единое окно доступа к образовательным ресурсам

Основы кодирования сообщений в системах связи: Методические указания к выполнению лабораторных работ N1-4

Голосов: 1

Методические указания к выполнению лабораторных работ посвящены актуальному для систем связи вопросу кодирования текстовых сообщений. Дается теоретическое описание различных вариантов кодов. Рассматривается порядок выполнения лабораторных работ. Предназначены для радиотехнических специальностей всех форм обучения. Подготовлены кафедрой радиотехнических систем и рекомендованы к изданию редакционно-издательским советом Санкт-Петербургского государственного университета аэрокосмического приборостроения.

Приведенный ниже текст получен путем автоматического извлечения из оригинального PDF-документа и предназначен для предварительного просмотра.
Изображения (картинки, формулы, графики) отсутствуют.
          1. 2. Основные характеристики цифровых систем связи

                     Достоверность передачи информации
   Система связи должна обладать помехоустойчивостью, т. е. способ-
ностью восстанавливать с достаточной верностью переданное сообще-
ние при приеме сигнала, искаженного помехой, поступающей от раз-
личного рода источников помех (рис. 1.2). При приеме цифровой ин-
формации регистрируется последовательность импульсов, составляю-
щая кодовое слово. Если в результате воздействия помех принятое ко-
довое слово не будет соответствовать переданному, то получателю с
выхода декодирующего устройства при простом кодировании выдается
искаженное сообщение.
   Для количественной оценки соответствия принятого сообщения пе-
реданному используют отношения чисел ошибочно принятых элемен-
тов сообщения Мош к общему числу переданных элементов Мобщ
                                М
                         К ош = ош .                             (1.2)
                                М общ
   Следует различать достоверность, обеспечиваемую каналом связи
(на разряд), и системой связи (на кодовое слово или группу слов).
   Отношение (1.2) называют частостью ошибок или коэффициентом
ошибок. При ограниченном времени передачи величина Кош является
случайной и зависит от этого времени. Однако если общее время переда-
чи информации (сеанс связи) значительно и статистические характерис-
тики процесса передачи при этом неизменны (стационарный канал свя-
зи), то величина Кош остается устойчивой и почти не меняется от сеанса
к сеансу. Практически такие условия во многих случаях выполняются.
Поэтому в первом приближении коэффициент ошибок можно считать
близким к вероятности ошибки приема одного элемента сообщения p1.
   В связи с этим достоверность передачи цифровой информации, как
правило, и оценивается величиной вероятности ошибочного приема p1
одного элемента сообщения. Из-за своей простоты и удобства оценка
качества передачи цифровой информации по допустимому значению p1
нашла наиболее широкое применение.
                   Скорость передачи информации
    При передаче цифровой информации различают два понятия скоро-
сти передачи: техническую и информационную.

                                                                     9


   Техническая скорость характеризует быстродействие аппаратуры,
входящей в состав передающей части системы связи. Она определяется
количеством элементов дискретного сообщения, переданных в секун-
ду. Эта характеристика была предложена в телеграфии французским
инженером Жаном Бодо. В его честь единица технической скорости на-
звана бодом.
   Техническая скорость передачи определяется величиной
                               1
                          B=      бод,                         (1.3)
                               τ0
где τ0 – длительность посылки одного элемента дискретного сообще-
ния.
    Техническую скорость передачи часто называют скоростью мани-
пуляции (модуляции). Зная продолжительность единичного интервала
τ0, легко определить скорость манипуляции В и наоборот. Так, при
В = 1000 бод = 1к бод → τ0 = 1 мс, или при τ0 = 20 мс → B = 50 бод.
     Наряду с технической скоростью передачи, в теории информации
широко применяются понятия информационной скорости передачи и
пропускной способности канала связи. Под информационной скорос-
тью понимают количество информации, поступившее по линии связи
от источника информации к получателю за одну секунду. Информаци-
онная скорость измеряется числом двоичных единиц (бит) в секунду.
Термин «бит» происходит от английского названия двоичной еди-
ницы – binary digit. Скорость передачи информации зависит от це-
лого ряда факторов: технической скорости передачи, статистических
свойств источника, типа канала связи, применяемых сигналов, уровня
помех и вида искажений сигналов в канале.
    Потенциальные возможности канала характеризует его пропускная
способность, которая определяется как верхняя граница (или максимум)
скорости передачи информации [1, разд. 2.3 и 4.2].
    Необходимо отметить отличие в понятиях пропускной способности
канала (информационной скорости) и технической скорости (скорости
манипуляции). Пропускная способность характеризует быстродействие
канала с информационной точки зрения, а скорость манипуляции – тех-
нические возможности аппаратуры. Пропускная способность является
основной характеристикой при решении задачи согласования канала
связи с источником сообщений.

10


   Конкретные значения скорости передачи цифровой информации и
вероятности ошибки существенно зависят от типа канала связи, вида
сигнала и его энергии, уровня помех в канале, требований к качеству
передачи и т. п.
   Так, при передаче команд, как правило, предъявляются очень высо-
кие требования к достоверности и сравнительно невысокие требования
к скорости передачи (вероятность искажения команды иногда не
должна превышать 10–6–10–8, а время передачи команды может быть
значительным – порядка секунды). Дискретные команды в некоторых
системах управления должны обладать высокой криптостойкостью (не
поддаваться быстрой расшифровке) и имитостойкостью (обладать свой-
ствами, затрудняющими повторение команд с целью нарушения нор-
мальной работы управления).
   При передаче цифровых последовательностей, полученных дискре-
тизацией непрерывных сообщений, требования к достоверности пере-
дачи ниже, чем при передаче команд, и допустимая вероятность ошиб-
ки кодовой комбинации обычно составляет 10–3–10–5. Зато требования
к скорости передачи существенно выше, и скорость может достигать
значений в десятки и сотни тысяч двоичных единиц в секунду, а в со-
временных цифровых системах связи доходит до десятков миллионов
двоичных единиц в секунду.
                 1.3. Основные параметры кодов
   Коды характеризуются следующими основными параметрами.
   Основание кода (модуль) m определяется числом отличающихся друг
от друга символов в алфавите. Простейший число-импульсный унитар-
ный код имеет алфавит, состоящий из одних единиц, и применяется,
например в АТС для вызова абонента по телефону с помощью телефон-
ного диска (номеронабирателя).
   Все другие коды имеют алфавит, состоящий из двух ("0" и "1") и
более символов, отличающихся друг от друга. Коды с основанием m = 2
называются двоичными, с основанием m = 3 – троичными и т. д. При
использовании в процессе кодирования электрических импульсов зна-
чение m определяет число различных градаций их амплитуды, фазы,
частоты или других так называемых избирающих признаков.
   В системах связи двоичная система счисления и двоичные коды по-
лучили наиболее широкое применение, главным образом, из-за сравни-
тельно простой аппаратурной реализации логических операций и арифме-
                                                                  11


тических действий, а также устройств для передачи, опознавания и
запоминания сообщений.
   Преобразование сообщения в сигнал при двухпозиционных кодах
производится с помощью простых электронных схем-триггеров, кото-
рые могут находиться только в одном из двух устойчивых состояний: 0
и 1. Устройства с тремя состояниями реализуются значительно слож-
нее, поэтому многоосновные коды с основанием m > 2 применяются
значительно реже.
   Длина кодовой комбинации – n, называется разрядностью кода или
длиной слова, n равно количеству символов (элементарных сигналов) в
кодовой комбинации. Для конкретного заданного кода имеется свое мно-
жество (набор) кодовых комбинаций, каждая из которых соответствует
передаче отдельного дискретного сообщения первичного алфавита ис-
точника сообщений. Код называется равномерным, если все кодовые
комбинации одинаковы по длине (n = const), и неравномерным, если
величина n в коде непостоянна (n = var).
   Неравномерность в длине кодовых комбинаций усложняет построе-
ние автоматических преобразующих устройств (наборных, буквопеча-
тающих и др.), а также исключает возможность разделения кодовых ком-
бинаций при их последовательном приеме без применения специаль-
ных разделительных символов между ними. Поэтому для упрощения
работы декодирующих устройств предпочтительнее иметь одинаковое
число элементов в каждой кодовой комбинации.
   Число кодовых комбинаций – N в коде, каждая из которых может пе-
редавать свое отдельное сообщение. Значение N для кода с основанием
m и числом элементов n определяется выражением
                            N = mn .                           (1.4)
   Совокупность кодовых комбинаций называется кодовым словарем.
   Если все возможные комбинации n-элементного кода используются
для кодирования сообщения, то такой первичный код называется пол-
ным, а также простым или обыкновенным (иногда такой код называют
примитивным). Основным назначением первичных кодов является пред-
ставление дискретной информации источника сообщений в цифровой
форме.
   Помимо первичных кодов в цифровых системах передачи информа-
ции находят применение корректирующие коды, позволяющие обнару-
живать и исправлять ошибки, вызванные помехами в канале связи. В

12


соответствии с этим корректирующие коды получили название – поме-
хоустойчивые коды.
   Сущность построения корректирующих (помехоустойчивых) кодов
состоит в том, что из общего числа кодовых комбинаций N, которые
можно получить при n-элементном коде (для двоичного кода N = 2n),
для передачи сообщений выбирается меньшее число N0 < N комбина-
ций, называемых разрешенными. Остальные N – N0 комбинаций, назы-
ваемые запрещенными, не используются для передачи сообщений, что
приводит к избыточности в коде.
   Избыточность кода, в котором используются только N0 кодовых ком-
бинаций из общего возможного числа N, характеризуется коэффициен-
том избыточности, определяемым выражением
                          log 2 N 0     n    n − n0
                 χ = 1−             = 1− 0 =        ,            (1.5)
                           log 2 N       n     n
где n – число разрядов данного кода; n0 – число разрядов неизбыточно-
го (полного) кода, у которого N0 такое же, как у данного кода (n > n0).
   Коды, обладающие большей избыточностью, имеют и большую по-
мехоустойчивость. Увеличение избыточности приводит к уменьшению
пропускной способности системы связи, так как значительно возраста-
ет число элементов т в кодовых комбинациях. Поэтому выбор кодов с
определенными корректирующими возможностями, а следовательно, и
с определенной избыточностью, должен быть всегда строго обоснован,
исходя из характера распределения ошибок в канале связи и получения
необходимой достоверности принимаемой информации [1, разд. 5.1].
   Кодовое расстояние – d определяется количеством разрядов, в кото-
рых одна кодовая комбинация данного кода отличается от другой.
   Для двоичного кода кодовое расстояние определяется количеством
ненулевых разрядов при суммировании по модулю 2 двух сравнивае-
мых кодовых комбинаций.
   Пример
   Кодовая комбинация       №1 –         00101
                                     ⊕
   Кодовая комбинация      №2 –          11110

   Кодовое расстояние      d=4 }         11011


                                                                    13


    Минимальное кодовое расстояние – dmin равно наименьшему числу не
совпадающих по значению одноименных разрядов при попарном сравнении
всех N комбинаций кода. Для двоичного кода dmin – это наименьшее количе-
ство ненулевых разрядов в сумме по модулю 2 всех пар кодовых комбина-
ций. Впервые понятие кодового расстояния ввел в теорию кодирования
Р. Хемминг, поэтому dmin называют хемминговым расстоянием.
    Для полных, простых кодов (1.4) всегда dmin = 1.
   Пример
   Кодовая комбинация i-я                 00100
                                      ⊕
   Кодовая комбинация (i + 1)-я           00101

                         dmin = 1 }       00001

   Очевидно, что при построении корректирующего кода желательно
выбирать разрешенные кодовые комбинации таким образом, чтобы хем-
минговы расстояния между ними были как можно большими. Коррек-
тирующие коды могут обеспечивать решение задач обнаружения оши-
бок и исправления ошибок, возникших при передаче кодовых комбина-
ций по каналам связи.
   Корректирующие возможности избыточных кодов полностью харак-
теризуются именно величиной кодового расстояния dmin. Если код ис-
пользуется только для обнаружения ошибок кратностью gобн, то необ-
ходимо и достаточно, чтобы
                        dmin ≥ g обн + 1.                        (1.6)
   Кратностью ошибки g называют число позиций кодовой комбина-
ции, на которых под действием помехи одни символы оказались заме-
ненными на другие, например 0 на 1 или 1 на 0. С учетом (1.6) условие
обнаружения всех ошибок кратностью gобн записывается в виде
                         gобн ≤ dmin – 1.                        (1.7)
   Чтобы можно было исправить все ошибки кратностью gиспр и менее,
необходимо иметь большее минимальное расстояние, удовлетворяю-
щее условию
                        dmin ≥ 2gиспр + 1.                       (1.8)
   В этом случае любая кодовая комбинация с числом ошибок g отлича-
ется от каждой разрешенной комбинации не менее, чем в g + 1 позици-
14


ях. Условие исправления всех ошибок кратностью не более gиспр можно
записать в виде
                                 d −1
                         g испр ≤ min  .                       (1.9)
                                    2
   Корректирующие коды можно одновременно использовать и для об-
наружения и для исправления ошибок [1, разд. 5].
   Вес кода (кодовой комбинации) – W определяется для двоичного кода
количеством единиц в данной кодовой комбинации.
   Пример
   Кодовая комбинация – 01111 –         W = 4.
   Кодовая комбинация – 10000 –         W = 1.
   Взвешенность кода – соответствие символов кода весовым коэффи-
циентам системы счисления. Для любой системы счисления произволь-
ное число N записывается в виде значений коэффициентов ki ряда
                   n −1
             N=    ∑ ki mi = kn −1 mn−1 + ... + k1 m1 + k0 m0 ,                (1.10)
                   i=0
где N – число разрядов кода; k – весовой коэффициент (0 ≤ ki ≤ m–1).
                                       Характеристики кодов

                                               Двоичное
       Основание
                                  Недвоичное (многоосновной код)

                                 Постоянная (неравномерные коды)
           Длина
       (разрядность)
                                 Непостоянная (неравномерные коды)

                                        С полным использованием комбинаций
          Закон                                (безызбыточный код)
      комбинирования
                                                   (избыточный код)

                                   С обнаружением                  С исправлением
          Правило                      ошибок                          ошибок
       сопоставления
         сообщений                      Взвешенные коды
        с кодовыми
       комбинациями                     Невзвешенные коды


                                    Рис. 1.3

                                                                                    15


   Если в основу правил соответствия кодовых комбинаций числам по-
ложены математические системы счисления (1.10), то такие коды назы-
ваются арифметическими или взвешенными.
   Так, десятичное число 14 (по модулю 10) запишется в двоичной
системе (по модулю 2) следующим образом:
   14(mod 10) = 1 × 23 + 1 × 22 + 1 × 21 + 0 × 20 = 8 + 4 + 2 + 0 = 1110 (mod 2),
где ki принимает только два значения: 0 и 1.
   Примером взвешенного кода является натуральный двоичный код
(НДК), в котором все кодовые комбинации соответствуют последова-
тельности чисел десятичной системы счисления. Примером невзвешен-
ного кода является рефлексный двоичный код (РДК) Грея.
   Классификация основных характеристик кодов приведена на рис. 1.3.
                   1.4. Первичные стандартные коды
   К системам передачи дискретных сообщений относится система те-
леграфной передачи – самый старый вид электрической связи. Изобре-
тателем электрического телеграфа был член-корреспондент Петербург-
ской Академии наук П. Л. Шиллинг. Построенная им в 1832 г. линия
телеграфной связи содержала многие элементы, используемые и в на-
стоящее время.
   Продолжателем работ П. Л. Шиллинга был другой русский ученый
академик Б. С. Якоби – изобретатель первого в мире буквопечатающе-
го телеграфного аппарата (1850 г.). Им же впервые осуществлена пере-
дача телеграфных сигналов по одному проводу и разработан принцип
синхронной передачи.
   Наибольшую известность и распространение получил код, предназна-
ченный для передачи телеграфных сообщений, предложенный в 1837 г.
американским изобретателем С. Морзе. Код Морзе, достаточно широко
применяемый и до настоящего времени, является неравномерным, т. е.
его комбинации содержат различное число знаков. В этом коде элемен-
ты кодовых комбинаций "1" и "0" используются в двух сочетаниях: как
одиночные (0 и 1) или как тройные (111 и 000). Сигнал, соответствую-
щий одной единице, называется точкой, трем единицам – тире. Нуль
используется как элемент, отделяющий один знак от другого. Совокуп-
ность трех нулей завершает каждую кодовую комбинацию, что позволя-
ет просто отделять одну кодовую комбинацию (букву) от другой. Таким
образом, комбинация "000" является своеобразным маркером, обеспе-
16


чивающим фазирование по циклам [1, разд. 6]. Неоптимальность, а сле-
довательно, и избыточность кода Морзе заложены в самой структуре
построения кода и, в первую очередь, в наличии маркера "000".
   Очевидно, что для сокращения времени передачи необходимо при-
своить наиболее часто встречающимся буквам в передаваемом тексте
более короткие кодовые комбинации и наоборот. Именно по этому прин-
ципу и был построен код Морзе: он основан на статистике букв в анг-
лийском языке.
   Статистика букв в русском языке, естественно, другая (максималь-
ная вероятность появления буквы "О" равна 0,090, а минимальная –
буквы "Ф" – 0,002), поэтому можно было бы улучшить код Морзе, пе-
реставив обозначения букв в соответствии с частотой их появления. По
подсчетам А. А. Харкевича, построение модернизированного кода Мор-
зе для русского языка позволило бы сократить среднюю длину кодовых
комбинаций с 9,96 до 9,17 элементов (на 8%), т. е. полученная от этого
экономия времени передачи была бы незначительна. Поскольку для пе-
редачи одного элемента кодовой комбинации (0 или 1) необходимо вре-
мя τ0, то общее время передачи каждого знака будет существенно разли-
чаться. Так, самая короткая комбинация кода Морзе (буква "Е" – одна
точка) по продолжительности равна 4τ0 (с учетом одного пробела – 000),
а самая длинная (буква "Ш") – 18τ0. Большая неравномерность кода Мор-
зе является его серьезным недостатком.
   К положительным свойствам кода Морзе следует отнести высокую
помехоустойчивость и возможность приема на слух. Высокая помехоус-
тойчивость кода Морзе обусловлена его большой избыточностью. При
приеме на слух (за счет модуляции посылок тональной частотой) высо-
кая достоверность принимаемой информации объясняется тем, что про-
цесс преобразования сигнала в знак осуществляется человеком, кото-
рый при достаточном опыте может различать сигналы, значительно ис-
каженные помехами. Кроме того, при ручной манипуляции телеграф-
ным ключом передача ведется со сравнительно небольшой скоростью
манипуляции В = 10 – 20 бод (1.3).
   Для устранения недостатка, связанного с неравномерностью кода,
французский инженер Ж. Бодо в 1874 г. предложил для телеграфной
связи использовать двоичный равномерный пятиэлементный код. Учи-
тывая заслуги Бодо в области телеграфии, Международный консульта-
тивный комитет по телефонии и телеграфии (МККТТ) в 1927 г. поста-
новил единицу скорости манипуляции (1.3) называть в его честь бодом.
                                                                    17


Если в секунду передается один элементарный импульс, то скорость
передачи равна 1 боду.
   Поскольку пятиэлементный двоичный код позволяет получить толь-
ко 32 кодовые комбинации (25 = 32), а число необходимых кодовых ком-
бинаций для передачи различных букв, цифр и знаков равно 56, то при
использовании кода Бодо применяется двухрегистровый режим работы.
При этом весь первичный алфавит (буквы, цифры, знаки) разделяется
на две равные группы (два регистра), в каждой из которых оказывается
по 28 символов алфавита. Каждому регистру приписывается специаль-
но выделяемая кодовая комбинация, которая является его признаком (ад-
ресом). При переходе от одного регистра к другому производится смена
адреса, и те же самые кодовые комбинации используются теперь для
передачи величин, входящих в состав второго регистра.
   В тех случаях, когда структура передаваемых сообщений такова, что
переходы с одного регистра на другой и обратно используются сравни-
тельно редко, среднее время, требуемое для передачи одного знака со-
общения при пятиэлементных кодовых комбинациях, оказывается мень-
шим по сравнению с использованием непосредственно шестиэлемент-
ного кода (26 = 64).
   В конце XIX века американский инженер Д. Муррей предложил дво-
ичный пятиэлементный код, который отличался от кода Бодо тем, что
для наиболее часто встречающихся букв и знаков использовались кодо-
вые комбинации с наименьшим числом ненулевых разрядов. Такой код
позволил уменьшить нагрузку на телеграфную аппаратуру и повысить
надежность ее работы.
   Коды Бодо и Муррея многие годы применялись на телеграфных ли-
ниях связи. Кроме того, находили применение и некоторые другие раз-
новидности двоичных пятиэлементных кодов. В условиях быстрого раз-
вития телеграфной связи применение различных кодов препятствовало
унификации телеграфной аппаратуры и затрудняло развитие междуна-
родных телеграфных линий связи. В конце 20-х гг. ХХ века назрела
необходимость в стандартизации телеграфного кода.
   В 1931 г. МККТТ принял стандартный код 1, в основу которого по-
ложен код Бодо. В 1932 г. был принят стандартный код 2, в основу кото-
рого положен код Муррея.
   Для телеграфных аппаратов с русско-латинским алфавитом был раз-
работан вариант Международного телеграфного кода 2 (МТК-2). Таб-
лица этого равномерного 5-элементного кода составлена так, чтобы на
18



    
Яндекс цитирования Яндекс.Метрика