Новости науки | ||||
15.10.02. Код ДНК и обнаружение ошибок. | ||||
В компьютерной технике используется множество различных
схем для проверки отсутствия ошибок в отдельных порциях информации (сообщение,
запись в базе данных, команда на исполнение и т.п.). Они должны обнаруживать в
поврежденных данных замену 0 на 1 или 1 на 0. Такие процедуры обычно основаны
на добавлении одного или более бит к последовательности данных для индикации
ошибки. В простом двоичном тесте четности дополнительный бит показывает,
является ли общее число единиц в данной последовательности четным (1) или
нечетным (0). Например, в последовательности 1001 0100 общее число "1" -
нечетное, поэтому добавочный бит должен быть 1, и новая последовательность
будет 1001 0100 1. Если произойдет изменение одного бита, количество "1" больше
не будет нечетным и соотношение бит станет неправильным, что и позволит
обнаружить ошибку.
Цепочки дезоксирибонуклеиновой кислоты (ДНК) также несут информацию -
генетическую - зашифрованную в их химической структуре. Химик Donall A.
MacDonail из Ирландии продемонстрировал недавно, что отличительные
характеристики химического состава ДНК соответствуют цифровому коду обнаружения
ошибок.
Единичная нить ДНК состоит из цепочки простых молекул, так называемых
азотистых оснований, связанных с углеводно-фосфатным остовом. В ДНК
присутствуют четыре разновидности оснований: аденин (А), тимин (Т),
гуанин (Г) и цитозин (Ц), образующие так называемый нуклеотидный алфавит.
Отдельная нить ДНК прочно связывается с комплементарной (то есть
соответствующей) нитью, при этом Т спаривается с А, а Г - с Ц.
Например, участок ДНК, состоящий из последовательности ТАГЦЦ, будет связываться
с комплементарной ему последовательностью АТЦГГ в другой цепочке ДНК.
Водородные связи между парами оснований ответственны за соединение двух нитей
ДНК между собой для формирования характерной двойной спирали ДНК. Аналогичный
механизм вступает в действие и при считывании информации, хранящейся в ДНК, с
целью синтеза белков или для удвоения информации при делении клетки. Процесс
формирования водородных связей между нуклеотидами носит в высшей степени
селективный характер. Эти связи формируются между характерными химическими
группами, называемыми донорами (атомы водорода) и акцепторами (атомы азота и
кислорода).
Если перейти на язык цифр, то оказалось, что донорно-акцепторная
характеристика каждого азотистого основания может быть представлена в виде
строки из трех бит. Например, если группу со свойствами донора обозначить как 1,
а акцептора - 0, то последовательность 100 будет соответствовать Ц, а 011 - Г.
В то же время А и Г принадлежат к группе химических соединений,
называемых пуринами, а Т и Ц - пиримидинами. Если продолжить перевод химических
свойств на цифровой язык и пурины обозначить как 0, а пиримидины как 1, то
полный код для Ц будет 100,1, а для Г - 011,0. Всего имеется 16 возможных
сочетаний для последовательности из 4-х битов, нуклеотидам же, входящим в состав
ДНК, соответствуют только 4 из них. Однако код любого из азотистых оснований,
как оказалось, имеет в своем составе четное количество "1". В терминах
информатики шифр каждого основания - это кодовое слово, при этом все кодовые
слова характеризуются совершенно одинаковой четностью. Код, в котором все
кодовые слова имеют одинаковую четность, называется кодом четности и имеет
более высокую устойчивость к появлению ошибок. В этом случае нет необходимости
добавлять новый бит для индикации ошибки, поскольку сам код способен выполнять
функцию их обнаружения.
Таким образом, кажется очевидным, что пурин-пиримидиновая природа
азотистых оснований лежит в основе их донорно-акцепторных характеристик как
код четности.
Science News 2002, Vol. 162, No. 12
По материалам
Science News Online
| ||||
|