|
Числа Фибоначчи и генетический код Исходные данные о генетическом коде Среди понятий биологии, хорошо формализованных и имеющих уровень общенаучной значимости, генетический код занимает особое место. Воспользуемся данными о генетическом коде, приведенными в замечательной книге "Бипериодическая таблица генетического кода и число протонов" (2001 г.), написанной известным русским ученым Сергеем Валентиновичем Петуховым, работающим на стыке биологии и математики.
Установление наукой ныне широко известного факта поразительной простоты основных принципов кодирования наследственной информации в живых организмах относится к числу важнейших открытий человечества. Эта простота заключается в том, что наследственная информация кодируется текстами из трехбуквенных слов - триплетов или кодонов, составленных на базе алфавита из четырех букв - азотистых оснований А (аденин), С (цитозин), G (гуанин), T (тимин). Данная система записи по существу едина для всего необозримого множества разнообразных живых организмов и называется генетическим кодом. Хранителем триплетов генетического кода является всем известная "двойная спираль" Уотсона-Крика, представляющая молекулу ДНК, состоящая из двух взаимосвязанных параллельных цепей. Стандартизованные звенья этих цепей называются нуклеотидами. Вдоль каждой из цепей расставлены - по одному на каждый нуклеотид - указанные выше азотистые основания A, C, G и Т. При этом для двух цепей ДНК выполняется так называемое условие комплементарности: против основания А в одной цепи всегда стоит Т в другой, а против основания G всегда стоит С. С помощью трехбуквенных триплетов или кодонов осуществляется кодирование 20 аминокислот. Различных комбинаций по три основания из четырех существует 43 = 64. В этой связи некоторые из 20 видов аминокислот кодируются сразу несколькими триплетами. Это называется вырожденностью кода. Нахождение соответствия между триплетами и аминокислотами (или знаками пунктуации для считывания) обычно трактуется как расшифровка генетического кода. Рибонуклеиновая кислота (РНК) выполняет роль "посредника" в синтезе белков из аминокислот 20 видов в соответствии с последовательностью триплетов в цепях ДНК. Известным отличием РНК от ДНК является то, что стандартный набор азотистых оснований ее триплетов содержит вместо тимина (Т) очень сходный и родственный с ним урацил (U), а потому четырехбуквенный кодовый алфавит у РНК состоит из набора А, С, G, U. Азотистые основания в ДНК и РНК относятся к двум различным химическим классам - пиримидиновому и пуриновому. Пиримидиновыми основаниями являются цитозин С и урацил U (или тимин Т), а пуриновыми - аденин А и гуанин G. Под действием азотистой кислоты наблюдаются закономерные мутации РНК, связанные с заменой оснований: A ® G, C ® U. Таким образом, основания А и С являются изменяющимися, а G и U - неизменяющимися. Белки или протеины - это основной плотный компонент живого организма. Каждый из белков выполняет только свою, свойственную ему функцию. Белки представляют собой крупные полимерные молекулы, состоящие из цепей аминокислот (полипептидов), нерегулярно чередующихся. Все аминокислоты в белках соединены друг с другом однотипной химической связью, получившей название пептидной связи. Молекулу белка часто сравнивают с поездом, состоящим из вагонов двадцати различных видов, которые сцеплены друг с другом одним и тем же способом, позволяющим соединять вагоны в любом порядке. Бипериодическая Таблица генетического кода Множество из 64 триплетов генетического кода представляет собой некоторую структурированную систему в силу того, что четыре азотистых основания генетического кода (А, С, G, U) подразделяются, во-первых на пары пуриновых и пиримидиновых оснований, во-вторых, на комплементарные пары и, в-третьих, на пары оснований мутирующих и не мутирующих под действием азотистой кислоты. По этой причине каждый триплет находится в некотором композиционном отношении ко всем другим триплетам. Задача содержательного упорядочения всего множества из 64 триплетов положена в основу исследования С.В. Петухова [], трактующего систему элементов генетического кода как ансамбль двоичных подсистем. Им описан принцип, согласно которому все триплеты закономерно размещаются в матрицу (8 ´ 8), обладающую двойной периодичностью. При этом все кодоны естественным образом нумеруются числами от 0 до 63, исходя из биохимических признаков бинарного типа у азотистых оснований. Бипериодическая таблица генетического кода В основу Бипериодической Таблицы (БТ) положен принцип "дважды триграммного упорядочения" множества кодонов. Он состоит из двух частей: упорядочения, членящего множество 64 триплетов на октеты, и упорядочения кодонов внутри всех этих октетов. Оба эти принципа имеют глубокое биохимическое обоснование. Первый принцип заключается в фиксации числа и очередности пуриновых и пиримидиновых оснований в триплетах. Например, рассмотрим подмножество триплетов, у которых первое основание является пиримидиновым (т.е. С или U), а второе и третье - пуриновыми (т.е. А или G). Легко проверить, что этому условию удовлетворяют следующие восемь (октет) триплетов: САА, САG, CGA, UAA, CGG, UAG, UGA, UGG. Если теперь каждое пиримидиновое основание обозначить через "1", а каждое пуриновое через "0", тогда каждому из указанных триплетов можно поставить в соответствие трехразрядное двоичное число 100, называемое "триграммным символом" (или просто "триграммой") данного октета. В БТ каждому такому октету соответствует отдельный столбец, отмеченный своей индивидуальной "триграммой". Поскольку существует восемь различных "триграмм", каждой из которых соответствует одна из трехразрядных двоичных комбинаций (000, 001, 010, 011, 100, 101, 110, 111), то в БТ может быть выделено восемь октетов, пронумерованных (слева направо) двоичными числами от 111 до 000. Важно отметить, что порядок следования столбцов в БТ (от 111 к 000) выбран таким образом, что октеты левой и правой половины БТ размещены зеркально-симметрично относительно ее средней линии так, что каждой триграмме левой половины (000, 001, 010, 011) соответствует "антисимметричная" триграмма (111, 110, 101, 100), занимающая зеркально-симметричную позицию в правой половине. Теперь проанализируем БТ по столбцам. Нетрудно увидеть, что здесь реализуется принцип упорядочения четырех азотистых оснований на пару С и А (соответствуют двоичному символу "1") и пару G и U (соответствует двоичному символу "0"). Оказывается, что в таком членении имеется глубокий биохимический смысл с точки зрения свойства мутагенности, так как нуклеотиды С и А являются максимально изменяющимися под действием азотистой кислоты, а два других нуклеотида G и U являются неизменяющимися. Тогда трехразрядным двоичным кодом 111 (первая строка БТ) можно обозначить все 8 триплетов, составленные только из "изменяющихся" нуклеотидов: ССС, ССА, САС, САА, АСС, АСА, ААС, ААА. Двигаясь вниз по столбцам БТ, мы будем получать триплеты, все менее чувствительные к действию азотистой кислоты. Действительно, трехразрядный двоичный код 110 (вторая строка БТ) будет соответствовать всем триплетам, в которых первые два нуклеотида соответствуют "изменяющимся" нуклеотидам (пара С и А), а последний нуклеотид соответствует паре А и G. Последняя строка БТ состоит из триплетов, соответствующих паре А и G ("неизменяющиеся" нуклеотиды) и ей соответствует двоичный трехразрядный код 000. При таком способе кодирования триплетов каждый кодон может быть однозначно представлен 6-разрядным двоичным кодом, который соответствует некоторому десятичному числу. Каждый такой 6-разрядный код состоит из двух трехразрядных частей, причем левая часть соответствует коду строки, в которой находится триплет, а правая часть - триграмме столбца, в которой находится кодон. Например, запись 101 110 соответствует кодону CUA. Если теперь запись 101 110 рассматривать как десятичное число 46, то это означает, что кодон CUA в БТ имеет номер 46. Анализ БТ генетического кода, проведенный С.В. Петуховым, привел к обнаружению новых удивительных системных свойств генетического кода и всем, кто хочет глубже познакомиться с проблемой, мы отсылаем к замечательной книге С.В. Петухова, которая открывает новые перспективы исследования проблемы генетического кодирования. Дополнительную информацию о ней можно найти на сайте http://members.tripod.com/vismath/sg/petoukhov.htm Некоторые полезные аналогии между кодом Фибоначчи и генетическим кодом Хотя "расшифровка" генетического кода была осуществлена еще в начале 60-х годов 20-го столетия, но исследования в этой области интенсивно продолжаются. Особенно важными можно считать такие приложения "генной инженерии" как создание "биокомпьютеров", основанных на ДНК. В этой связи весьма полезным является установление аналогий между генетическим кодом и способами кодирования, используемыми в современной информатики, в частности, с кодом Фибоначчи. Для установления аналогии с генетическим кодом рассмотрим 6-разрядный код Фибоначчи, в котором весами разрядов являются числа Фибоначчи 1, 1, 2, 3, 5, 8.
Таким образом, между 6-разрядным кодом Фибоначчи и генетическим кодом, основанном на триплетном представлении аминокислот, существуют весьма интересные аналогии, которые среди остальных способов избыточного кодирования выделяют код Фибоначчи в особый способ кодирования, изучение которого может способствовать раскрытию особенностей генетического кодирования. Можно высказать предположение, что подобные аналогии могут стать весьма полезными при решении проблемы создания био-компьютеров, основанных на ДНК. Бипериодическая таблица кода Фибоначчи Рассмотрим кодовую таблицу 6-разрядного кода Фибоначчи. В ней перечислены все двоичные комбинации от комбинации A0 = 000000 до комбинации A63 = 111111 и каждой кодовой комбинации (КК) поставлено в соответствие целое число N, соответствующее в коде Фибоначчи данной КК.
Если теперь выделить подмножества всех КК, соответствующих одному и тому же числу, то получим следующую картину.
Используя подход, изложенный в вышеупомянутой книге С. В. Петухова, можно построить бипериодическую таблицу (БТ) 6-разрядного кода Фибоначчи. БТ представляет собой квадратную таблицу размером 8 ´ 8. Каждой ячейке БТ соответствует некоторая 6-разрядная КК, состоящая из двух трехразрядных частей, младшей и старшей. Младшие части КК кодируют столбцы таблицы, а старшие - ее строки. Тогда КК находится в ячейке БТ, находящиеся на пересечении соответствующей строки и столбца, троичные коды которых образуют в совокупности код заданной 6-разрядной КК. Например, КК A51 = 110 011 находится в ячейке БТ, которая находится на пересечении строки, кодируемой как 110 и столбца, кодируемого как 011. Согласно приведенной выше кодовой таблице 6-разрядного кода Фибоначчи, каждой КК соответствует некоторое число в коде Фибоначчи. Например, КК A51 = 110 011 соответствует число 15. Тогда в соответствующую ячейку БТ мы должны записать КК вместе с соответствующим ей числом.
Ниже приведена эта же БТ кода Фибоначчи, в которой в ячейках таблицы оставлены только значения чисел, изображаемых КК.
ДНК SUPRA-код В 1990 г. Jean-Clode Perez, работавший в тот период научным сотрудником фирмы IBM, сделал весьма неожиданное открытие в области генетического кодирования. Он открыл математический закон, управляющий самоорганизацией оснований ТСАG внутри ДНК. Он обнаружил, что последовательные множества нуклеотидов ДНК организованы в структуры дальнего порядка, называемые "РЕЗОНАНСАМИ". "Резонанс" представляет собой особую пропорцию, обеспечивающую разделение ДНК в соответствии с числами Фибоначчи (1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, …). Как уже неоднократно рассматривалось в нашем Музее, это та же пропорция, которая управляет морфологией природных организмов таких, как сосновая шишка, кактус, ананас и т.д. Например, рассмотрим 144 соседних нуклеотидов ДНК, образующихся из 55 оснований типа Т и 89 оснований типа А, С. G; тогда пропорция (55-89-144) и представляет собой "резонанс".
Именно эта "фибоначчиева" пропорция является ключевой идеей открытия Jean-Clode Perez, названного "ДНК SUPRA-кодом". Суть ДНК SUPRA-кода состоит в следующем. Рассмотрим любой отрезок генетического кода, состоящий из базисов типа ТСАG, и пусть длина этого отрезка равна числу Фибоначчи, например, 144. Если число оснований типа Т в рассматриваемом отрезке ДНК равно 55 (число Фибоначчи) и суммарное число оснований типа А, С или G равно 89 (число Фибоначчи), то рассматриваемый отрезок генетического кода представляет собой "резонанс", то есть "резонанс" есть пропорция между тремя соседними числами Фибоначчи (55-89-144). При этом допустимы любые комбинации оснований, то есть С против АGT, А против ТСG, или G против ТСА. Открытие состоит в том, что ДНК состоит из множества "резонансов" рассмотренного вида, то есть, как правило, отрезки генетического кода длиной, равной числу Фибоначчи Fn, разбивается "золотым сечением на множество оснований типа Т, число которых в рассматриваемом отрезке генетического кода равно Fn-2, и суммарное множество остальных оснований, число которых равно Fn-1. Если произвести систематическое исследование всех возможных "фибоначчиевых" отрезков генетического кода, тогда получим некоторое множество "резонансов", называемое SUPRA-кодом ДНК. Начиная с 1990 г., указанная закономерность была многократно проверена и подтверждена многими выдающимися биологами, в частности профессорами Montagnier and Chermann, исследовавших ДНК вируса СПИДа. Что же лежит в основе биологического обоснования указанного закона? Автор открытия Jean-Clode Perez дает следующее объяснение этому феномену. Изучение чувствительности ДНК к шумам и незначительным изменениям показывает, что такой принцип построения ДНК является суперчувствительным к незначительным изменения. В результате возникает парадоксальное соответствие между СТАБИЛЬНОСТЬЮ и ЧУВСТВИТЕЛЬНОСТЬЮ. Несомненно, что рассматриваемое открытие относится к разряду выдающихся в области ДНК, определяющих развитие генной инженерии. По мнению автора открытия Jean-Clode Perez SUPRA-код ДНК является универсальным био-математическим законом, который указывает на высочайший уровень самоорганизации нуклеотидов в ДНК согласно принципу "золотого сечения". Проверка "Закона Jean-Clode Perez" В книге С.В. Петухова на с. 165-166 приведены последовательности триплетов в синтетических генах для a- и b-цепей инсулина. Для b-цепи эта последовательность имеет следующий вид:
Заметим, что все основания типа Т в указанной последовательности окрашены красным цветом. Проверка "Закона Jean-Clode Perez " на примере b-цепи молекулы инсулина (см. выше) привела к следующему результату. Общее число триплетов в b-цепи равно 30, то есть молекула содержит 90 оснований (89 - ближайшее число Фибоначчи). Если подсчитать число оснований Т в b-цепи, то оно равно 34 (34 - число Фибоначчи), а число остальных оснований равно 90-34 = 56 (55 - ближайшее число Фибоначчи). Таким образом, между основанием Т и остальными основаниями в b-цепи соблюдается следующая пропорция: 90-56-34. Эта пропорция очень близка к "резонансу": 89-55-34. Из этого анализа вытекает, что "Закон Jean-Clode Perez" для b-цепи инсулина выполняется с весьма высокой для практики точностью. Если теперь взять первые 18 триплетов b-цепи, содержащих 54 основания (55 - ближайшее число Фибоначчи) и подсчитать число оснований Т на этом отрезке, то оно равно 22 (21 - ближайшее число Фибоначчи), то есть в первом отрезке мы имеем пропорцию: 54-32-22, что также близко к "резонансу": 55-34-21, то есть "Закона Jean-Clode Perez" на этом отрезке также выполняется. Если взять отрезок, состоящий из оставшихся 12 триплетов (36 оснований), то число оснований Т на этом отрезке равно 12 (13 - ближайшее число Фибоначчи), то есть имеем пропорцию: 36-24-12, которая является приближением к "резонансу": 34-21-13. Таким образом, как для b-цепи молекулы инсулина в целом, так и для ее отрезков "Закон Переза" выполняется с достаточной для практики точностью. Можно также увидеть, что практически в любом отрезке b-цепи тенденция к золотому сечению сохраняется. Удивительное открытие Jean-Clode Perez позволяет сделать интересный вывод, касающийся аналогии между музыкой, поэзией, рыночными процессами ("волны Эллиотта") и генетическим кодом. Несомненным является тот факт, что "гармония" этюдов Шопена, стихов Пушкина или "волн Элиотта", в которых "золотое сечение" наблюдается многократно, сходна "гармонии" генетического кода, в котором "фибоначчиевые резонансы", лежащие в основе SUPRA-кода, многократно наблюдаются как во всей молекуле ДНК, так и в каждой ее части. |