Пикософт
Подписаться на RSSОбоснование 3Д Генетического кода
https://www.nature.com/articles/s41467-022-30390-9
Кодон-специфические графики Рамачандрана показывают, что конформация главной белковой цепи зависит от кодона
Рассылки Лаборатории Наномир, Выпуск 1323
(ГУГЛ знает)
У нас есть одна таблица - 3D генетический код и 1 таблица - результаты корреляционного анализа по 300+ белкам. Для "каких попало" белков средняя корреляция ~96%, для мембранных белков, представляющих собой длинные спиральные участки, корреляция 100%.Структура статьи-сообщения предельно проста.
Целью исследования была проверка гипотезы синонимичности генетического кода.Нулевая гипотеза: Если генетический код (2D код) синонимичен, то глицин в любой спирали (альфа, пи, бета, 310) будет встречаться закодированным любым из кодов: GGA, GGC, GGG, GGT.Проверка показывает, что эта гипотеза ошибочна. В альфа спирали глицин кодируется кодом GGC, в пи-спирали GGT, в 310-спирали GGG, в бета-спирали GGA.Таким же способом составляется вся таблица, т.е. для всех аминокислот.
Рис. 2 Различные предпочтения к образованию вторичных структур синонимичными кодонами проявляются в распределении двугранных углов. Из двух кодонов GTA и GTT, транслирующих валин, GTA имеет на 8 % меньшее предпочтение к β-моде и на 9,4 % большее - к α-моде. Предпочтения проявляются в относительных весах соответствующих мод на диаграмме Рамачандрана, что видно на представленных здесь предельных распределениях двугранного угла φ. Если добавить ограничение на вторичную структуру, то распределения двух синонимичных кодонов становятся неразличимыми. Благодаря учету вторичной структуры наш анализ становится устойчивым к различиям в распределении, возникающим из-за различий в предпочтениях. Показаны оценки плотности ядра, заштрихованные области обозначают 10-90% доверительного интервала, рассчитанных на 1000 случайных бутстрапов.
Кушелев: Проще говоря замена кодона при определённых условиях влияет на структуру белка. В случае синонимичности кодонов это невозможно. Не будем вдаваться в тонкости изощрённых методов, с помощью которых авторы статьи получили этот надёжный и убедительный результат. Обратим внимание лишь на сложность получения этого результата на основе данных рентгеноструктурного анализа, который, например, не отличает альфа-спираль от пи-спирали и от фрактальной спирали Кушелева. Из-за этого трудно заметить влияние кодонов, формирующих 1/4 альфа-спирали от влияния кодонов, формирующих 1/5 пи-спирали. Ведь рентгеноструктурный анализ их не различает. Более того, многие вторичные структуры, состоящие из участков альфа-спиралей, специалисты по РСА считают состоящими из бета-цепей. В связи с этим банк белковых структур (PDB) "зашумлён" систематическими ошибками. Тем не менее, мощные методы исследования помогли авторам обнаружить зависимость структуры главной белковой цепи от замены кодонов на "синонимы". Теперь мы можем смело ссылаться из статьи "3D генетический код" на книгу "Пикотехнология белков", т.к. существование 3D генетического кода надёжно подтверждено опровержением гипотезы синонимичности кодонов. А это значит, что нет необходимости срочно писать всю серию статей от "Кольцегранные модели молекул" и далее. Можно писать сразу статью "3D генетический код" со ссылками на книгу "Пикотехнология белков", в которой опубликована таблица 3D генетического кода. Обоснование 3D генетического кода, как мы видим, уже есть, а проверку конкретной таблицы мы опубликуем в статье в виде результатов корреляционного анализа.
Проверка корреляции подтверждает наличие 3D генетического кода (см. вложенный файл)
Модели и эксперименты
В таблице 3D генетического кода каждому триплету кодирующей нуклеотидной последовательности соответствует не только аминокислота, но и вариант её установки в растущую структуру белка. Например, триплет GGC кодирует глицин в составе альфа-спирали, GGA – глицин в составе бета-спирали, GGG – глицин в составе 310-спирали, GGT – глицин в составе пи-спирали.
Файл Fasta и 2D диаграмма Пикотех
Файл Fasta и 2D диаграмма Пикотех
Альфа-фолд знает про сверхдлинные альфа-спирали!
Существующие "мокрые" методы анализа белковых структур обычно не отличают даже трёхгранную призму (фрактальную 75-спираль Кушелева) от других типов вторичной структуры (альфа-, пи-, 310-спиралей).
Сверхдлинные 310-спирали, как мы видим, тоже современные методы структурного анализа обнаружить обычно не могут. Хотя Альфа-фолд уже нарисовал длинные спиральные участки. 310-спираль для современных методов обычно неотличима от пи-спирали и от альфа-спирали.
Это снова сверхдлинная фрактальная 75-спираль Кушелева (бета-призма по официальной классификации).
На этот раз Альфа-фолд предсказывает множество спиральных участков.
Это значит похожие белки исследовались с помощью РСА/ЯМР и т.д. и были приняты за спираль.
Это и есть спираль, но фрактальная, состоящая из чередующихся участков n*(1/4 витка альфа - 1/5 витка пи -)
Примеры фрактальных спиралей
Фрактальная спираль - спираль, скрученная из спирали.
Пространственная структура до фолдинга третичной структуры - правильная вторичная структура в пространстве ( ~ 20 000 АО).
Наконец, удалось добраться до прямых результатов РСА для фрактальной спирали!
https://i.ibb.co/CWZT7z7/Q96JA1.png
https://www.uniprot.org/uniprotkb/Q96JA1/entry
Речь идёт о внедрении готовых технологий. Я уже сегодня могу выполнять заказы, например, по определению структур транс-мембранных белков. Известно, что они спиральные, но конкретизировать тип спирали РСА/ЯМР не могут. А программа Пикотех показывает конкретный тип спирали. Это может быть альфа-спираль (показана красным цветом). Может быть 310-спираль (показана оранжевым), может быть пи-спираль (синяя), может быть бета-спираль (зелёная), может быть метиониновая спираль (сиреневая), а может быть фрактальная спираль, например, 75-спираль Кушелева. Она изображается чередованием цветов "розовый-голубой". Другие фрактальные спирали тоже "полосатые", а типов фрактальных спиралей очень много. И все они на 100% правильно показываются по таблице 3D генетического кода. Нетрудно догадаться, что после публикации серии статей появится лавина заказов на структуры белков, тем более, что бесплатных примеров опубликовано в рассылке более 200 000. Это даже больше, чем вся база белковых структур (PDB), которая насчитывает около 150 000 структур. А в рассылке опубликованы около 110 000 структур только белков человека. В каждом выпуске рассылки, где опубликованы очередные 200 белковых структур, я фактически дарю человечеству бесценную информацию о структурах этих белков. Ведь подавляющее большинство белков (около 97%) не кристаллизуются и поэтому недоступны для РСА. Их не могут определить ни за какие деньги. А я эти структуры дарю сотнями.