Ликбез по генетике аутизма

Материал из BrainstormWiki
Перейти к: навигация, поиск

Данный текст не претендует на обзор генетики вообще, хотя он необходимо начинается с обзора некоторых базовых понятий. Здесь будут разобраны только те факты и данные, которые имеют наибольшее значение для понимания исследований, методов диагностики и прочих генетических аспектов аутизма, и, как я надеюсь, позволят вести осмысленный разговор о них в группе Brainstorm.

В этой части содержатся самые базовые понятия о том что такое гены, хромосомы, экзом и т.п.

Материал скомпилировал Виктор Малахов.

Номера и адресация хромосом

У человека 23 хромосомы (23 пары хромосом). Их принято различать по размеру — нумерация хромосом идет от самой большой (№1) к самой маленькой (№22), и последней идет пара половых хромосом — X и Y. Есть еще одна структура, содержащая ДНК, передающуюся по наследству — в митохондриях есть своя маленькая хромосома, замкнутая в кольцо, как у бактерий. Она передается только от матери к ребенку. Отметим здесь также, что многие гены, критичные для работы митохондрий, тем не менее находятся в ядерном (nuclear) геноме — т.е. в геноме ядра клетки, на одной из 23 хромосом.

Хромосомы с первой по двадцать вторую состоят из двух неравных половинок (на картинке можно разглядеть перетяжку), короткое плечо называют “p”, длинное — “q”.

Подкрашивая хромосомы специальными реагентами, можно увидеть характерные полоски (bands). Их как раз здесь видно. По ним принято отсчитывать участки хромосом: например, 15q11 — это 15 хромосома, 11 по счету от центра полоска на длинном её плече.

Chromosomes.png

Эухроматин и гетерохроматин

Вот эту компактную форму хромосом, как в предыдущей главе, похожую на кривую букву Х можно разглядеть только когда клетка делится (метафаза). В такой компактной форме ДНК очень плотно намотана на “бобины” и упакована — работать она не может, гены не транскрибируются. В рабочем состоянии хромосомы разворачиваются в столь тонкие нити, что их уже в обычный микроскоп и не увидеть.


Эта рабочая форма хромосомы называется эухроматин. При этом часть ДНК все равно остается упакованной на бобины-гистоны, и не работает. Эта часть называется гетерохроматин.

На картинке показаны еще метиловые метки, которыми занимается эпигенетика, но это часть отдельного разговора

Chromatin.png

Белковые гены, экзоны и интроны

Exonsintrons.png

Давайте присмотримся к тем участкам ДНК, которые называют “гены”. Сама эта концепция и слово "ген" были придуманы задолго до расшифровки генома, и даже расположение некоторых генов на хромосомах удавалось вычислить — впервые это сделал Альфред Стёртевант ещё в 1913!

Сейчас же мы уточним, что речь пойдет о белковых генах, тех, что кодируют белки.


Информация о структуре белка — последовательность аминокислот — записана на ДНК не подряд, а кусками, между которыми большие промежутки. Кодирующие куски (цветные) — называют экзоны, а промежутки — интроны. Интроны как правило длиннее, и сильно.

При сборке готовой для синтеза белка РНК экзоны “сшиваются” вместе, образуя матричную РНК (messenger RNA, mRNA) — по ней рибосомы синтезируют белок. Процесс “сшивания” называется сплайсинг (splicing) — и за открытие в 1970х сплайсинга, интронов и экзонов Робертсу и Шарпу дали Нобелевскую премию в 1993г.

Зачем нужны интроны толком никто не знает. В этих промежутках могут оказаться альтернативные версии экзонов, “старые” копии экзонов, участки других генов или вообще неясно что. Чаще всего интроны являются той частью генома, которая не особо эволюционно сохранна, и там допускаются самые разнообразные варианты...

Доля белковых генов в геноме, или что должен знать каждый о Human Genome Project

Франсис и Крик открыли структуру ДНК в 1953 году, уже в начале 60-х природа ДНК кодонов, которые кодируют белки была раскрыта Ниренбергом и Маттеи;

С тех пор во всех учебниках и в школе даже преподают универсальный генетический код, и что смысл ДНК — служить шаблоном РНК, а смысл РНК — чтобы рибосомы синтезировали белки. Называется “центральная догма генетики”.

Это — в принципе — правда. Но после публикации результатов титанических усилий Human Genome Project в 2003 году, мы гораздо лучше понимаем, какое место этой правды в хромосомной ДНК.

1.1%.

Именно такая доля ДНК человека действительно кодирует белки. Всего порядка 20 тысяч генов. Если в вашей книжке написано, скажем, что генов 100 тысяч и доля их больше — значит она написана до 2003 года.


HGP.png

Эволюционная сохранность

Отметим здесь важное понятие — красные и розовые сектора на картинке выше — это часть генома, которая довольно похожа и у людей, и у обезьян, и у других млекопитающих. Она отличается конечно, и гены располагаются часто вообще на разных хромосомах, но тем не менее их можно "узнать" и у мышей и даже у утконосов. Именно поэтому их называют "conserved sequences". Эволюция сохраняет их, предположительно потому, что они важны, в то время как в остальной части генома допускается некоторый бардак

Экзом

Часть из этих сохранных участков генома, отмеченной темно красными 1.1% — это хорошо известные гены, белковые. Их называют “экзом” (exome) (т.к. на самом деле в 1.1% вошли только собственно экзоны ). При исследовании генетики аутизма ученые часто ограничиваются только им. Из экономии. Это ведь уже относительно немного информации — не более 60 мегабайт в компьютерных терминах. Однако для исследований и анализов чаще собирают даже еще меньше информации — про это потом.

Еще раз: экзом — это часть генома человека, содержащая только участки ДНК, которые кодируют белок. Некоторые говорят "только функциональные участки ДНК", но это неправильно — функционально важно много чего еще, просто эту часть генома — экзом — мы очень хорошо понимаем.

Небелковые "гены"

Еще 4-5% ДНК белки не кодируют, но эволюция их “бережет” так же тщательно, как и белковые гены. Их принято считать управляющими (различные промотеры, энхансеры и т.п.), и, кстати, их значение очень велико при развитии организма, там так и просится искать причины отклоняющегося развития… Часть из них кодирует РНК, которая никогда не превращается в белок, но тем не менее работает как управляющий элемент — это miRNA, siRNA, piRNA... некоторые уже стали называть это все "РНК гены", но термин еще не устоялся. Беда в том, что в отличие от генов, кодирующих белки, мы гораздо хуже понимаем, как они устроены, и исследований на эту тему пока довольно мало.

Остальное — если и не совсем “мусор”, то нечто, смысл чего мы понимаем мало пока... Там в основном "скучные" повторяющиеся последовательности, для которых хоть и есть названия (ученые всегда придумывают названия) — транспозоны, LINE, SINE, Alu sequence (это просто часть названий, Alu, например относится к SINE) и т.п., но это наверное, наиболее плохо понятая часть генома. Часть из них просто предназначены для того, чтобы быть "намотанными" на гистоны — это гетерохроматин

Ликбез по генетике аутизма
I. Ликбез по генетике аутизма • II. Генетика и близнецы • III. Виды мутаций • IV. GWAS Шизофрения