Генетика происхождения. Популяционный состав

Ася Попова Медицинский редактор, фанат генетики

В этой статье Атлас поделится информацией о популяциях.

Мы расскажем, чем они отличаются от народов, почему сложно изучать их генофонд и как определяют принадлежность к популяции по генетическому тесту.

Почему генетики используют понятие популяция

Вместо национальной или этнической принадлежности в генетике происхождения используются понятия популяция и популяционный состав. Это связано с тем, что понятие национальность скорее относится к политической идентификации, чем к этнической.

Этническая принадлежность или народность определяется в большей степени культурными нормами, а не генетикой. Человек, который вырос в определенной культурной среде, может относить себя к одному народу, а фактическое происхождение его предков при этом может быть другим. Поэтому ученые говорят о популяциях — группах, которые существовали в течение многих поколений и в которых более половины браков заключалось внутри группы.

Популяцию легче определить по географическим и этническим признакам, потому что обычно браки заключаются с живущими поблизости представителями той же группы. Большинство народов является по совместительству популяцией. Однако есть народы, в которых более 50% браков заключается с представителями другой группы. Их отнести к популяции нельзя.
Народ Популяция
Группа, к которой относит себя человек в настоящее время, но его предки могли относиться к другим группам Группа, к которой относятся предки человека, хотя сам человек может не идентифицировать себя как представителя популяции
Большая часть браков может заключаться с представителями других народов Более 50% браков заключается внутри группы
Народ может включать в себя разные популяции Популяция может быть более обширной группой, например, всё человечество

В чем сложность определения популяций

Генетические отличия между разными группами людей низки в сравнении с другими приматами. Геномы шимпанзе Восточной и Западной Африки отличаются сильнее друг от друга, чем геномы двух других людей на планете, где бы они ни жили. В этом заключается трудность определения, к какой популяции принадлежит человек.

Другая сложность в том, что на протяжении истории люди, особенно это относится к европейцам, постоянно мигрировали, заключали браки с представителями других популяций, а гены родителей перемешивались. И чем больше люди одной популяции переселялись и смешивались с другой, тем более разнообразная ДНК получалась у следующих поколений и тем сложнее найти для них образцовые ДНК.

Из-за рекомбинации дети могут не унаследовать некоторые варианты генов, характерные для той или иной популяции.

ДНК человека может нести информацию о популяциях предков разных времен. И тех, что жили недавно, и тех, что жили сотни лет назад. Чтобы определить, какие это были популяции, участки хромосом пользователя сравниваются с образцами представителей разных групп.

Как изучают популяции

Для отбора образцов используется анализ главных компонент (PCA, principal component analysis). Этот алгоритм самостоятельно ищет паттерны в данных генотипирования и позволяет разбить образцы на кластеры в N-мерном пространстве, обычно двухмерном. С помощью него мы отсеиваем промежуточные образцы и отбираем только те, что характерны для определенной популяции.

В примере ниже можно увидеть, как формируются кластеры разных популяций. Промежуточные варианты, которые попадают в зону между разными кластерами — отсеиваются.‌‌

Таким образом мы получаем кластеры, размеры и границы которых зависят от схожести образцов внутри группы. С ними мы сравниваем данные Генетического теста Атлас или Полного генома и относим их к наиболее похожему кластеру.

Сравнивается не вся ДНК, а отдельные ее кусочки. К каждому из них подбирается максимально близкий образец из базы. Так как некоторые участки могут быть похожи у отличных друг от друга популяций, данные проходят дополнительную проверку.

Мы проверяем все близлежащие участки. Например, если среди нескольких участков, которые относятся к популяциям Северной Европы, мы обнаружим образец из Восточной Азии — то проверим его еще раз.

Чем больше образцов содержит кластер, тем точнее алгоритм определит популяции. Помимо этого, точность зависит от исходных данных. При полногеномном секвенировании мы получаем больше информации для сравнения, чем после генотипирования (микрочип).

Однако важно помнить, что даже Полный геном не дает 100%-ный результат. Образцы, собранные у разных популяций, чаще всего содержат данные генотипирования, так как оно значительно дешевле. Алгоритм определения популяций происхождения будет становиться точнее по мере появления образцов с результатами полногеномного секвенирования.

Есть ошибочное мнение, что для определения популяционного состава анализируется только Y-хромосома и митохондриальная ДНК. То есть для женщин популяционный состав можно определить только по материнской линии. Это не так.

По данным Y-хромосомы и митохондриальной ДНК можно получить только информацию о гаплогруппах, но к конкретным популяциям они не относятся. Например, гаплогруппа R1a, которая часто встречается у русских, распространена среди западных и восточных славян, а также среди популяций Северной Индии.

Популяцию нельзя связать с одной гаплогруппой, потому что, как правило, в ней распространены и другие. Однако они помогают понять историю формирования популяции в целом.

Как это выглядит в Личном кабинете

В разделе География пользователь видит процентное соотношение между частями света. Например, между Европой, Азией и Африкой.

При нажатии кнопки Подробнее пользователь переходит на страницу популяционного состава. Здесь представлен подробный процентный состав по каждой популяции. На карте также отмечен примерный ареал каждой группы.

Узнайте больше о генетике своего происхождения. Приобрести генетический тест Атлас или тест Полный геном можно на сайте.

Избранные темы

Здоровье
203 статей
Генетика
122 статей
Образ жизни
118 статей
Питание
97 статей
Микробиота
93 статей
Онкология
43 статей
Пищеварение
40 статей
Гиды
34 статей
Отзывы
10 статей
Новости
6 статей