Раздел Происхождение в личном кабинете Atlas

Ася Попова Медицинский редактор, фанат генетики

Обновление 2020

Подробно объясняем, что такое популяционный состав и гаплогруппы, и почему в вашем личном кабинете именно такие цифры.


Популяционный состав

Популяция — общность людей, которая долгое время проживала на одной территории и была частично изолирована от других. В Генетическом тесте Атлас и тесте Полный геном мы анализируем популяционный состав. Для этого ученые собирают образцовые данные ДНК представителей разных популяций и сравнивают их с вашими.

Все люди отличаются друг от друга лишь на 0,1%, поэтому изучать разницу в вариантах генов между разными популяциями — непросто. Также нужно учитывать, что разные группы людей постоянно перемещались и смешивались с другими популяциями. Особенно сложно из-за этого изучать генетику жителей Европы, где сосуществует множество разных популяций.

Чем больше люди одной популяции переселялись и смешивались с другой, тем более разнообразная ДНК получалась у следующих поколений и тем сложнее найти для них образцовые ДНК.


Как считается популяционный состав

Для подсчета популяционного состава аналитики используют специальный алгоритм. Он ищет паттерны в данных и позволяет разбить образцы представителей различных популяций на кластеры.

Чем больше расстояние между кластерами, тем легче оценить разницу между ними.

Смешанные кластеры говорят о том, что популяции очень схожи между собой. С помощью такого алгоритма мы отсеиваем промежуточные образцы и отбираем только те, что характерны для определенной популяции.

Данные ДНК делятся на множество отрезков, и каждый из них анализируется отдельно. Алгоритм подбирает популяционный кластер, который наиболее схож с конкретным участком. Сумма всех отрезков дает разбивку конкретного образца на популяции. Так как некоторые участки могут быть похожи у отличных друг от друга популяций, данные проходят дополнительную проверку.


Что изменилось с обновлением

Генетика не стоит на месте, и регулярно появляется все больше данных, в том числе и по образцовым данным для разных популяций. Также мы проводим собственный анализ, который позволяет выявить неточности и исправить их.

Улучшили распознавание русской популяции
Добавили больше новых образцов представителей русской популяции и улучшили представленность отдельных популяций.

На картинке видно, что образцы представителей русской популяции (отмечены желтым) перемешаны с образцами представителей финской популяции (фиолетовый). Это значит, что генетически они мало различаются между собой. Слева видно, что желтых точек мало, поэтому подсчет мог работать некорректно. Добавив больше русских образцов (на картинке справа), мы улучшили распознавание русской популяции.

Cлева до обновления, справа — после. Желтым отмечено увеличение доли образцов русской популяции в базе.

Почистили базу от спорных образцов
Когда данные одной популяции сильно похожи на данные другой, это снижает точность подсчета. Риск, что алгоритм неверно считает популяцию на определенном участке ДНК, становится выше. Чтобы этого избежать, мы приняли решение временно удалить популяции, по которым мало данных, и образцы, которые сливаются с другими. Когда по ним появится больше данных — мы вернем их обратно в расчет.

На рисунке видно, что популяция мексиканцев (отмечена желтым) сильно размывается и представляет собой смесь различных популяций. Мы убрали из базы данных образцы, которые расположены за пределами основной группы и находятся между образцами других популяций.

Cлева до обновления, справа — после. На графике справа отсутствуют образцы мексиканцев, которые не формируют четкий кластер.

Объединили татар в одну группу
До обновления у нас было три популяции татар. Мы их объединили, чтобы алгоритму было сложнее перепутать их с образцами других популяций.

Ранее одна популяция татар относилась к Азии. Сейчас в личном кабинете вся группа татар относится к Европе, из-за чего может снизиться процент азиатских популяций.

Эти изменения отразились на всем подсчете популяционного состава. Вы могли заметить, что доля одних популяций сильно уменьшилась, других увеличилась, а третьих — исчезла. Дело в том, что каждый участок ДНК сравнивался с обновленной базой данных, и все спорные участки распределились по более четким кластерам.


Гаплогруппы

Ученые объединяют людей с одинаковым набором мутаций в Y-хромосоме и митохондриальной ДНК в так называемые гаплогруппы. Они обозначаются в виде первой заглавной буквы и чередования маленьких букв и цифр, например R1b1. Первая буква в названии означает основную группу, а остальные буквы и цифры используются для обозначения более поздних изменений в ДНК.

Как считаются гаплогруппы

Для подсчета аналитики используют дерево гаплогрупп, где каждый узел — определенная мутация или вариант гена. Для анализа  гаплогруппы берется соответствующее дерево, а каждому варианту гена в нем присваивается вес. Чем реже вариант встречается в дереве, тем больше его вес.

Дерево гаплогрупп с вертикальной временной шкалой

Чтобы определить гаплогруппу пользователя, алгоритм ищет, чтобы путь в образцовом дереве от корня до каждой гаплогруппы соответствовал максимальному итоговому весу. Таким образом, мы получаем дерево пользователя, где результатом является последняя гаплогруппа в дереве.


Что изменилось с обновлением

Международное общество генетической генеалогии (ISOGG) выпустило обновленную версию дерева гаплогрупп для материнской и отцовской линии. Мы включили его в обновление, а старое дерево убрали из расчета. Теперь результат вашей гаплогруппы и маршрут миграции древних предков соответствует наиболее актуальным научным данным.

Если у вас нет Генетического теста Атлас или теста Полный геном, но вы хотите больше узнать о своем происхождении — приобрести наши продукты можно на сайте. Также это отличный подарок на Новый год, который запомнится надолго.




Избранные темы

Здоровье
203 статей
Генетика
122 статей
Образ жизни
118 статей
Питание
97 статей
Микробиота
93 статей
Онкология
43 статей
Пищеварение
40 статей
Гиды
34 статей
Отзывы
10 статей
Новости
6 статей