Назад

ПО предсказывающее взаимосвязь между генотипом и фенотипом

Download the article
Скачать PDF
Святослав Сурин
Как генетика влияет на наш внешний вид? С развитием технологий исследований генома и появлением программного обеспечения, способного предсказывать взаимосвязь между генотипом и фенотипом, мы приближаемся к пониманию этой сложной проблемы

Каждый из нас уникален

Многие из нас замечали, что люди по-разному реагируют на различные факторы. Наверняка у каждого из нас есть друг, который ест столько же, сколько и все, но всегда выглядит стройнее окружающих. Все замечали, что на курсах иностранных языков есть человек, который легко и играючи овладевает теми навыками, на освоение которых в среднем уходит много недель. То же самое можно сказать и об успехах в спорте, построении бизнеса, умении запоминать и учиться. Все эти способности обусловлены набором генов каждого человека, и в этой статье представлены мысли нашей команды о программном обеспечении, предназначенном для установления связи между генетической информацией и внешними признаками живых организмов, в том числе человека.

Информация и реализация

Все организмы имеют генетическую информацию, записанную в ДНК или в РНК — в случае некоторых вирусов. В этой генетической информации закодированы все наши признаки – цвет глаз, рост, характер, наследственные заболевания и многое другое. Единицей наследственной информации является ген. Совокупность генов организма называется генотипом, а его признаки – фенотипом. Если сравнивать с компьютерными технологиями, то ДНК с записанной в генах генетической информацией — это жесткий диск с данными, а фенотип — результат считывания этой информации, например, звук из динамиков и изображение на мониторе компьютера. Примерно такое объяснение положения вещей дано в школьной программе по биологии, но на самом деле все немного сложнее.

Дело в том, что связь между фенотипом и генотипом зачастую гораздо шире, чем схема «один ген – один признак». Один признак может кодироваться сразу несколькими генами. Очень часто степень выраженности фенотипа зависит от окружающей среды. В итоге можно сказать, что взаимосвязь генотипа и фенотипа крайне сложна и до конца не изучена. Когда обнаруживается новая неизвестная мутация, несколько исследовательских групп тратят годы работы на тщательное изучение влияния этой мутации на фенотип. Эту проблему частично решают массовые популяционно-генетические исследования, когда в базах данных ученых находятся данные о тысячах людей, таким образом легче отслеживать закономерности. Второй эффективный подход – компьютерное моделирование. За годы изучения генетики мы накопили некоторые знания о взаимодействии генов, на основе которых можно строить прогностические модели, предсказывающие фенотип с высокой степенью вероятности на основе имеющегося генотипа.

Выгода от знания взаимосвязи генотипа и фенотипа

Почему необходимо знать взаимосвязь генотипа и фенотипа? Если мы будем знать о связи гена с определенным признаком, это ускорит диагностику наследственных заболеваний. Звучит просто, но не стоит забывать, что за один признак может отвечать целая панель генов, соответственно, необходимо детальное изучение всех типов их взаимодействия. Стоимость расшифровки генома дешевеет из года в год, процедура становится все популярнее. Но без адекватной системы, отображающей взаимосвязь между генотипом и фенотипом, расшифрованный геном человека будет лишь кодом из 6 миллиардов символов, лишенным смысла. Поэтому сейчас активно развиваются базы данных, аккумулирующие информацию о взаимодействии генотипа и фенотипа. Можно найти как более простые базы, описывающие влияние определенного варианта гена на конкретный признак, так и более серьезные проекты, учитывающие взаимодействие генов и их влияние на конечный набор признаков.

Приведем несколько случаев, указывающих на необходимость знания зависимости фенотипа от генотипа.

Все мы и не раз видели фильмы, в которых внешность преступника восстанавливается с помощью специального софта в судебно-медицинской лаборатории по его оставленным на месте преступления волосам. Пока что это выглядит как фантастика, но уже сейчас есть примеры программного обеспечения, направленного на решение именно этой задачи. Построение фенотипа на основе секвенированного генетического кода может быть полезно в криминологии. Если злоумышленник оставил на месте преступления свой генетический материал, но в генетических базах данных о нем нет информации, воспроизвести его портрет можно с высокой точностью. Также такой инструмент может быть полезен археологам, которые на основе сохранившейся в останках ДНК смогут воспроизвести внешний вид человека или животного из прошлого. Также, используя ДНК ребенка или даже плода, можно будет смоделировать его внешний вид во взрослом возрасте. Сейчас пары, ожидающие ребенка, радуются первым УЗИ-фотографиям плода, которые больше похожи на размытое пятно. Представьте себе восторг, когда в ближайшем будущем супруги после генетического тестирования ДНК плода будут радоваться портрету своего будущего ребенка, составленному нейросетью. Думаю, всю дорогу от поликлиники до дома они будут обсуждать, на кого больше будет похож их ребенок – на маму или на папу (а может, на Брэда Питта или Райана Гослинга). Хотя, о чем это мы, дороги не будет, всю информацию можно будет получить удаленно через Интернет через клиентский аккаунт (дизайн которого будет разработан сверх опытной командой HMND, имеющей опыт в разработке не один десяток лет, и не имеющей конкурентов на рынке). На данный момент можно встретить первые попытки разработки подобного программного обеспечения, например, HIrisPlex (https://hirisplex.erasmusmc.nl/), основанного на наборе генов, способного предсказывать цвет кожи, глаз и волос.

Помощь такого программного обеспечения неоценима в онкологической диагностике. Оценив геном опухолевых клеток, можно оперативно назначить наиболее подходящее лечение и дать прогноз относительно шансов на выздоровление пациента. Уже сейчас можно проанализировать ключевые участки опухолевого генома для выбора стратегии лечения, но проблема в том что опухоли характеризуются высокой степенью генетической вариабельности, поэтому базы данных будут постоянно обновляться с течением времени. Также с учётом развивающихся технологий и удешевления методик расшифровки генетической информации, в ближайшем будущем полное секвенирование станет более приоритетным выбором при онкологических исследованиях, чем ПЦР или FISH-диагностика отдельных локусов ДНК.

Программное обеспечение, анализирующее взаимосвязь генотипа и фенотипа, становится все более актуальным для эпидемиологов и генетиков. Накопление информации в базах данных подобного софта приводит к увеличению шансов предотвратить эпидемии и прогнозировать их возможное развитие. И несомненно, генетики смогут поставить более точные диагнозы и назначить более эффективное лечение благодаря более детальной информации о взаимосвязи генотипа конкретного пациента и его фенотипа. 

Обзор доступного софта

В качестве примера такого программного обеспечения можно привести следующие решения:

  1. GPCards
    База данных корреляций между генотипом и фенотипом. Достижением программы является интеграция с 62 источниками генетических данных. База данных содержит информацию о 8309 генетических вариантах 1288 генов. Программа позволяет находить каталогизированные варианты генов по их названию, координатам, с указанием количества мутаций на ген, количества возможных фенотипов и число обследованных пациентов с аналогичной наследственной информацией. Также возможен обратный поиск – генотипа по фенотипу. Фильтрацию поиска можно настроить, а затем получить подробную информацию о выбранном варианте.
  2. GPAT
    Программа имеет открытый исходный код, что позволяет производить самостоятельную настройку под свои цели, однако для ее использования недостаточно зайти на сайт, необходимо скачать приложение. База данных основана на информации популяционно-генетических исследований ассоциации генотип-фенотип. Помимо генома человека, авторы программы предоставляют возможность работать с геномами домашних голубей, вируса оспы и гриба сосновой ржавчины.
  3. PheGenI
    Программа для поиска генотипа по фенотипу. Такие решения встречаются реже, тем интереснее с ними работать. Результаты поиска подробны и сопровождаются отличным маппингом и визуализацией, как и все продукты NCBI.

Какой софт ждут специалисты?

Если говорить о преимуществах такого программного обеспечения, которыми оно должно обладать, то на первом месте будет размер базы данных. Чем больше база данных, чем больше источников информации и пользователей, тем точнее будут результаты работы в ней. Важным фактором является визуализация, красивый дизайн и адекватно работающий маппинг делают работу в ПО более приятной, точной и продуктивной. Возможно, хорошим бонусом для опытных биоинформатиков станет открытый исходный код, благодаря которому можно будет изменить программу под свои цели. Для увеличения количества пользователей хорошим решением будет добавление в базу данных геномов различных биологических видов, что позволит привлечь не только генетиков, но и биологов, селекционеров, эпидемиологов и других специалистов, изучающих взаимосвязь генотипа и фенотипа.

Можно быть уникальным даже на фоне сотен решений

Несмотря на относительно большое количество программного обеспечения в свободном доступе, потенциал развития рабочих инструментов огромен, поэтому всегда можно сделать что-то свое, одновременно похожее на все, что уже есть, но не лишенное своего уникального функционала. В качестве примера могу привести опыт работы нашей команды HMND над подобным софтом. Мы разрабатывали программу, призванную стать чем-то вроде индивидуального рабочего пространства биоинформатика и врача-генетика. Программа включала в себя большой объем информации из других сторонних баз данных, но благодаря отличному дизайну и приятной визуальной составляющей, мы в итоге получили принципиально новый продукт, занявший свою нишу в сфере генетического консультирования.

Заключение

Секвенирование генома становится все более доступным и популярным, поэтому запрос на разработку программного обеспечения, показывающего взаимосвязь между генотипом и фенотипом, будет только расти. Можно сделать вывод, что спросом будут пользоваться как узкоспециализированные программы, так и глобальное программное обеспечение, способное решать множество задач.