Назад

Перспективные разработки для генетического тестирования

Download the article
Скачать PDF
Святослав Сурин
Может ли программное обеспечение, созданное преподавательским составом в условиях ограниченного финансирования, добиться успеха в постоянно развивающейся области генетических исследований?

Современные проблемы при разработке ПО

Программное обеспечение для работы в области геномики стало неотъемлемой частью науки и важным фактором повышения производительности труда биоинформатиков и врачей-генетиков. Хорошо спроектированное приложение использует меньше ресурсов рабочего компьютера, снижает нагрузку на исследователя, экономя время и повышая эффективность работы. Однако в настоящее время такое программное обеспечение разрабатывается в условиях недостаточного финансирования, обычно научными сотрудниками без привлечения высококвалифицированных программистов-инженеров, а также очень плохо поддерживается в дальнейшем и имеет крайне негативные отзывы клиентов. По окончании производства получается не надежное программное обеспечение, сложное в использовании и работающее с ошибками. Проблема становится все более актуальной с каждым годом, поскольку объем хранимых, анализируемых и изучаемых генетических данных постоянно увеличивается. Программное обеспечение для работы в области геномики часто разрабатывается за счет господдержки, с большим количеством поставленных условий и ограничений, и сегодня любой генетический тест обрабатывается и интерпретируется с помощью такого софта. 

Разделение труда

Часто бывает так, что одна компания проводит анализ биологических материалов пациента и получает первичные данные, а обработкой и интерпретацией занимается другая подрядная организация. Подрядчик будет использовать именно то программное обеспечение, которое находится в свободном доступе, либо использовать аналогичные независимые разработки, если подрядчиком является государственная организация с соответствующим финансированием. Именно поэтому рынок остро нуждается в новом качественном и проработанном софте, отвечающем всем современным задачам специалистов-генетиков.

Типы современного софта для генетического тестирования

Попробуем разобраться, какие виды программного обеспечения можно встретить на рынке и для решения каких задач они используются.

Интеллектуальные программы. Например, они используют информацию об активности определенных генов, чтобы выяснить пути регуляции работы всего генома. Можно отслеживать различные взаимосвязи: например, если два гена имеют одинаковую степень активности в разных условиях, делается вывод об их взаимодействии друг с другом. Существует множество алгоритмов оценки взаимодействий генов, и самые распространенные из них не всегда являются лучшими, поэтому перспективным будет направление разработки приложения с полной базой алгоритмов, с их выбором и применением в два клика.

Другой большой группой являются инструменты для прогнозирования рисков для здоровья: например, программное обеспечение рассчитывает индивидуальный уровень вероятности развития рака молочной железы или яичников на основе семейного анамнеза и личных генетических данных. Именно такое программное обеспечение позволяет генетику сделать вывод о рекомендациях по корректировке образа жизни после анализа ДНК пациента.

Боли и потенциальные пути их решения

Для выполнения задач в приложении могут использоваться совершенно разные алгоритмы, также возможно использование нейронных сетей или задействование искусственного интеллекта и машинного обучения, однако такой подход потребует достаточно много времени и ресурсов, а также усиленного контроля во время выполнения протокола. Искусственный интеллект и нейронные сети — очень перспективный подход, но не исключено, что в результате их работы после проверки живой специалист найдет ошибки и неточности. Таким образом в наши дни ИИ не является универсальным решением, а всё ещё требует присутствия живого специалиста при работе. 

Также, учитывая массовость генетического тестирования, проводимого не для медицинской диагностики, очень важна проблема разработки клиентских приложений по типу личного кабинета. Здесь должны применяться те же правила, что и для любого приложения, предназначенного для широкой аудитории. Основными преимуществами таких систем должны быть простота, внешняя привлекательность, наглядность и достаточная информативность. На данный момент функционал этих приложений ограничивается отображением общей интерпретируемой информации. Так почему бы не предоставить клиенту  возможность поближе взглянуть на взаимосвязи и свойства его генов, внедрить масштабируемость или подробную карту генома пациента? Кроме того, база интерпретируемых данных будет регулярно пополняться в соответствии с современными исследованиями, так как методология будет постоянно совершенствоваться. Через 20 лет интерпретация результатов генетических исследований сможет дать гораздо больше информации о пациенте, чем сейчас, при этом сам генетический код не меняется. Для пациента такой подход “сдал анализ один раз-получаешь новые консультации всю жизнь” будет более привлекательным, поскольку не будет необходимости через какое-то время снова проходить дорогостоящий генетический тест или обращаться к другому поставщику услуг для повторной генетической проверки.

Следует отметить, что распространенность таких приложений, а значит и массовое их использование, приводит к общей стандартизации, а это означает развитие универсальности и упрощение генетического тестирования, передачи данных и повышение продуктивности исследований.

Для хранения огромного массива генетических данных, а также для быстрого поиска необходима разработка отдельного приложения для работы с архивом. Массовый характер генетического тестирования предполагает создание больших архивов с маркировкой файлов, относящихся к конкретному клиническому случаю. Помимо имени пациента и даты исследования, архив должен быть помечен тегами или иными настраиваемыми способами для более быстрого последующего поиска. Система хранения и поиска должна позволять быстро находить, экспортировать и отправлять файлы объемом в несколько сотен гигабайт, поскольку первичные данные расшифрованного генома человека могут занимать до 600 ГБ. 

В целом специфика этого приложения будет полностью соответствовать принципам больших данных.

Ген-признак

В некоторых случаях недостаточно иметь под рукой классическую базу данных или алгоритмы отслеживания взаимодействий генов, особенно это актуально для новых, неизученных мутаций. Моделирование структуры белка в зависимости от структуры генного кода — очень перспективное направление развития. Зная структуру белка, можно сделать вывод о возможных нарушениях его функций по отношению к норме. Если немного пофантазировать и представить себе дальнейшее развитие этого метода, то вполне возможно разработать систему, позволяющую прогнозировать фенотип (внешний вид) в зависимости от генотипа. Трудно переоценить значение такого рабочего инструмента в криминалистике, планировании семьи и искусственном оплодотворении. Конечно, в наши дни многие годы отделяют нас от существования такого программного обеспечения, но уже сейчас мы можем повлиять на скорость развития этой технологии. Однако для реализации этого метода необходимы огромные вычислительные мощности, которые далеко не всем могут быть доступны. Решением этого вопроса является предоставление собственником вычислительных мощностей в аренду. При выгодных условиях аренды и предоставлении удобного программного обеспечения, рост числа клиентов, опять же, приведет к стандартизации и простоте обмена и обработки данных.

Краудсорсинг — как выход

Уже сейчас существуют решения, позволяющие привлечь большое количество энтузиастов к рутинной обработке генетических данных. Почему бы не создать подобную систему с привлечением и последующим поощрением специалистов? Два основных вопроса, которые необходимо будет решить, — это анонимизация владельца генетических данных, а также очень строгая проверка специалистов при регистрации в системе. Конечно, результат диагностики нельзя воспринимать как окончательный диагноз, но любому клиенту будет интересно получить мнение разных специалистов из разных уголков мира, прошедших обучение в разных школах.

Глобальные экосистемы

И конечно же стоит упомянуть необходимость разработки глобальных многоцелевых программ, задачей которых является построение универсальной системы, в которой можно хранить данные пациентов, изучать мутации, делать прогнозы, быстро искать и отфильтровывать ненужную информацию. Представьте себе программное обеспечение, представляющее собой гибрид LIMS, личного блокнота врача, генетического браузера, и все это работает во взаимодействии с крупнейшими научными базами данных, собирающими информацию со всего мира и изучающими патогенность, распространенность и взаимосвязь мутаций. У нашей команды HMND есть опыт разработки такого универсального приложения для генетика, которое позволяет провести полный анализ всех мутаций пациента, не переключаясь между бесчисленными страницами браузера и не открывая огромное количество узкоспециализированных программ. Две основные задачи, которые необходимо решить при разработке подобного приложения: 1 — установить грамотную обратную связь с клиентом; 2 — такое приложение невозможно доделать до конца, всегда есть свежая идея, которую нужно внедрить в продукт, поэтому неизбежно изменение и доработка ПО после релиза.

Конечно, главной проблемой при создании такого ПО является законодательство, которое имеет существенные различия в разных странах. Программное обеспечение, признанное медицинским и одобренное для диагностики в одной стране, может быть пригодно только для научного или любительского использования во второй стране и быть запрещено в третьей.

Любая разработка имеет свой потенциал

С учетом специфики разработки современного ПО для генетических исследований, нужно отметить, что разработка программного обеспечения для генетических исследований является очень перспективным направлением. Сейчас эту нишу зачастую занимают некачественные, очень быстро устаревающие программы которые имеют очень узкую специализацию и не позволяют решать все задачи, стоящие перед врачом или исследователем с помощью одного ресурса. Даже если ваша команда разрабатывает что-то, что уже представлено на рынке, всегда можно сделать это уникально и гораздо интереснее чем у конкурентов.