Лаборатория «Центр аналитических и генно‑инженерных исследований»

RiboGrove — это база данных последовательностей генов 16S рРНК бактерий и архей. Особенность БД RiboGrove заключается в том, что она содержит только полноразмерные последовательности генов 16S рРНК, т.к. источником последовательностей генов для её создания являются только полностью собранные прокариотические геномы, депонированные в базу данных RefSeq.

Програма preprocess16S служит для предобработки прочтений, полученных в ходе секвенирования ампликонов участков генов 16S рРНК.
Основная задача пргораммы — обнаружение и удаление (пар) прочтений, относящихся к не-16S образцам и попавших в обрабатываемый набор прочтений в результате ошибок в прочитывании индексов. Прочтения, подлежащие удалению, обнаруживаются путём поиска на их 5′-концах последоватульностей ПЦР-праймеров, которые использовались для амплификации секвенируемого участка гена. После обнаружения последовательности праймеров удаляются из прочтений. Кроме того, preprocess16S способен объединять парно-концевые прочтения по перекрытию с помощью программы NGmerge.
Barapost — набор инструментов для автоматической сортировки (разделения на несколько файлов) многомерных fasta, fastq и fast5 файлов согласно таксономической аннотации. Таксономическая аннотация реализована как поиск наилучшего совпадения в нуклеотидной базе данных с помощью алгоритмы BLAST. Аннотация может проводиться как удалённо (с помощью веб-сервиса NCBI BLAST). так и на локальной машине с помощью набора программ BLAST+.
Barapost описан подробнее в нашей статье.
combinator-FQ — вспомогательный инструмент для облегчения сборки геномов. Он обнаруживает соседние контиги путём сопоставления их концов. Кроме того, он рассчитывает LQ-коэффициент, а также ожидаемый размер собираемого генома. Подробности описаны в публикации в сборнике материалов конференции CTDA’2020.
kromsatel — программа для предобработки „длинных“ прочтений, полученых путём секвенирования ампликонов (например, по протоколу ARTIC). „Предобработка“ в данном случае означает разделение химерных прочтений на не-химерные фрагменты в соответствии со схемой праймеров, описанной в протоколе (либо в соответствии с пользовательской схемой праймеров).
con-hi — программа для аннотации участков генома, которые имеют аномально низкое либо высокое покрытие прочтениями. Это полезно при поиске ошибок при сборке генома.
CAGER-misc — набор разнообразных инструментов для обработки нуклеотидных данных (конвертирование форматов данных, автоматический подбор индексов для секвенирования и т.п.).
Последнее обновление:
02.04.2026 10:08:06