что значит refcall в vcf файле после google deepvariant
VCF (Variant Call Format) — это формат файла, используемый для хранения данных о генетических вариантах. Google DeepVariant — это инструмент для обнаружения генетических вариантов, который использует методы машинного обучения для анализа данных секвенирования.
В контексте VCF файла, созданного с помощью Google DeepVariant, термин "refcall" может относиться к строкам, где инструмент не обнаружил никаких вариантов по сравнению с референсным геномом. Это означает, что для данной позиции в геноме аллель совпадает с референсным аллелем, и нет никаких изменений (вариантов).
В VCF файле такие позиции могут быть помечены специальным образом, чтобы указать, что они были проанализированы, но не содержат вариантов. Это может быть полезно для полноты данных и для последующего анализа, так как позволяет исследователям видеть не только те позиции, где были обнаружены варианты, но и те, где их не было.
Пример строки в VCF файле, которая может быть интерпретирована как "refcall":
#CHROM POS ID REF ALT QUAL FILTER INFO
1 123456 . A . 50 PASS DP=100;REFCALL
В этом примере:
#CHROM
— хромосома.POS
— позиция на хромосоме.ID
— идентификатор варианта (может быть пустым).REF
— референсный аллель.ALT
— альтернативный аллель (в данном случае отсутствует, что указывает на отсутствие варианта).QUAL
— качество вызова.FILTER
— фильтр (в данном случае "PASS" указывает на то, что вызов прошел все фильтры).INFO
— дополнительная информация (в данном случае "REFCALL" указывает на то, что это референсный вызов).Таким образом, "refcall" в VCF файле после использования Google DeepVariant указывает на позиции, где не было обнаружено генетических вариантов, и аллель совпадает с референсным.