В работе с одним инструментом столкнулся с тем, что не всегда удается конвертировать ENSEMBL gene ID в Entrez ID. С чем это связано?

спросил от (5.4k баллов)

2 Ответы

Ensembl и RefSeq - это принципиально разные ресурсы. Ensembl представляет собой аннотацию референсного генома, тогда как RefSeq представляет собой набор последовательностей с аннотациями. Они отличаются, в частности, тем, как они определяют ген. В Ensembl ген представляет собой аннотированный локус на референсной сборке. В Refseq это, кажется, дополнительный атрибут, назначенный для последовательностей. Как RefSeq назначает гены последовательностям, мне никогда не было ясно. В общем, я бы не рекомендовал смешивать ссылки, то есть либо работать с Ensembl, либо работать с RefSeq.

ответил от (3.1k баллов)

Эти два ресурса аннотируют один и тот же референсный геном организма.
Они пересекаются, но не полностью.
Если вы работаете с отдельными генами, я бы рекомендовал RefSeq, как более "выверенный" и удобный ресурс.

ответил от