Я собрал новые транскрипты изоформ, используя Cufflinks, и хотел бы узнать, какие события сплайсинга соответствуют определенным изоформам, когда из гена транслируется несколько изоформ белка. Или содержит ли изоформа сохраненный интрон или изменения на 3 'ss - конце. Каждая изоформа может иметь более одной такой аннотации аннотации.
Я уверен, что должна быть программа, которая может сделать это, но не уверен, что использовать. В конце я хочу знать, какие типы альтернативного сплайсинга являются наиболее распространенными в этом геноме, а какие наиболее распространены в изоформах транскрипта, которые могут различаться между несколькими обработками.
Я думал, что PASA или SplicingTypesAnno или что-то еще может помочь, но до сих пор мне не ясно, что они могут использовать данные из GTF Cufflinks и затем аннотировать изоформы событиями сплайсинга.

спросил от (5.4k баллов)

1 Ответ

Основные инструменты, которыми можно воспользоваться для этой работы это Suppa или Sircach:
https://bitbucket.org/regulatorygenomicsupf/suppa/src/master/
http://www.bork.embl.de/Sircah/tutorial.html

ответил от (3.1k баллов)