当前位置: 首页>后端>正文

插件基于序列的 T2T 基因组的着丝粒区域自动判断

写在前面

Emmm,基因组组装质量的评估标准有很多,伴随着测序技术的飞速发展,尤其是 pacbio hifi 和 nanopore,现在越来越多基因组可以组装到 T2T 水平。评价一个基因组是否基本达到 T2T 标准,那么需要判断起端粒是否组装出来。换句话说,端粒组装出来多少,甚至说准确与否,可以从一定程度反应基因组组装的质量。
早前,我们做了一点T2T相关工作,并讨论了相关idea。因为是side-project,一直只是说说,等到小朋友毕业答辩后,建立了一个side-project,预期做一个小工具,叫「T2Tvalidator」。


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第1张

其中包括端粒(这个简单,因为存在保守motif),另一个是着丝粒(这个会麻烦一点点),当然还计划了更多内容,不过,似乎这个工作可以进一步放下,因为昨天,我们看到 Hort Res 期刊推出了一个非常漂亮的工作,


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第2张

几位老师推出了一个非常实用的工具,提供了网页服务器和本地软件包。这个工作非常好,可以解决不少组装结果评估问题,非常实用!我们做相关工作的时候,也进行了一些探索,逻辑上是类似的,主要是基于着丝粒的序列特征。讨论了下,既然side-project没必要继续开展,那么干脆让小师弟做的小部分结果打包成 TBtools 插件,也方便各位朋友使用(如果大伙想在本地非常快速地进行 T2T 端粒鉴定和评估的话),也作为一个补充。

打包插件

事实上,小师弟确实“没花时间”,因为就只写了一个 python 脚本。让他把打包过程也记录下,结果有了这张图


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第3张

Emmm... 也行吧,不得不说,TBtools 打插件实在太方便了。估计不到 10min 就搞定了。
随后,Export 得到插件「Centro Locate.plugin」。


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第4张

顺手我就把插件上传到 TBtools 的 Plugin Store。欢迎大伙下载使用。


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第5张

使用插件

从插件商店安装插件(跳转链接中下载 .plugin 文件,随后 install plugin)即可,随后打开插件


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第6张

可以看到使用非常简单,比如使用拟南芥的 T2T 基因组。


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第7张

运行结束会输出比较多的文件,在其中找到输出的图片文件,即可看到
插件基于序列的 T2T 基因组的着丝粒区域自动判断,第8张

具体还有其他较多文本信息,不做赘述,有朋友感兴趣的话,或许后续我们会详细做个介绍

其他示例

事实上,类似的策略我们在不少物种基因组中有做尝试,包括各种已报道的 T2T 基因组。逻辑上只要着丝粒区域有组装出来,多数还是可以自动鉴定出来。


插件基于序列的 T2T 基因组的着丝粒区域自动判断,第9张

插件基于序列的 T2T 基因组的着丝粒区域自动判断,第10张

插件基于序列的 T2T 基因组的着丝粒区域自动判断,第11张

最后

欢迎大伙玩玩。小插件,作为已有策略或方法资源的一个补充,也算是Archive一个项目。


https://www.xamrdz.com/backend/3gx1900296.html

相关文章: