写在前面
Emmm,基因组组装质量的评估标准有很多,伴随着测序技术的飞速发展,尤其是 pacbio hifi 和 nanopore,现在越来越多基因组可以组装到 T2T 水平。评价一个基因组是否基本达到 T2T 标准,那么需要判断起端粒是否组装出来。换句话说,端粒组装出来多少,甚至说准确与否,可以从一定程度反应基因组组装的质量。
早前,我们做了一点T2T相关工作,并讨论了相关idea。因为是side-project,一直只是说说,等到小朋友毕业答辩后,建立了一个side-project,预期做一个小工具,叫「T2Tvalidator」。
其中包括端粒(这个简单,因为存在保守motif),另一个是着丝粒(这个会麻烦一点点),当然还计划了更多内容,不过,似乎这个工作可以进一步放下,因为昨天,我们看到 Hort Res 期刊推出了一个非常漂亮的工作,
几位老师推出了一个非常实用的工具,提供了网页服务器和本地软件包。这个工作非常好,可以解决不少组装结果评估问题,非常实用!我们做相关工作的时候,也进行了一些探索,逻辑上是类似的,主要是基于着丝粒的序列特征。讨论了下,既然side-project没必要继续开展,那么干脆让小师弟做的小部分结果打包成 TBtools 插件,也方便各位朋友使用(如果大伙想在本地非常快速地进行 T2T 端粒鉴定和评估的话),也作为一个补充。
打包插件
事实上,小师弟确实“没花时间”,因为就只写了一个 python 脚本。让他把打包过程也记录下,结果有了这张图
Emmm... 也行吧,不得不说,TBtools 打插件实在太方便了。估计不到 10min 就搞定了。
随后,Export 得到插件「Centro Locate.plugin」。
顺手我就把插件上传到 TBtools 的 Plugin Store。欢迎大伙下载使用。
使用插件
从插件商店安装插件(跳转链接中下载 .plugin 文件,随后 install plugin)即可,随后打开插件
可以看到使用非常简单,比如使用拟南芥的 T2T 基因组。
运行结束会输出比较多的文件,在其中找到输出的图片文件,即可看到
具体还有其他较多文本信息,不做赘述,有朋友感兴趣的话,或许后续我们会详细做个介绍
其他示例
事实上,类似的策略我们在不少物种基因组中有做尝试,包括各种已报道的 T2T 基因组。逻辑上只要着丝粒区域有组装出来,多数还是可以自动鉴定出来。
最后
欢迎大伙玩玩。小插件,作为已有策略或方法资源的一个补充,也算是Archive一个项目。