Homology is the central concept for all of biology.——David Wake. Science, 1994

前言

正如前面引用的这句话,同源性是生物学中的核心问题。研究序列的同源性问题,就要用到序列比对的工具,上一篇笔记简单介绍了序列比对的原理,在这一篇中我将总结几种常用的比对工具,顺便记录一下BLAST的基本思想,由于时间关系,所以找的都是在线的工具,在未来,可能会专门写某些软件的本地化(当然我希望测试环境是在Linux上,这都是后话),比如BLAST等。

多序列比对(Multiple Sequence Alignment,MSA)

Clustal Omega
Clustal不是一个程序,而是一系列程序,这些程序用于多序列比对

  • Clustal,最初的基于系统树的比对程序
  • ClustalV,Clustal的第五个版本
  • ClustalW,命令行版本
  • ClustalX,可视化窗口版本
  • Clustal Omega,现在的官方版本

软件用C++编写,都是开源的,可在官网获取最新版本和源码。这里Clustal Omega为当前官方最新版本,提供web server版本和command line版本(GUI版本即将推出)。
程序支持蛋白质序列、DNA序列、RNA序列比对,输入的格式支持:NBRF/PIR, FASTA, EMBL/Swiss-Prot, Clustal, GCC/MSF, GCG9 RSF, and GDE。输出的格式支持:Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, or NEXUS。
EBI建议使用Clustal Omega进行蛋白质序列的比对,点击访问。

Muscle(MUltiple Sequence Comparison by Log- Expectation)
Muscle也是一个用于多序列比对的程序,可用于蛋白质、核酸序列的比对。它是一个开源程序可通过官网获取最新版本和源码。Muscle的web server版本由EBI提供,EBI推荐使用Muscle进行DNA序列比对,点击访问。

更多多序列比对软件

0321199868da44d4da1621b0ba78bf3a.png

双序列比对(Pairwise Sequence Alignment,PSA)

恰巧啊,这些某个页面已经写了(偷懒)

99aa410b400b3c632afc289a9a72bc1c.png

数据库搜索

BLAST(Basic Local Alignment Seach Tool)
我觉得我再去写他的算法意义不是很大,一下是参考材料链接,后面有机会会专门写BLAST的网页和本地化的使用。

  • 北京大学生信慕课
  • 原始文献

这Tm写的啥子嘛,啥子卵用没用的失败的文章。沉淀些时间。

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐