【学习笔记】在线双序列比对工具

在线双序列比对工具

在线使用的双序列比对工具。

目前,使用率最高的是EMBL网站的双序列比对工具(http://www.ebi.ac.uk/Tools/psa)。打开页面,上面有全局比对工具、局部比对工具、还有基因组比对工具。

全局比对工具

【学习笔记】在线双序列比对工具
【学习笔记】在线双序列比对工具

【学习笔记】在线双序列比对工具

EMBL比对工具将gap分为两种,一种叫“gap开头(GAP OPEN)”,另一种叫“gap延长(GAP EXTEND)”。

gap开头就是连续的一串 gap里面打头的那一个,可以当它是队长。

gap延长就是剩下的那些gap,也就是队长后面跟着的小兵。

这一串里,第一个gap是gap 开头,后面的都是gap延长

单独的一个gap按gap开头算

gap开头和gap延长可以分别定义不同的罚分

默认情况下,gap开头罚分多,gap延长罚分少。所以这种情况下,gap都集中连成长串出现

全局比对的例子里我们就是用这种搭配组合方案做出的比对。

gap开头小,gap延长大的时候,做出来的比对里面,gap 很分散,极少有连续长串的 gap出现。

调整gap open和gap extend以达到期望的比对结果

局部比对工具

EMBL的局部双序列比对工具可以选择经典的Smith-Waterman 算法

只有中间黑色的相似的部分出现在比对结果中了,两头红色的不相似的部分被忽略掉了。也就是只返回了局部最相似,得分最高的片段的比对结果

除了一长一短两条序列适合做局部比对,有的时候两条差不多长的序列也可以做局部比对,以找出它们最相似的局部片段。为了让相似的部分突出出来,把gap都调大,gap开头调到10,gap 延长调到5,提交。

比对结果中,只有黑色的相似的部分出现在最终的比对结果中了,两头红色的不相似的部分全部被忽略了

所以,有时候两条序列并不同源,它们只是有一个功能相似的区域,这时用局部比对我们就能很快找到这一区域在两条序列中的位置。但是如果做全局比对的话,结果就不如局部比对明显了。