【学习笔记】在线双序列比对工具
在线双序列比对工具
在线使用的双序列比对工具。
目前,使用率最高的是EMBL网站的双序列比对工具(http://www.ebi.ac.uk/Tools/psa)。打开页面,上面有全局比对工具、局部比对工具、还有基因组比对工具。
全局比对工具
EMBL比对工具将gap分为两种,一种叫“gap开头(GAP OPEN)”,另一种叫“gap延长(GAP EXTEND)”。
gap开头就是连续的一串 gap里面打头的那一个,可以当它是队长。
gap延长就是剩下的那些gap,也就是队长后面跟着的小兵。
这一串里,第一个gap是gap 开头,后面的都是gap延长。
单独的一个gap按gap开头算。
gap开头和gap延长可以分别定义不同的罚分。
默认情况下,gap开头罚分多,gap延长罚分少。所以这种情况下,gap都集中连成长串出现。
全局比对的例子里我们就是用这种搭配组合方案做出的比对。
当gap开头小,gap延长大的时候,做出来的比对里面,gap 很分散,极少有连续长串的 gap出现。
调整gap open和gap extend以达到期望的比对结果
局部比对工具
EMBL的局部双序列比对工具可以选择经典的Smith-Waterman 算法
只有中间黑色的相似的部分出现在比对结果中了,两头红色的不相似的部分被忽略掉了。也就是只返回了局部最相似,得分最高的片段的比对结果。
除了一长一短两条序列适合做局部比对,有的时候两条差不多长的序列也可以做局部比对,以找出它们最相似的局部片段。为了让相似的部分突出出来,把gap都调大,gap开头调到10,gap 延长调到5,提交。
比对结果中,只有黑色的相似的部分出现在最终的比对结果中了,两头红色的不相似的部分全部被忽略了
所以,有时候两条序列并不同源,它们只是有一个功能相似的区域,这时用局部比对我们就能很快找到这一区域在两条序列中的位置。但是如果做全局比对的话,结果就不如局部比对明显了。