适用于基因组规模的多序列比对工具kalign是怎样的

适用于基因组规模的多序列比对工具kalign是怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

之前提到的clustalo, muscle, mafft 适用于几千到几万条序列的多序列比对,在比较基因组学的分析中,需要对不同基因组的序列进行多序列比对。对于基因组规模的多序列比对而言,之前的工具运行速度上就不够理想了。

kalign 是一款针对大规模序列的多序列比对工具,无论是运行速度,还是比对的准确度,都令人满意。

在对应的文献中,利用测试数据集,评估了不同软件的运行速度和多序列比对的准确度,结果如下

适用于基因组规模的多序列比对工具kalign是怎样的

从速度上看,Kalign遥遥领先,从准确到上看,kalign和muscle, mafft 的准确度非常接近。

kalign支持核酸和蛋白质的多序列比对,软件的安装过程如下

wget http://msa.sbc.su.se/downloads/kalign/current.tar.gz
tar xzvf current.tar.gz
./configure
make

编译好的可执行文件的名字为kalign, 基本用法如下

kalign input.fa > out.fa

默认输出fasta格式的多序列比对结果,也支持clustalw, msf 等格式。

适用于基因组规模的多序列比对工具kalign是怎样的

看完上述内容,你们掌握适用于基因组规模的多序列比对工具kalign是怎样的的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!