2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)

  • Dayhoff模型
    • 第一步:可接受点突变(PAM)
      • 概念:在蛋白质被自然选择接受的单个氨基酸替换
      • 满足情况:
        • 基因发生DNA变异,使得基因编码另一种不同氨基酸
        • 整个种群都接受这种变化,改变后的蛋白质作为种群内蛋白质的优势形式
      • 可被接受的点突变:基于经验统计的保守性替换
        • 使用系统发育分析,将它们与推断的共同祖先进行比对。
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
      • 基于经验观察的氨基酸替换结果,描述了任意一对氨基酸对比对在一起的频率。
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
    • 第二步:氨基酸出现的频率
      • 为了计算一个蛋白质中比对好的氨基酸变成另一个氨基酸的概率,我们需要知道每一个氨基酸出现的频率。
      • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
    • 第三步:氨基酸的相对突变率
      • 计算各氨基酸的相对突变率可以简要描述在一段较短进化时间内每种氨基酸发生突变的频率。
      • 氨基酸相对突变率
      • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
      • 不容易发生突变的氨基酸残基可能在蛋白质结构或功能上承担着重要的角色,如果被其他残基替换将会对机体产生危害;容易突变的氨基酸(天冬酰胺、丝氨酸、天冬氨酸和谷氨酸)在蛋白质中的功能很容易被其他残基补偿。
      • 根据遗传密码也可以解释相对突变率。
    • 第四步:进化距离为1PAM的突变概率矩阵
      • 构建突变概率矩阵
        • PAM1
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
        • 每一列值和为100%,最高分位于从左上到右下的对角线上。
        • 第一格98.7%表示在一个PAM1对应的进化时间区间内,Ala仍然是Ala的概率为98.7%
    • 第五步:PAM250和其他PAM矩阵
      • 由于经常对序列一致性小于99%的蛋白质的关系感兴趣,因此,PAM1并不适用于大部分情况,我们还需要构建适用于任意氨基酸一致性的概率矩阵。
      • 为了反映发生在远缘相关的蛋白质中的氨基酸替换,Dayhoff构建了PAM100,PAM250等矩阵
        • 不同物种GAPDH蛋白的部分序列比对
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
        • k酪蛋白的多重序列比对
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
      • 理解不同PAM矩阵的意义
        • 以PAM为0时为例
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
        • PAM250是PAM1自乘250次后的奥德,是BLAST数据库搜索常用矩阵。
          • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
    • 第六步:从突变概率矩阵到相关优势值矩阵
      • 目的:为了解决对于任意一个突变概率矩阵中的元素M,氨基酸j在一个同源序列中变成氨基酸i的概率是多少。
    • 第七步:对数优势值(log-odds)打分矩阵
      • 对数优势值打分矩阵
        • 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)
    • 总结
      • 在PAM10矩阵中,相同氨基酸残基的替换值比在PAM250矩阵中的值更高;同时,PAM10的错配罚分也更高。