2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)

  • 学习目标
    • 定义生物信息学
    • 解释生物信息学的范畴
    • 解释为何球蛋白可以作为一个有用的例子阐释这一学科
    • 描述何为基于网页和基于命令行的生物信息学手段
  • 生物信息学定义
    • 作者定义:使用计算机数据库和计算机算法来分析蛋白质、基因和组成生物体的所有DNA的完整集合(基因组)的学科。
    • 美国国立卫生研究院(NIH)定义:研究、开发或应用计算工具和方法来拓宽对生物、医学、行为学或健康数据的使用,包括用于获取、储存、组织、分析和可视化这些数据的计算工具和方法
    • 美国国家人类基因组研究所(NHGRI)定义:生物信息学是生物学的一个分支,关注对在核酸和蛋白序列数据中所发现的信息的采集、存储、显示和分析
    • Russ Altman、Altman和Dugan的两种定义:
    • 2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
  • 1.1 本书的组织架构
    • 第一部分:第1~7章,解释如何获取生物序列数据,尤其是DNA和蛋白质序列
    • 第二部分:第8~14章,描述了针对DNA、RNA和蛋白质的功能基因组学的分析手段,及如何决定基因功能。
    • 第三部分:第15~21章,涵盖了对生命树的基因组分析
  • 1.2 生物信息学:全景
    • 三个视角总结生物信息学和基因组学
      • 细胞:遵从中心法则
      • 生物体:每个生物体在发育的时空上会产生变化,基因表达也会发生变化。
      • 生命之树:三大分支,细菌、古细菌和真核生物。
      • 2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
    • 贯穿本书的例子:球蛋白(Globins)
      • 球蛋白家族是生物学中被研究得最好的基因家族之一
        • 血红蛋白肌红蛋白是最早被研究的蛋白质之一
        • 测序技术很早就在测球蛋白区域
    • 本书概览
    • 2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
  • 1.3 各章节组织架构
    • 理论知识与实用指导
    • 展望
    • 常见问题
      • 使用工具时可能会遇到的一些常见困难
      • 人为错误
    • 给学生的建议
    • 练习题
    • 参考列表
  • 1.4 对学生和教师的建议:练习,寻找一个基因,研究一个基因组
    • 本书两个课程
      • 生物信息学简介(第一部分、第二部分)
      • 功能基因组学简介(第三部分)
      • 学生可以选择一个感兴趣的基因组,并对如下5个方面进行深入描述
        • 描述该基因组的基本特征,如基因组大小、染色体数目和其他特征
        • 进行比较基因组学分析以研究该物种与相邻物种的关系
        • 描述通过基因组分析所学到的生物学原理
        • 描述与人类疾病的关联
        • 描述在基因组分析中所用到的关键数据库或算法等生物信息学信息
  • 1.5 生物信息学软件:两种风格
    • 基于网络工具、基于命令行的工具
      • 图示
      • 2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
    • 基于网络的软件
      • 公共数据库
        • 美国国家生物技术信息中心(NCBI)
        • 欧洲生物信息学研究所(EBI)
        • Ensembl
        • 加州大学圣克鲁兹分校(UCSC)
    • 命令行软件
      • 特点
        • 通常为Linux操作系统
        • 编程语言(Perl、Python、R)被广泛使用
        • Unix系统提供Bash语句
      • 作者建议
        • 在Windows上使用Putty访问Linux服务器
    • 整合两种风格
      • 许多生信资源可用于弥合两种不同的风格
        • 各章节使用的一些基于网络的软件与命令行软件一览表2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
      • 通过参加业内“竞赛”组织者可以评估每个软件的性能,并通过定义灵敏度与特异性来了解选用何种工具。2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
    • 学习生信编程的新范例
      • 除了书籍和课程,我们也提供一些在线资源,如大型开放式网络课堂(慕课、MOOC等)
      • Searls推荐的在线学习的十条规则
        • 制定一个计划
        • 有选择性
        • 管理你的学习环境
        • 做阅读
        • 做练习
        • 做评估
        • 优势探索(是否便捷)
        • 主动接触他人(与他人沟通)
        • 记录个人成绩
        • 对学到的内容有较为实际的期待
    • 生物信息血的可重复研究
      • 在研究时保证该研究可悲其他研究人员重复,有利于工作的累积和进展。
        • 工作流应该有据可查
        • 存储在计算机上的信息应该妥善整理
        • 数据应该可被他人使用
        • 元数据(数据集相关的信息)与数据一样同等重要
        • 所使用的的数据库应做好记录
        • 软件应做好记录,最好提供版本号,记录使用具体步骤,参数,可食用GitHub进行存储方便共享。
  • 1.6 生物信息学和其他信息学学科
    • 生物信息学与一些信息学学科有重合,齐关注点在于DNA及其他生物分子。
    • 越来越多的工具使用者也成为了工具制造者
      • 图示
      • 2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
  • 1.7 对学生的建议
    • 学生需要决定研究什么范畴的问题,并决定什么技术最适合解决这些问题。
    • 使用Biostars——生物信息论坛,可以发布问题,获取答案,探索教程
    • 推荐读物
      • Dudley和Butte提供了一些近期的综述性文章
      • Eric Green、Mark Guyer文章《从碱基对到临床,绘制一个基因组医学蓝图》
      • 每年一月《Nucleic Acids Researc》出版一个描述核心生信资源的数据库专刊,该期刊网站上会提供众多文献链接