2020.10.28【读书笔记】丨生物信息学与功能基因组学(第一章 引言)
分类:
文章
•
2023-11-02 21:18:16
- 学习目标
- 生物信息学定义
- 作者定义:使用计算机数据库和计算机算法来分析蛋白质、基因和组成生物体的所有DNA的完整集合(基因组)的学科。
- 美国国立卫生研究院(NIH)定义:研究、开发或应用计算工具和方法来拓宽对生物、医学、行为学或健康数据的使用,包括用于获取、储存、组织、分析和可视化这些数据的计算工具和方法
- 美国国家人类基因组研究所(NHGRI)定义:生物信息学是生物学的一个分支,关注对在核酸和蛋白序列数据中所发现的信息的采集、存储、显示和分析
- Russ Altman、Altman和Dugan的两种定义:

- 1.1 本书的组织架构
- 第一部分:第1~7章,解释如何获取生物序列数据,尤其是DNA和蛋白质序列
- 第二部分:第8~14章,描述了针对DNA、RNA和蛋白质的功能基因组学的分析手段,及如何决定基因功能。
- 第三部分:第15~21章,涵盖了对生命树的基因组分析
- 1.2 生物信息学:全景
- 三个视角总结生物信息学和基因组学
- 生物体:每个生物体在发育的时空上会产生变化,基因表达也会发生变化。
- 生命之树:三大分支,细菌、古细菌和真核生物。

- 本书概览

- 1.3 各章节组织架构
- 1.4 对学生和教师的建议:练习,寻找一个基因,研究一个基因组
- 本书两个课程
- 学生可以选择一个感兴趣的基因组,并对如下5个方面进行深入描述
- 描述该基因组的基本特征,如基因组大小、染色体数目和其他特征
- 描述在基因组分析中所用到的关键数据库或算法等生物信息学信息
- 1.5 生物信息学软件:两种风格
- 基于网络工具、基于命令行的工具
- 图示

- 命令行软件
- 作者建议
- 在Windows上使用Putty访问Linux服务器
- 整合两种风格
- 许多生信资源可用于弥合两种不同的风格
- 各章节使用的一些基于网络的软件与命令行软件一览表
- 通过参加业内“竞赛”组织者可以评估每个软件的性能,并通过定义灵敏度与特异性来了解选用何种工具。
- 学习生信编程的新范例
- 除了书籍和课程,我们也提供一些在线资源,如大型开放式网络课堂(慕课、MOOC等)
- 生物信息血的可重复研究
- 在研究时保证该研究可悲其他研究人员重复,有利于工作的累积和进展。
- 软件应做好记录,最好提供版本号,记录使用具体步骤,参数,可食用GitHub进行存储方便共享。
- 1.6 生物信息学和其他信息学学科
- 生物信息学与一些信息学学科有重合,齐关注点在于DNA及其他生物分子。
- 越来越多的工具使用者也成为了工具制造者
- 图示

- 1.7 对学生的建议
- 学生需要决定研究什么范畴的问题,并决定什么技术最适合解决这些问题。
- 使用Biostars——生物信息论坛,可以发布问题,获取答案,探索教程
- 推荐读物
- Dudley和Butte提供了一些近期的综述性文章
- Eric Green、Mark Guyer文章《从碱基对到临床,绘制一个基因组医学蓝图》
- 每年一月《Nucleic Acids Researc》出版一个描述核心生信资源的数据库专刊,该期刊网站上会提供众多文献链接